Google將開放自家的語音辨識Cloud Speech API供第三方開發者使用,開發語音辨識相關應用軟體,開放初期將免費供開發者使用,未來則將收費。
Google是在NEXT雲端用戶大會上宣布此一消息。Google的Cloud Speech API支援便是超過80種語言,已經被應用Google的語音搜尋、翻譯、聽寫輸入等功能,未來一旦開放,便可與各種應用軟體結合,增加文字辨識、聽與翻譯等功能。
目前Cloud Speech API為限定預覽(Limited Preview)階段,感興趣的開發者可以登記Google Cloud Platform帳號,獲核准者可免費使用該API,而正式上市與收費的日期與收費方式則尚未公布。
Google開放語音辨識API勢必將衝擊現有業者,尤其是專攻語音辨識的Nuance,且在市場期待Google要價更低的狀況下,可能讓大批Nuance的新創用戶出走,而Google語音辨識技術的減噪設計,讓其能在吵雜的環境中仍能辨識出使用者的語音指令,被認為勝過許多其他相似產品。
此外,蘋果(Apple)的語音助理Siri也被認為可能將受衝擊。Siri目前仍未開放API供開發者使用。
Google Speech API將包括自動語音辨識、80國語言與字彙支援、串流辨識、過濾不當內容、即時或緩衝語音支援、噪音環境處理,且可整合其它Google API服務,例如將聲音檔案轉存至Google雲端儲存。