臉書(Facebook)周三發表人工智慧文字理解引擎DeepText,可在一秒內掃瞄並精準分析20多種語言的數千則貼文,可望用於Facebook Messenger及其他服務上。
對於15億用戶每分鐘新增40萬筆貼文及12.5萬回應的Facebook而言,理解文字表達方式有助於改善使用經驗,呈現人們有興趣的內容或過濾垃圾廣告等不好的貼文,DeepText就是為滿足這個需求而生。
DeepText源自於Facebook AI Research小組,運用多種深度神經網路架構,包括卷積式與回饋式類神經網路,可進行文字與字元層級的學習,再以深度學習平台FbLearner Flow及深度學習演算架構Torch進行模型訓練。
Facebook指出,和傳統自然語言處理技術相比,深度學習導向的技術使DeepText對語言方面的知識仰賴較少,更能理解不同語言的文字意涵,且有效處理標籤化的資料,滿足Facebook在文字理解處理上的需求。
目前Facebook 已經開始測試DeepText偵測使用者意圖及實體提取(entity extraction)的能力。例如在Facebook Messenger上,用戶輸入「我想坐車(I need a ride)」,Messenger 聊天機器人能辨識意圖、提供解決方案,像是建議「需要我叫車嗎」或是整合Uber服務,表示「我幫你叫Uber」。它也可以用於一般Facbook貼文,例如使用者貼文寫道「我舊腳踏車想賣200美元,有人有興趣嗎?」DeepText就能偵測意圖、以及理解銷售物件及價格等資訊,建議用戶透過Facebook使用適當的銷售工具。
目前Facebook 人工智慧部門利用DeepText訓練興趣主題的分類工具,名為PageSpace,有於提升Facebook的文字理解能力。另外也正和視覺內容理解部門合作開發新的深度分析架構,以便能同時理解文字和圖像,像是一則註有「第25天」的新生兒照片貼文,系統必須理解用戶是在分享家庭近況。
Facebook高層對媒體表示,DeepText未來將可提供個人化的使用經驗,例如針對中文用戶優先顯示中文的內容,並減少垃圾貼文。甚至DeepText偵測到仇恨言論時,必要時也能進行過濾或管制。事實上,Facebook透過人工智慧過濾不雅或血腥圖片的比例已經高過人工篩選。