能讓電腦更聰明的人工智慧程式碼,過去像是可口可樂的神秘配方一樣,是科學家們秘而不宣的神奇公式。今年卻有多家IT巨頭,紛紛開源釋出了自家人工智慧領域上的先進技術。
年初打頭陣的是Facebook,開源釋出了自家人工智慧實驗室所研發的深度學習模組Torch,11月9日,Google開源釋出了機器學習引擎TensorFlow。隔了一天,微軟亞洲研究院也宣布y在Github上開源釋出了分散式機器學習工具包DMTK。不到幾個禮拜,以華生電腦在人工智慧領域著稱的IBM成了今年第四家加入機器學習技術開源潮的IT巨頭,跟著開源釋出了機器學習技術SystemML。
為何IT大廠紛紛釋出自家人工智慧團隊過去秘而不宣的機器學習技術?機器學習和人工智慧技術有何差別?即將在明天登場的Big Data研討會中分享人工智慧大應用經驗的Appier沛星互動科技創辦人兼執行長游直翰,分享了他的觀察。
在史丹佛大學人工智慧實驗室取得資工博士學位的AI專家游直翰專注人工智慧、機器學習和機器人研究。他也是打造出Google第一代自動駕駛車的成員之一,2012年在臺創立了Appier公司,以人工智慧應用幫助企業解決各種跨螢難題,被杉資本譽為亞洲少數具有世界級大資料分析術的研發團隊,已獲得來自紅杉資本等國際知名創投約10億元資金挹注,據點遍及全亞洲11個城市。
資料探勘(Data Mining)、機器學習(Machine Learning)和人工智慧(AI),您認為最大的差異是什麼?能否用例子來說明上述三者的差異?
A:人工智慧是一種系統透過資料處理和(或)演算法運算傳達情報資訊的方法,從而產出有意義的資訊,並讓機器擁有比人更聰明的智慧。簡單來說,人工智慧就是教電腦做「正確、聰明的決策」,也就是我們所謂的「智慧」。
而機器學習是人工智慧的其中一個分支,讓機器可以自動學習、從巨量資料中找到規則,進而有能力做出預測。人工智慧讓過去只能透過人類或動物智慧解決的問題也能透過電腦系統迎刃而解;機器人是自動執行工作的機器裝置,而人工智慧則可以讓機器人快速、精準處理大量資料。簡單來說,機器人像是人的「身軀」,人工智慧則是人的「腦」。
資料探勘是利用分析技術來發掘資料間未知的關聯性與規則,而人工智慧是其中的一個分析技術。傳統會用統計的方式來做資料探勘,現在也有些人會用機器學習的方法來處理大量資料。由於人工智慧可處理巨量多維度資訊,並能發掘多元變動因素之間的關聯性,再藉由優化實現清晰與可辨識的目標,因此非常適用於資料探勘。
目前人工智慧最有價值的應用領域為何?
A:人工智慧發展至今,已逐漸改變我們的生活型態,我們也因人工智慧而享用許多個人化的服務、生活變得也更為便利。
近幾年人工智慧的應用領域愈來愈廣泛,我認為只要是能為人類帶來更好、更便利生活的應用就是有價值的應用。舉例來說,現在許多廠商將人工智慧與自動化控制技術結合,讓機器變得更聰明;另外有便利商店透過人工智慧設計節電系統,也有廠商透過人工智慧來幫助用戶辨識財務詐騙;此外,愈來愈多人嘗試將人工智慧生物辨識做結合,甚至建立起人工智慧物聯網等都是人工智慧為人們創造更好生活的應用樣子,因為現在要處理的資料量實在太多,多得遠遠超過人腦可以應負和處理的程度。
在商業應用方面,人工智慧還可以用於解決許多商業問題,幫助企業做出正確的商業決策,比方說應用在電子商務與數位行銷領域等。隨著使用者擁有的裝置數量不斷增加,他們在不同裝置上的使用行為也愈來愈複雜,品牌與廣告主將面臨找不到目標受眾的窘境,而我們相信人工智慧將會是解決這個問題最理想的方法,並讓企業更容易透過人工智慧的跨螢方案解決行銷策略方面的問題。
舉例來說,透過人工智慧演算法和眾多參數分析每個使用者在電腦、平板與手機上的使用行為,當我們在兩個不同的裝置上看到類似的使用模式時,即可判別這些裝置極可能屬於同一個使用者。此外,我們的人工智慧技術可以幫助廣告主找出對廣告有興趣的目標受眾,並決定可以觸及目標受眾的最佳廣告投放的時間和版位,以及判斷有效獲得目標受眾的合理預算和最佳的廣告格式。至今我們已為全球超過500個知名品牌與代理商提供跨螢行銷服務,並讓更多領域的企業透過人工智慧應用擬定最佳的商業策略。
讓電腦更智慧的關鍵,似乎不再是過去神秘的演算法,而是如何擁有更多的資料,您覺得呢?
A:應該說這兩樣缺一不可。單看資料量有多龐大其實並沒有太大的意義,重要的是能夠從好的資料中探究分析出多少的insight,才是真正的價值所在。而這也正是我們在做的事:我們擁有一個強大的AI團隊,每天不斷在了解客戶需求,並思考著如何精進人工智慧運算能力,提升「預測」的精準度及效率,為客戶達到行銷目標。
就您觀察,為何Google會大方將機器學習引擎TensorFlow開源?這將對資訊產業帶來什麼樣的影響?
A:我們樂見Google將TensorFlow免費開源,這對開發人員與Google而言都是大好消息;每多一個開放平台對所有開發人員來說,就是多了一項免費的開發工具;對於廠商而言,愈來愈多開發人員的加入也能協助改善現有的技術。以AI領域為例,這樣的開源做法將有助於機器學習應用的快速發展。不過我們仍要持續觀察未來的發展,期望這樣的做法能夠真正造福整體AI產業和廣大的使用者。
更多大資料先進技術專家在臺灣,Big Data Conference 2015網址http://bigdataconf.ithome.com.tw/