抓取形狀不規則的物品對人類來說或許很簡單,但對機器人而言可就是件困難的事了,日前,Google研究團隊在官方部落格發表機器人實驗結果,Google利用機器學習技術教導一群機器人抓取常見的辦公室和家庭用品,並加入回饋的學習機制來訓練機器人,讓機器人抓取物品的失敗率從34%下降至18%。
Google研究團隊表示,近年來,機器人在功能上有很大的進步,但是與人類動作的精準度仍有很大的鴻溝,Google透過持續回饋和控制的學習機制,可以彌補機器人和人類之間的差距,讓機器人可以處理更複雜的事物。
Google設計14臺獨立的機器人,並在機器手臂的上方安裝攝影機,來記錄機器人抓取物品的過程,Google利用手眼協調能力的持續回饋學習機制,讓機器人藉由觀察機器手臂的動作,不斷預測何種動作能夠提升抓取物品的成功率。
剛開始機器人隨機抓取物品的成功率極低,但透過每一次的經驗來訓練內建的深度卷積神經網路(Deep Convolutional Neural Network,CNN),並學會預測抓取的結果,藉由CNN的內在循環伺服機制來持續調整機器人的動作,並最大化抓取的成功率。
Google表示,在觀察機器人練習抓取物品80萬次後(約3千個小時),才看到智能反應行為的開端,機器人會觀察自己的抓取狀態,並即時修正動作,且這些行為是透過學習自然出現,而不是透過程式系統得到的結果。
經過Google研究團隊的實驗,結果顯示,沒有接受回饋學習機制訓練的機器人抓取物品的平均失敗率是34%,而有經過訓練的機器人抓取物品失敗率約是前一組機器人的一半(18%)。
進行手眼協調學習的機器人影片: