重點新聞(0615~0621)
Nvidia 慢動作影片
Nvidia用AI將常速影片轉換為高畫質慢動作影片
Nvidia研究員日前在美國鹽湖城舉行的電腦視覺和模式識別(CVPR)年會上,介紹他們開發的一套深度學習系統,可將原本每秒30幀的常速影片,轉換為高畫質的慢動作影片(約每秒240幀)。研究員表示,他們使用Nvidia Tesla V100 GPU和以cuDNN加速的PyTorch深度學習框架來訓練系統,而訓練資料則包括11,000多個日常和體育相關的慢動作影片(每秒240幀)。一旦訓練完畢,卷積神經網絡就可以預測常速影片放慢時,額外的幀會是什麼樣子。結果顯示,以這項技術產生的慢動作影片,比一般技術生成的要流暢、清晰。(詳全文)
DeepMind GQN
Google新3D建模演算法,可從2D平面圖自動生成3D模型
Google位於倫敦的AI研究院DeepMind,最近開發一套深度學習演算法,可從2D平面圖構建3D模型,《科學雜誌》也刊登該研究論文。Google的這項AI技術叫做生成查詢網路(GQN),適用於機器人視覺和VR模擬等領域。研究指出,就算只有少量2D平面圖,GQN依然能從任何角度和成與渲染物件或場景,比如渲染物件看不到的面,然後從不同角度生成一個3D視圖,而且在這過程中,還不需要人工監督、標記圖像。《科學雜誌》也評論,GQN網路以用不同角度拍攝的圖像,來產生對場景的抽象描述,然後學習當中的基本要素。接著根據表現形式,GQN會預測從新的角度來看,該場景會是什麼樣子。(詳全文)
MIT 智慧電源插座
MIT開發智慧電源插座,可偵測插座用電異常示警
MIT機械工程系的研究團隊,日前開發智慧電源插座,透過分析單個或多個插座的電流使用狀況,來分辨有害或無害的電弧(也就是瞬間火花),更準確偵測是否用電異常,來避免意外發生。這項設計,分為硬體和軟體,硬體負責即時處理電流數據,軟體則是用來分析數據的神經網路,由機器學習演算法構成。這套演算法,會將捕捉到的信號,與系統訓練時所用的信號相比,來判定是否有害。研究人員表示,神經網路接觸到的數據越多,就越能夠準確學習數據好壞的特徵,甚至能區分插座上的電器為何。(詳全文)
PSA 保釋金決策
猶他州用AI工具來幫法官決定適當的保釋金
美國猶他州政府日前啟用一個新AI工具:Public Safety Assessment(PSA),目的是希望在法官決定被告的保釋金額前,來提供法官更多關於被告訊息,包括被告逃跑或對社區造成危險的可能性。法官只要輸入被告的犯罪紀錄、年齡和之前未到法庭的數據,PSA的演算法就會計算被告未來再犯或法庭缺席的可能性。而法官可以根據這些訊息,來決定被告的保釋金額要多少。這套工具由德州一家非營利基金會開發,目前已有數州採用。(詳全文)
Google 死亡預測
Google醫療AI新應用,能預測病人入院後會不會死
Google近日開發一套可預測病人入院24小時的死亡率AI系統。Google宣稱,這套系統所用的深度學習模型準確度高達95%,比傳統預測模型好上10%左右。Google這款AI系統,使用了患者的種族、年齡、性別、病歷、健檢化驗結果和生命跡象等數據來訓練,不過它的特別之處在於,這套模型也採用了過去人們認為不可用的數據,比如醫師所寫的筆記,或是病例圖表上的手寫筆跡。而這套AI除了能預測死亡,還可以預測病人在未來30天內是否會再住院,以及住院時間的長短。不過,這款AI還處於初級階段,但Google認為,它有一天能夠用來預測一個正常人何時會死。(詳全文)
Deepbird TensorFlow
推特內部機器學習平臺Deepbird底層框架改用TensorFlow
有鑑於原本使用的機器學習框架Lua Torch社群支援度降低,推特機器學習團隊Cortex決定,把內部深度學習平臺Deepbird,其底層機器學習框架從Lua Torch轉移到TensorFlow上。而框架的改變帶來許多正向影響,Cortex表示,透過使用Tensorboard或是像Model Repo這樣的內部視覺化工具,工程師可以簡單的觀察模型收斂情況,以調整出更好的結果。此外,改用TensorFlow,也可加快在64位元的x86系統架構上執行深度學習訓練的速度。(詳全文)
HPE 超級電腦Astra
美國能源部又出招,聯手HPE推全球最大Arm架構超級電腦Astra
前陣子美國能源部才與IBM聯手打造超級電腦Summit,近日又再出招,能源部旗下的桑迪亞國家實驗室與HPE聯手,使用64位元ARMv8處理器 Cavium ThunderX2,並且搭配使用HPE高效能運算平臺HPE Apollo 70,推出了超級電腦Astra。HPE表示:「這是目前世界上最大的Arm架構超級電腦」,其運算力達到2.322PFLOPS,根據TOP500超級電腦的2017年11月釋出的排名,按照目前Astra的運算實力,大約可擠進排名前60的超級電腦。(詳全文)
臉書 ExGAN
老是拍到閉眼照嗎?臉書用AI解決拍照失敗問題
臉書AI研究院近日發表一項研究成果,可運用AI技術,來修正照片中閉眼或紅眼的現象。臉書擁有龐大的相片資料,包括閉眼照片,可用作AI訓練。臉書AI研究院在條件式生成對抗網路(cGAN)基礎上,發展出樣本式生成對抗網路(ExGAN)技術,訓練過程包括將輸入相片的眼睛部位以遮住;以輸入相片與繪製相片間的內容/重構損失計算出生成器參數的梯度;以繪製相片、參考相片或程式碼及另一張真實相片來計算鑑別器參數的梯度;最後透過生成器反向傳播鑑別器的錯誤。研究人員表示,從結果來看,ExGAN產出的相片比Adobe PhotoShop Elements演算法製作的圖來得自然,和相片中人物原始面目也十分接近。(詳全文)
MIT RF-Pose
小心隔牆有眼!MIT成功以無線訊號隔牆畫出人體動作
MIT最近研究出能穿牆精準估測人體2D骨架的技術。研究團隊以深度學習分析射頻(Radio Frequency)訊號,MIT團隊提出的RF-Pose方法,不只能在人體未受遮蔽的情況下、抓取人的姿勢,連人體完全受到遮蔽的情境,也可以良好運作,無論是一個人或是多個人都沒問題,RF-Pose甚至可以同時對場景中100個人抓取每個人的骨架,而這正是傳統基於電腦視覺做不到的事,因為人們在畫面中會互相遮蔽,而使用無線電波當作輸入,則完全沒有這個問題。(詳全文)
Amazon DeepLens
Amazon AI相機DeepLens在美開賣
Amazon日前宣布DeepLens正式在美國市場開賣,售價和Google Clips同樣為249美元,之後將陸續推向其他地區。DeepLens具備可拍攝1080P影片的400萬畫素鏡頭、2D麥克風陣列,Intel Atom處理器、雙頻Wi-Fi、USB、micro HDMI傳輸埠,內建8GB的記憶體空間以供用戶預載模型與程式碼。在軟體上則搭載Ubuntu 16.04、AWS Greengrass Core、為裝置最佳化的MXNet深度學習框架及Intel clDNN函式庫,能直接於硬體上跑深度學習模型。此外,DeepLens現在也支援第三方框架,像是TensorFlow 、Caffe2和MXNet提供的多層環境,以及Amazon的串流服務Kinesis Video Stream。(詳全文)
圖片來源/Nvidia、MIT、Facebook
AI趨勢近期新聞
1. Amazon股東、公民團體要求AWS停止開發與行銷Rekognition人臉辨識服務
2. IBM展示全球首個AI辯論系統Project Debater
3. 臺灣微軟陸續和亞大、交大、中華大學等校合作,培訓AI人才
資料來源:iThome整理,2018年6月