【美國聖荷西直擊GTC 2016】Nvidia 2016年度GTC技術大會今天正式邁入第2天,Nvidia執行長黃仁勳親自揭開大會序幕,就像去年的深度學習(Deep Learning )掀起大會熱潮一樣,今年所有話題也聚焦在深度學習與人工智慧(AI)的技術應用,連現場發布的眾多GPU新品也都紛紛與深度學習和AI應用有關,甚至Nvidia還在今年首度發表世上第一臺AI專用的DGX-1超級電腦。
有別於去年GTC大會給人還是一場GPU技術大會的氛圍,但今年卻很不一樣,深度學習和AI成為會場上最炙手可熱的技術話題,連黃仁勳在今年主題演說中也數度談到深度學習即將帶來各產業的顛覆性變革。
他表示 ,五年前,他和團隊就開始跨入深度學習領域,這些年也見證了深度學習技術的迅速竄紅,而隨著硬體和雲端運算技術的成熟,他認為,深度學習不再只是一種App或是演算法,更將開啟一種前所未有的全新運算模式(Computing Model),這也將促使深度學習成為未來所有企業甚至每個人,都不能加以忽視的重要大事(Big Deal )。
他說,現在包括亞馬遜AWS、Google、IBM,以及微軟這幾大雲端巨頭近年來都紛紛搶攻深度學習領域,可以想見的是,未來將會有更多結合雲端的AI服務或應用陸續推出,甚至將帶來新的一種AI即平臺(AI-as-a-Platform)的嶄新服務模式。
所以,Nvidia這次發布的多款GPU新品也紛紛圍繞著深度學習與AI應用,甚至還推出了世上首款結合深度學習使用的超級電腦DGX-1。在這臺超級電腦當中採用了Nvidia新Pascal架構的Tesla P100顯卡系列,這也是在本次大會上所發表的最新一款伺服器專用的GPU加速器產品,比前一代Maxwell架構的GPU加速器,在用來訓練神經網路的效能方面,足足有提升12倍之多,並也支援了HBM2高頻寬顯示記憶體技術。
在這臺超級電腦核心部份,總共裝入8組各內建16GB記憶體的Tesla P100顯卡和配置了一個2路Xeon E5 2698 v3處理器,而在系統記憶體部分最大可支援512GB DDR4的記憶體容量。Nvidia宣稱,DGX-1使用於深度學習的運算吞吐量,在半精準度的條件下,DGX-1電腦每秒浮點運算次數能達到170TFLOPS,如此高度的運算能力,幾乎等同於用250臺x86伺服器而搭建的運算叢集規模,才能滿足AI所需的大規模運算的需求。此外,每臺DGX-1機器的總傳輸頻寬,每秒最高可達768GB。
另外若單用一個2路Xeon E5伺服器與DGX-1進行兩相測試比較的話,根據測試的結果,在做為AlexNet機器學習的模型訓練方面,DGX-1完成訓練所花費的時間要遠比Xeon E5伺服器還快許多,Xeon級伺服器得要花150小時才能做完的事,DGX-1只須2小時就能完成訓練。若以照片來舉例的話,所代表的是,每天被餵給機器做訓練的照片數量就有高達13億張。
此外,這臺超級電腦內也配備有7TB的SSD硬碟,而電力供給部份則是使用一臺3U高度3,200瓦的電源供應設備,並也支援了NVLink 混合式立方網格 (NVLink Hybrid Cube Mesh),可提供更高速GPU互連的能力。
不僅如此,DGX-1也支援許多新的軟體功能,像是有裝入Nvidia新深度學習繪圖顯示訓練系統(Deep Learning GPU Training System ,DIGITS),用來協助企業設計一個完整且互動的神經網路,此外,還加入了新釋出的 CUDA深度神經網路圖庫(CUDA Deep Neural Network library ,cuDNN )的v5新版本,可用來做為設計神經網路可供GPU加速的函數圖庫。DGX-1系統內也提供了一些深度學習優化的框架,例如Caffe、 Theano ,以及Torch等,也搭配一套雲端管理存取的工具,還有更新的軟體,以及一個容器應用儲存庫(Repository )。
Nvidia目前也與位於波士頓的麻省綜合醫院的臨床數據科學中心 (Massachusetts General Hospital) 合作,將該研究中心所存有的100億張的醫學影像和醫療等相關資訊,都提供DGX-1用於進行深度學習的訓練,以建構可預測的醫療演算模型。黃仁勳也宣布這臺DGX-1即日起正式推出上市,每臺售價為12,9000美元,此外,黃仁勳表示,一些主流的伺服器大廠,包括HP、IBM、Dell等未來都將推出搭載Tesla P100顯卡的伺服器,預計在2017年第一季上市。