Nvidia本周發表了兩款基於Pascal架構的Tesla P4與Tesla P40 GPU,鎖定時興的人工智慧應用,其中P40鎖定大型人工智慧應用,每秒最高可執行47兆次運算(Tera-Operations Per Second)。
Nvidia指出,包括語音助理、垃圾郵件過濾、 電影或產品推薦引擎等人工智慧(AI)服務都快速成長中, 所需的運算能力是一年前的10倍, 現有的GPU技術無法滿足需要即時回應的AI服務,而Tesla P4與Tesla P40則是專為推論所設計, 能利用訓練過的深層神經網路來辨識語音、 圖像及文字並回應使用者與裝置的查詢。
這兩款GPU的回應速度是CPU的45倍,也是一年前舊版GPU的4倍。其中,Tesla P4適用於資料中心,標榜省電效益是CPU的40倍, 以一個只有單一Tesla P4的伺服器來執行影片推論任務, 足以媲美13個基於CPU的同任務伺服器,卻只需1/8的整體擁有成本。
更強大的Tesla P40則是在深度學習任務上擁有最大的吞吐量, 每秒可執行47兆次的運算,一台配備8個Tesla P40的伺服器可用來取代140台採用CPU的伺服器, 以每台伺服器5000萬美元來計算, 光是伺服器成本就能節省65萬美元。
Tesla P4與Tesla P40(下圖,來源:Nvidia)將分別在今年11月及10月出貨, 亦有可供搭配的NVIDIA DeepStream SDK及TensorRT軟體。