TensorCoreGPU在每一項MLPerf基準測試結(jié)果中均實現(xiàn)最佳表現(xiàn);用戶可通過NGC使用加速堆棧。
在最新公布的業(yè)內(nèi)首套人工智能基準測試中,NVIDIA創(chuàng)下6項人工智能性能記錄。
在谷歌、英特爾、百度、NVIDIA及其他數(shù)十家科技行業(yè)領(lǐng)軍企業(yè)的支持下,新型基準測試套件MLPerf可測定一系列深度學(xué)習工作負載。該套件涵蓋了計算機視覺、語言翻譯、個性化推薦以及強化學(xué)習任務(wù)等領(lǐng)域,旨在成為業(yè)內(nèi)首個客觀的人工智能基準測試套件。
最佳性能表現(xiàn)
NVIDIA在其提交的6個MLPerf基準測試結(jié)果中均取得了最佳表現(xiàn)。這些測試涵蓋了多種工作負載和基礎(chǔ)架構(gòu)規(guī)模–從單節(jié)點上的16顆GPU到跨80節(jié)點上的多達640顆GPU。
這些測試分為6大類別,分別為圖像分類、對象實例分割、目標檢測、臨時翻譯、復(fù)發(fā)性翻譯與推薦系統(tǒng)。NVIDIA并未提交第7類別,即強化學(xué)習的基準測試,原因是該類別尚未充分利用到GPU加速。
NVIDIA在語言翻譯測試類別中表現(xiàn)突出
NVIDIA在語言翻譯這一關(guān)鍵基準測試類別中表現(xiàn)尤為出色,僅需6.2分鐘即完成了Transformer神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。關(guān)于NVIDIA參與的6項基準測試結(jié)果的更多信息,請訪問NVIDIA開發(fā)者新聞中心。
NVIDIA工程師利用NVIDIADGX系統(tǒng)實現(xiàn)了這些測試結(jié)果。該系統(tǒng)包括全球最強大的人工智能系統(tǒng)NVIDIADGX-2,搭載了16顆完全連接的V100TensorCoreGPU。
唯一一家參與多達6項基準測試的科技公司
NVIDIA是唯一一家參與多達6項基準測試的科技公司,充分展現(xiàn)出V100TensorCoreGPU在部署人工智能工作負載方面的通用性。
NVIDIA副總裁兼加速計算總經(jīng)理IanBuck表示:“全新基準MLPerf展示了NVIDIATensorCoreGPU非凡的性能與通用性。我們的TensorCoreGPU擁有高性價比,且可通過各地的云服務(wù)提供商及電腦制造商實現(xiàn)供貨,進而幫助世界各地的開發(fā)人員在開發(fā)過程中的每一個階段推進人工智能的應(yīng)用?!?/p>
一流的人工智能計算需要“全棧式”創(chuàng)新
要想在復(fù)雜多樣的計算工作負載中實現(xiàn)優(yōu)異性能,不僅僅需要出色的芯片。加速計算也不單單與加速器有關(guān),還需要實現(xiàn)全堆棧創(chuàng)新。
NVIDIA堆棧包括NVIDIATensorCores、NVLink、NVSwitch、DGX系統(tǒng)、CUDA、cuDNN、NCCL、經(jīng)過優(yōu)化的深度學(xué)習框架容器以及NVIDIA軟件開發(fā)套件。
超高易用性
NVIDIA的人工智能平臺是最便捷且高性價比的選擇。TensorCoreGPU可通過各地的云服務(wù)提供商及電腦制造商實現(xiàn)供貨。
高性價比的選擇
借助售價僅為2,500美元的超強桌面級GPU-NVIDIATITANRTX,用戶在桌面上也可實現(xiàn)相同的TensorCoreGPU強大功能。如果按照3年使用期來計算,該GPU每小時的費用僅相當于幾美分。
通過NVIDIAGPUCloud(NGC)云容器注冊,用戶可持續(xù)更新這些軟件的加速堆棧。
NVIDIA創(chuàng)紀錄的平臺現(xiàn)可通過NGC下載
用于實現(xiàn)NVIDIA業(yè)界領(lǐng)先的MLPerf性能的軟件創(chuàng)新與優(yōu)化,現(xiàn)可通過我們最新的NGC深度學(xué)習容器免費獲取。如需下載,請訪問NGC容器注冊。
此容器包含經(jīng)過NVIDIA優(yōu)化的完整軟件堆棧及頂級人工智能框架。18.11版本NGC深度學(xué)習容器包含了用于實現(xiàn)我們MLPerf基準測試結(jié)果的詳細軟件。
開發(fā)人員可將這些軟件用于任意地點以及各大開發(fā)階段:
·對于桌面數(shù)據(jù)科學(xué)家:此容器支持利用NVIDIATITANRTXGPU開展前沿研究。
·對于工作組:此容器同樣可運行于NVIDIADGXStation。
·對于企業(yè):利用來自阿里云、AWS、百度云、谷歌云、IBM云、MicrosoftAzure、OracleCloudInfrastructure以及騰訊云的NVIDIAGPU加速實例,此容器可加快將人工智能用于其云端數(shù)據(jù)。
·對于正在構(gòu)建內(nèi)部人工智能基礎(chǔ)架構(gòu)的各組織:來自Atos、思科、Cray、DellEMC、HP、HPE、浪潮、聯(lián)想、中科曙光以及Supermicro的NVIDIADGX系統(tǒng)與NGC-Ready系統(tǒng)可讓人工智能投入使用。