【AI芯片競爭激烈,誰家能成為集性能、功耗和芯片尺寸等優(yōu)勢于一身的霸主?】目前約有十幾種加速用戶端機(jī)器學(xué)習(xí)(machinelearning)任務(wù)的處理器核心正在角逐系統(tǒng)SoC市場,其中一些已經(jīng)被設(shè)計于智能手機(jī)中。其目標(biāo)在于取得比處理器IP巨擘Arm更早進(jìn)入市場的先發(fā)優(yōu)勢,但預(yù)計Arm很快就會發(fā)布自家的產(chǎn)品。
市場觀察家TheLinleyGroup的首席分析師LinleyGwennap在Linley處理器大會(LinleyProcessorConference)發(fā)表專題演講之前接受《EETimes》的訪問。他表示,這場競爭態(tài)勢顯示機(jī)器學(xué)習(xí)芯片的許多舉動正開始轉(zhuǎn)向低功耗的用戶端區(qū)塊(block)。然而,在高性能的資料中心芯片之間,競爭仍處于初期階段。
Gwennap說:「Arm已經(jīng)主宰了CPU的IP領(lǐng)域,也接管了GPU,但人工智能(AI)引擎為核心芯片創(chuàng)造了一個全新的市場,讓其它公司也能取得一個好的開始?!?/p>
這一市場中值得關(guān)注的新競爭對手與產(chǎn)品包括:
蘋果(Apple)iPhone智能手機(jī)中,A11SoC內(nèi)建的Bionic生物神經(jīng)網(wǎng)路引擎
三星(Samsung)GalaxyS9手機(jī)中,Exynos9810處理器內(nèi)建的DeePhi區(qū)塊
華為(Huawei)麒麟970(Kirin970)手機(jī)中的寒武紀(jì)(Cambricon)神經(jīng)引擎
聯(lián)發(fā)科(MediaTek)P30SoC中用于視覺和AI加速的CadenceP5DSP
英特爾(Intel)未來PC芯片組中可能使用Movidius加速芯片
現(xiàn)有的AI芯片設(shè)計訂單已經(jīng)鎖定了在整個手機(jī)市場中約占三分之一的高階智能手機(jī)應(yīng)用。Gwennap并預(yù)計,AI加速將在未來2~3年內(nèi)滲透到手機(jī)市場的其它部份。
除了智能手機(jī),汽車對AI芯片來說也是一個越來越大的市場。還有個人電腦(PC)、平板電腦和物聯(lián)網(wǎng)(IoT)裝置很快地也將充斥整個市場。
為了跟上步伐,Arm在今年二月宣布了一項名為'ProjectTrillium'的完整平臺。但是,Gwennap說:「他們必須在一些最佳化電源效率的特定硬體加速器方面更具有競爭力?!?/p>
「Arm目前正著手開發(fā)這一類加速器,并計畫在今年夏天發(fā)布其首款產(chǎn)品…但事實(shí)上,他們的進(jìn)度已經(jīng)落后了,這讓一些新公司有機(jī)會盡快卡位?!?/p>
去年10月,Arm宣布組建了一個機(jī)器學(xué)習(xí)小組。今年2月更進(jìn)一步提供該計畫的若干細(xì)節(jié)。
Arm可能會在今年10月份于矽谷舉行的年度活動中發(fā)表產(chǎn)品詳情。但這并不能保證Arm將收復(fù)失地,因?yàn)樯窠?jīng)網(wǎng)路引擎和CPU之間并不一定存在密切關(guān)系。
迄今所宣布的用戶端推論加速器之原始性能數(shù)據(jù),僅能反映部份現(xiàn)實(shí)(來源:TheLinleyGroup)
基準(zhǔn)和資料中心的競爭
最終,能在這場仍算是新戰(zhàn)場中獲勝的芯片將是集性能、功耗和芯片尺寸等優(yōu)勢于一的最佳組合。
Gwennap說:「問題在于我們看到了原始性能,但它實(shí)際上可歸納為在神經(jīng)網(wǎng)路上提供的性能。所以,我們需要的是一個良好的基準(zhǔn),例如每秒鐘可分類多少影像等?!?/p>
百度(Baidu)率先將AI基準(zhǔn)作為開放來源發(fā)布,但尚未被廣泛采用。交易處理委員會(TransactionProcessingCouncil)去年底成立了一個工作小組來處理這個問題,但尚未提報任何進(jìn)展。
他說:「提出基準(zhǔn)并不難,但要讓各家公司同意并比較結(jié)果可不簡單…如今事情正在改觀,所以,任何基準(zhǔn)都必須發(fā)展,才能與時俱進(jìn)?!?。
目前為止,Gwennap的報告稱,Videantis的多核心v-MP6000表現(xiàn)較其最接近的競爭對手CevaNeuPro略具有原始性能優(yōu)勢。CevaNeuPro將SIMDDSP與脈動MAC陣列相結(jié)合。
其它廠商還包括新思科技(Synopsys)的EV64,它結(jié)合了SIMDDSP與用于啟動和池化(pooling)的客制邏輯。如同Videantis一樣,AImotiveAIware也使用了許多客制硬體區(qū)塊。
在低成本的區(qū)塊中,芯原微電子(VeriSilicon)的VIP8000-O采用具有多達(dá)8個深度學(xué)習(xí)引擎的GPU提供大部份的原始性能。令人不解的是,在所發(fā)布的芯片中,寒武紀(jì)的CPU采用小型矩陣引擎所提供的性能最低,但仍取得華為智能手機(jī)應(yīng)用的重要訂單。
英國芯片公司Imagination也攜其PowerVR2NX入局,PowerVR2NX采用支援MAC陣列的客制非GPU架構(gòu)。Nvidia則為其Xavier處理器的深度學(xué)習(xí)加速器(NVDLA)核心架構(gòu)提供免費(fèi)且開放的IP,并獲得Arm的支持。
整體而言,Gwennap表示有多達(dá)40家公司都在設(shè)計客制的AI芯片。其中許多都鎖定了資料中心應(yīng)用,但在這個領(lǐng)域,NvidiaVoltaGPU的地位穩(wěn)固,并成為亞馬遜(Amazon)等巨擘所選擇的訓(xùn)練引擎。
Gwennap說:「我們現(xiàn)在看到的競爭對手是GoogleTPU和微軟(Microsoft)基于FPGA的Brainwave——目前正被廣泛部署,但至今還沒有許多商用替代方案可供選擇?!?/p>
「今年,在將新的AI資料中心架構(gòu)投入生產(chǎn)方面,WaveComputing似乎領(lǐng)先一步?!?/p>
WaveComputing銷售完整系統(tǒng)的決定顯示其目標(biāo)放在二線和三線(tier)業(yè)者,而不是喜歡制造自家最佳化產(chǎn)品的大型資料中心。
英特爾旗下的Nervana最近明確表示,要到2019年才會投產(chǎn)芯片。深度學(xué)習(xí)新創(chuàng)公司Graphcore聲稱將在今年稍晚發(fā)布新芯片。另一家新創(chuàng)公司Cerebrus則仍保持緘默,而比特幣ASIC制造商比特大陸(BitMain)已在去年底宣布用于資料中心的AI芯片計畫。
Gwennap說:「業(yè)界多家公司正一窩蜂地投入AI芯片領(lǐng)域,他們將其視為下一波淘金熱,因而競相搶搭這班列車?!?/p>