【中國(guó)傳動(dòng)網(wǎng) 技術(shù)前沿】 近日,華為和比特大陸紛紛發(fā)布了針對(duì)邊緣計(jì)算的新芯片產(chǎn)品。華為的Ascend系列采用達(dá)芬奇架構(gòu),其中Ascend310功耗8W算力8TOPS正是針對(duì)邊緣計(jì)算市場(chǎng)。而之后比特大陸發(fā)布的BM1682和BM1880也是針對(duì)邊緣計(jì)算市場(chǎng),其中BM1682功耗30W算力3TFlops針對(duì)邊緣服務(wù)器市場(chǎng),而B(niǎo)M1880功耗3W整數(shù)算力2TOPS則是針對(duì)邊緣終端市場(chǎng)。人工智能結(jié)合邊緣計(jì)算已經(jīng)成為最熱門(mén)的市場(chǎng)之一,我們今天就來(lái)分析并展望這個(gè)市場(chǎng)。
華為和比特大陸都紛紛在邊緣人工計(jì)算市場(chǎng)布局
邊緣計(jì)算新興市場(chǎng)
人工智能芯片市場(chǎng)第一個(gè)得到關(guān)注的是云端服務(wù)器市場(chǎng),Nvidia的GPU以其強(qiáng)勁的算力掌握了大部分市場(chǎng)。隨著人工智能的鋪開(kāi),邊緣計(jì)算(edgecomputing)的概念也得到了越來(lái)越多的認(rèn)可。邊緣計(jì)算相對(duì)于云計(jì)算有幾點(diǎn)優(yōu)勢(shì),首先是延遲較小,在云端和終端通常有幾十毫秒到幾百毫秒不等的網(wǎng)絡(luò)延遲,對(duì)于工業(yè)應(yīng)用等對(duì)延遲有高要求的應(yīng)用來(lái)說(shuō)云端部署人工智能無(wú)法滿(mǎn)足其對(duì)于延遲的需求;其次是數(shù)據(jù)隱私,有些應(yīng)用不希望把數(shù)據(jù)傳輸?shù)皆贫?,一方面?dān)心云端數(shù)據(jù)被云運(yùn)營(yíng)商看到,另一方面擔(dān)心數(shù)據(jù)傳輸過(guò)程中被黑客劫持;最后是可靠性,如果把人工智能部署在云端那么一旦網(wǎng)絡(luò)斷了在終端的人工智能程序就無(wú)法工作了,這對(duì)于要求高可靠性的應(yīng)用來(lái)說(shuō)難以滿(mǎn)足要求,但是如果把人工智能部署在邊緣就沒(méi)有這個(gè)問(wèn)題。
邊緣人工智能計(jì)算中其實(shí)還包含了多個(gè)層次,一種是終端設(shè)備(如手機(jī))上的人工智能計(jì)算,這樣的規(guī)劃把人工智能計(jì)算直接放到終端設(shè)備上,可以實(shí)現(xiàn)最低的延遲。然而,由于終端設(shè)備的電池容量有限或者對(duì)于散熱容忍度較低,因此在終端設(shè)備上做人工智能計(jì)算對(duì)于AI芯片的能效比提出了極高的要求,同時(shí)這樣也并非唯一的邊緣計(jì)算形態(tài)。
除了終端設(shè)備上的直接做計(jì)算之外,還可以把終端的數(shù)據(jù)放到離終端比較近的本地服務(wù)器去計(jì)算。例如,對(duì)于工業(yè)應(yīng)用這樣的對(duì)于穩(wěn)定性和延遲有要求但是又可以做集群化計(jì)算的應(yīng)用,除了把計(jì)算直接放到終端設(shè)備之外另一種方法就是就近設(shè)立邊緣服務(wù)器讓計(jì)算放到邊緣服務(wù)器上去做然后快速返回給終端設(shè)備。邊緣服務(wù)器對(duì)于芯片功耗的要求相比在終端設(shè)備上直接計(jì)算就會(huì)寬松許多,因此非常適合于這種可以集群化計(jì)算的應(yīng)用。
邊緣計(jì)算的兩種市場(chǎng)目前都已經(jīng)在起飛。而相關(guān)AI芯片也得到了許多關(guān)注。標(biāo)志性事件是華為的兩次芯片發(fā)布會(huì)。去年秋天發(fā)布的麒麟970芯片附帶NPU,可以說(shuō)是人工智能部署在手機(jī)的一次重要嘗試。今年秋天又發(fā)布了Ascend系列芯片,其中Ascend310芯片也是針對(duì)邊緣服務(wù)器市場(chǎng)并且華為已經(jīng)開(kāi)發(fā)了基于Ascend310的邊緣計(jì)算服務(wù)器準(zhǔn)備部署在自動(dòng)駕駛領(lǐng)域。因此我們可以預(yù)計(jì)在未來(lái)無(wú)論是相關(guān)應(yīng)用還是相關(guān)芯片都將有更多公司大手筆投入,從而推動(dòng)AI進(jìn)一步發(fā)展。
邊緣服務(wù)器的芯片形態(tài)與競(jìng)爭(zhēng)格局
邊緣服務(wù)器的市場(chǎng)現(xiàn)在來(lái)看將是人工智能最早落地的應(yīng)用之一(甚至比手機(jī)里的人工智能還要早且成熟),因?yàn)槟壳爸袊?guó)的智能攝像頭產(chǎn)品已經(jīng)在安防、人臉識(shí)別等領(lǐng)域真正落地,而邊緣服務(wù)器是很適合智能攝像頭的產(chǎn)品形態(tài),一方面在不少此類(lèi)應(yīng)用中對(duì)于可靠性有很強(qiáng)的需求,因此部署在邊緣端的人工智能更適合;另一方面智能攝像頭的計(jì)算可以集群化操作,因此一個(gè)邊緣服務(wù)器處理多路智能攝像頭的形式是非常經(jīng)濟(jì)的方式。除了智能攝像頭之外,無(wú)人駕駛也是邊緣服務(wù)器的一個(gè)例子,因?yàn)樵跓o(wú)人車(chē)?yán)锩嫘枰鰝鞲衅魅诤献龃罅坑?jì)算,相當(dāng)于在無(wú)人車(chē)上部署了一個(gè)邊緣服務(wù)器。
邊緣服務(wù)器市場(chǎng)通常對(duì)于通用性有一定需求,因此比較合適的方案是處理器加上通用型深度學(xué)習(xí)加速芯片,而深度學(xué)習(xí)加速芯片最常見(jiàn)的形式是以PCIe加速卡的形式插到主板上,并與主處理器協(xié)同工作。值得注意的是,由于邊緣服務(wù)器對(duì)于人工智能算法精度有一定要求,因此往往使用的是類(lèi)似半精度浮點(diǎn)數(shù)的運(yùn)算方式,很多邊緣終端芯片上常見(jiàn)的INT-4甚至INT-2等激進(jìn)的低精度整數(shù)運(yùn)算由于損失精度過(guò)多因此在邊緣服務(wù)器不太適合。
我們認(rèn)為邊緣服務(wù)器市場(chǎng)尚屬于新興市場(chǎng),加入戰(zhàn)場(chǎng)的公司并不多,目前僅有Nvidia,華為,比特大陸等,而且不同的公司可以主打不同的細(xì)分市場(chǎng),因此市場(chǎng)競(jìng)爭(zhēng)遠(yuǎn)未飽和。我們不妨來(lái)分析一下Nvidia,華為和比特大陸三家公司的競(jìng)爭(zhēng)格局。Nvidia的產(chǎn)品是Xavier芯片,峰值算力30TOPS,功耗30W,主要針對(duì)的是自動(dòng)駕駛市場(chǎng),因此芯片上還集成了雙目視覺(jué)、光流等,模組售價(jià)2499美元,顯然是針對(duì)高端自動(dòng)駕駛市場(chǎng),而對(duì)于智能攝像頭等對(duì)于部署成本有要求的場(chǎng)合并不合適。
華為的Ascend310定位中高端,其8W/8TFlops的性能下可覆蓋智能攝像頭市場(chǎng),上可進(jìn)擊自動(dòng)駕駛市場(chǎng)(華為已經(jīng)與奧迪合作,發(fā)布了基于Ascend310芯片的自動(dòng)駕駛邊緣服務(wù)器MDC600)。而比特大陸則是主打性?xún)r(jià)比路線,BM1682自帶視頻解碼和后處理操作且集成了CPU,因此客戶(hù)需要加速智能機(jī)器視覺(jué)相關(guān)應(yīng)用時(shí)理論上只需要BM1682即可,無(wú)需再去購(gòu)入額外的CPU,這也降低了成本。
華為基于Ascend310的MDC600邊緣計(jì)算服務(wù)器主攻自動(dòng)駕駛市場(chǎng)
目前在中國(guó)市場(chǎng),最主要的市場(chǎng)還是安防等應(yīng)用的智能攝像頭,因此產(chǎn)品定位決定了主要是華為和比特大陸之間的競(jìng)爭(zhēng),那么比特大陸和華為之間的競(jìng)爭(zhēng)格局會(huì)如何呢?我們認(rèn)為,首先這個(gè)市場(chǎng)很大,華為和比特大陸的主打方向也不相同(華為主打性能而比特大陸走性?xún)r(jià)比路線),因此并不存在勢(shì)不兩立的激烈競(jìng)爭(zhēng)。另一方面,其實(shí)華為和比特大陸的共同競(jìng)爭(zhēng)對(duì)手是海康威視這樣的智能攝像頭系統(tǒng)廠商,一旦??低曇查_(kāi)始自研芯片且在自己的安全攝像頭系統(tǒng)中以各種方式推廣自研邊緣服務(wù)器,那么華為和比特大陸的壓力將會(huì)很大。不過(guò)我們預(yù)計(jì)到那個(gè)時(shí)候智能攝像頭以外的市場(chǎng)也會(huì)變得成熟,從而給華為和比特大陸等芯片公司提供新的機(jī)會(huì),而不用被迫在智能攝像頭領(lǐng)域與巨頭系統(tǒng)廠商競(jìng)爭(zhēng)。
邊緣終端市場(chǎng)的芯片形態(tài)與競(jìng)爭(zhēng)格局
邊緣終端市場(chǎng)是指直接在終端設(shè)備上做計(jì)算的AI芯片,對(duì)于功耗和能效比有很強(qiáng)的要求。目前來(lái)看,邊緣終端市場(chǎng)有兩種形態(tài)的芯片產(chǎn)品,一種是針對(duì)特定應(yīng)用的SoC,一種是通用加速器做獨(dú)立芯片。SoC面向?qū)S檬袌?chǎng),在芯片中深度學(xué)習(xí)加速計(jì)算事實(shí)上只是一小部分,而其他大部分芯片面積則交給了主控處理器、視頻解碼等等模塊。SoC集成度高,一般的技術(shù)路線是用新的SoC代替原有的不支持深度學(xué)習(xí)加速的SoC做更新?lián)Q代。
一個(gè)典型的例子就是華為麒麟系列SoC加入寒武紀(jì)的NPU,就屬于SoC自己的更新?lián)Q代。專(zhuān)注于AI芯片的廠商進(jìn)入SoC市場(chǎng)的策略往往是提供IP授權(quán),以發(fā)揮自己的強(qiáng)項(xiàng)(如寒武紀(jì)給華為提供NPUIP)。對(duì)于SoC往往針對(duì)的是一個(gè)特定市場(chǎng),因?yàn)槠渲械哪K都是針對(duì)該應(yīng)用而設(shè)計(jì),如果用在其他應(yīng)用中則顯得浪費(fèi),例如麒麟SoC最適合的場(chǎng)景是手機(jī),其中包含的GPU、ISP、Modem等都是為了手機(jī)場(chǎng)景打造,如果是用在工業(yè)場(chǎng)景則這些模組都閑置了,因此也就引出了另一個(gè)終端通用型深度學(xué)習(xí)加速器芯片市場(chǎng)。該市場(chǎng)相對(duì)于SoC市場(chǎng)來(lái)說(shuō)允許較低的集成度,即可以在主控芯片之外再搭配額外的芯片以支持相應(yīng)功能。
在終端SoC市場(chǎng),事實(shí)上競(jìng)爭(zhēng)已經(jīng)白熱化,華為、高通等公司都紛紛推出專(zhuān)屬的SoC搭載AI加速模組,而AI加速模組IP的提供商也有ARM,Cadence,CEVA等傳統(tǒng)IP提供商以及寒武紀(jì)這樣的初創(chuàng)公司。不少傳統(tǒng)SoC芯片公司都紛紛在自家SoC中加入自研或授權(quán)的人工智能模塊。對(duì)于人工智能終端SoC市場(chǎng),我們的分析是該市場(chǎng)雖然最早得到關(guān)注但是很可能近幾年還是被原來(lái)的SoC公司占領(lǐng)市場(chǎng),因?yàn)槟壳敖K端人工智能市場(chǎng)尚未真正落地收獲真金白銀,因此SoC中加入人工智能還只是錦上添花之舉。
在IP授權(quán)方面,Cadence和ARM入局意味著小公司面臨巨大壓力,因?yàn)镮P市場(chǎng)存在一定的頭部效應(yīng),且Cadence和ARM可以通過(guò)與其他的優(yōu)勢(shì)IP做捆綁銷(xiāo)售來(lái)推銷(xiāo)其人工智能IP,在人工智能并非最關(guān)鍵SoC模組的市場(chǎng)現(xiàn)狀下,小公司想要與Cadence和ARM等巨頭競(jìng)爭(zhēng)只能走差異化,例如超低功耗或模擬計(jì)算等路線。
終端通用深度學(xué)習(xí)加速器芯片市場(chǎng)的應(yīng)用則剛起步,之前Movidius推出的神經(jīng)計(jì)算加速棒并未引起巨大反響。但是這并不代表這個(gè)市場(chǎng)不存在,而是還處于幼年期,需要培養(yǎng),因此許多公司在這個(gè)市場(chǎng)布局主要一是培養(yǎng)開(kāi)發(fā)者生態(tài),另一方面也探索研究哪個(gè)市場(chǎng)最有潛力,預(yù)計(jì)在市場(chǎng)成熟之后再收縮戰(zhàn)線,針對(duì)幾個(gè)重要的應(yīng)用推出相應(yīng)的優(yōu)化芯片,從而占領(lǐng)最合適的市場(chǎng)。因此,目前對(duì)于這個(gè)市場(chǎng)最合適的策略是推出開(kāi)發(fā)板和插件式加速硬件(如USB加速棒)這樣簡(jiǎn)單易用的產(chǎn)品,這樣廠商和客戶(hù)可以一起探索市場(chǎng)需求,決定最佳產(chǎn)品形態(tài)。我們看到比特大陸就是在這個(gè)市場(chǎng)跟隨Movidius推出了BM1880芯片,并配套推出了開(kāi)發(fā)板、芯片模組以及USB加速棒等多種硬件形態(tài)供客戶(hù)挑選,我們相信在近期將會(huì)看到通用型終端人工智能加速器的更多應(yīng)用。
未來(lái)發(fā)展預(yù)期
如之前的分析,我們預(yù)計(jì)在人工智能邊緣計(jì)算會(huì)成為未來(lái)最重要的人工智能硬件市場(chǎng)之一。在邊緣計(jì)算領(lǐng)域,邊緣服務(wù)器芯片市場(chǎng)非常重要但是目前廠商不多,我們預(yù)期會(huì)有不少公司入局,包括從芯片領(lǐng)域提出超高性能的初創(chuàng)公司,以及??低曔@樣的系統(tǒng)廠商開(kāi)始自研芯片,而如華為、比特大陸等已經(jīng)提前入場(chǎng)的公司也會(huì)繼續(xù)加大投入。
在終端邊緣計(jì)算市場(chǎng),SoC芯片(AI加速器IP)領(lǐng)域競(jìng)爭(zhēng)已經(jīng)非常激烈,未來(lái)恐怕會(huì)有一波洗牌的過(guò)程,最后只會(huì)剩下幾家能在不同細(xì)分市場(chǎng)牢牢把握住客戶(hù)的公司。在通用終端加速器芯片領(lǐng)域我們則可望看到更多應(yīng)用出現(xiàn),在未來(lái)幾年內(nèi)我們能看到的邊緣終端加速器應(yīng)用實(shí)際上將會(huì)很大程度上決定這個(gè)市場(chǎng)的具體規(guī)模。
最后,我們必須看到邊緣計(jì)算等人工智能芯片應(yīng)用目前最大的市場(chǎng)其實(shí)在中國(guó)。這是因?yàn)橹袊?guó)的人工智能落地情況遠(yuǎn)好于美國(guó)。在政府的支持下,曠視、商湯、依圖等初創(chuàng)企業(yè)紛紛推出優(yōu)秀的產(chǎn)品并在市場(chǎng)上站住了腳跟,這一方面加速了基于人工智能的應(yīng)用成熟,另一方面也給人工智能芯片帶來(lái)了市場(chǎng),從而為人工智能的完整產(chǎn)業(yè)鏈的成熟帶來(lái)了機(jī)會(huì)。我們可以肯定地說(shuō),人工智能芯片的未來(lái)還得要看中國(guó)!