8月中旬,人工智能芯片初創(chuàng)公司寒武紀(jì)獲得1億美元的A輪融資,至此成為該領(lǐng)域的第一個(gè)“獨(dú)角獸”,緊接著,9月初,華為在IFA2017上正式發(fā)布了全球首款面向手機(jī)的人工智能芯片“麒麟970”。
就在這前后不到一個(gè)月的時(shí)間里,“人工智能芯片”成為了人人爭(zhēng)相熱議的一個(gè)產(chǎn)品、一個(gè)產(chǎn)業(yè)。
人工智能芯片熱度漸多家公司早已著手布局
前段時(shí)間,因?yàn)楸豢醋鍪钱?dāng)前智能家居的入口之一,“智能音箱”一下子受到了人們的極大關(guān)注,而隨著小愛(ài)同學(xué)、天貓精靈等產(chǎn)品的相繼推出,更是將這股熱潮推上了頂端。
就在這股浪潮漸漸平穩(wěn)的時(shí)候,“人工智能芯片”緊跟而上,引起了人工智能領(lǐng)域的又一波新的浪潮。事實(shí)上,在這第三次的人工智能浪潮中,作為讓人工智能技術(shù)更快、更好運(yùn)行的基礎(chǔ)硬件設(shè)施,人工智能芯片必然是未來(lái)智能化時(shí)代的一種趨勢(shì)。也因此,雖然人工智能芯片相比于其他人工智能技術(shù)和應(yīng)用顯得低調(diào)得多,但它的布局依舊是眾多廠商眼中不能錯(cuò)過(guò)的“機(jī)遇”:
買(mǎi)買(mǎi)買(mǎi)的英特爾——至今,為了不再錯(cuò)過(guò)人工智能芯片,英特爾陸陸續(xù)續(xù)收購(gòu)了Altera、Yogitech、Nervana、Movidius、Mobileye等多家公司,拿下了他們的FPGA等多種技術(shù)。
GPU在手,誰(shuí)與爭(zhēng)鋒的英偉達(dá)——憑借著GPU在人工智能應(yīng)用中的先天性優(yōu)勢(shì),英偉達(dá)已經(jīng)走在了人工智能芯片的前列。不過(guò),就在最近,黃仁勛也發(fā)布了一款針對(duì)深度學(xué)習(xí)而打造的芯片TeslaV100。
緊盯FPGA的微軟——微軟把重心放在FPGA人工智能芯片上,已經(jīng)被用在Bing搜索的支持上。另外,其也推出了基于FPGA的視覺(jué)芯片A-eye,讓攝像頭具有視覺(jué)理解能力,可應(yīng)用在機(jī)器人、汽車(chē)和無(wú)人機(jī)等多種智能產(chǎn)品。
與此同時(shí),國(guó)內(nèi)的廠商也是蠢蠢欲動(dòng)。
首個(gè)獨(dú)角獸“寒武紀(jì)”——因?yàn)楦哌_(dá)1億美元的A輪融資,寒武紀(jì)成為了人工智能芯片領(lǐng)域的首個(gè)獨(dú)角獸,通過(guò)的IP授權(quán)的形式,其技術(shù)已經(jīng)在華為人工智能芯片麒麟970上面得到了商業(yè)化;
主打“嵌入式”的地平線機(jī)器人——地平線機(jī)器人致力于打造基于深度神經(jīng)網(wǎng)絡(luò)的人工智能“大腦”平臺(tái),包括軟硬件。在硬件上,其此前曾表示旗下的人工智能芯片“盤(pán)古”已經(jīng)成功流片商用;
從上面多家企業(yè)的布局和產(chǎn)品來(lái)看,我們能夠清晰地認(rèn)知到,雖然“人工智能芯片”相比于語(yǔ)音識(shí)別等技術(shù)并沒(méi)有得到大眾更多的關(guān)注,但是作為人工智能的基礎(chǔ)硬件設(shè)施,其已經(jīng)成為諸多公司搶奪市場(chǎng)、占據(jù)風(fēng)口的一大戰(zhàn)略制勝點(diǎn)。
人工智能加速人工智能專(zhuān)用芯片是未來(lái)趨勢(shì)
深度學(xué)習(xí)算法是實(shí)現(xiàn)人工智能技術(shù)和應(yīng)用的核心,其在運(yùn)行過(guò)程中需要對(duì)海量的數(shù)據(jù)進(jìn)行運(yùn)算處理——用已有的樣本數(shù)據(jù)去訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)、用訓(xùn)練好的人工神經(jīng)網(wǎng)絡(luò)去運(yùn)算其他數(shù)據(jù)。對(duì)于傳統(tǒng)計(jì)算架構(gòu)而言,這將是一個(gè)極大的挑戰(zhàn)。
面對(duì)深度學(xué)習(xí)算法這一計(jì)算新需求,GPU(圖形處理器)、FPGA(可編程門(mén)陣列)、ASIC(專(zhuān)用集成電路)等成為了人工智能芯片領(lǐng)域的“被追捧者”。比如GPU,相比于CPU,其具有高并行結(jié)構(gòu),擁有更多的ALU(ArithmeticLogicUnit,邏輯運(yùn)算單元)用于數(shù)據(jù)處理,適合對(duì)密集型數(shù)據(jù)進(jìn)行并行處理。
值得我們注意的事,不管是讓英偉達(dá)一舉聞名的GPU,抑或是當(dāng)前與GPU不分伯仲的FPGA,在屬性上,它們都只能算是人工智能通用芯片。相比于一開(kāi)始就是“私人訂制”的ASIC,在深度學(xué)習(xí)算法的運(yùn)行上,GPU和FPGA或多或少都有著一些局限:
GPU局限:GPU能夠游刃有余的訓(xùn)練人工神經(jīng)網(wǎng)絡(luò),但在輸出應(yīng)用時(shí),它一次只能處理一張圖像;相比于FPGA的靈活,GPU硬件結(jié)構(gòu)固定,不具備可調(diào)整性;在實(shí)現(xiàn)相同性能的功耗上,GPU遠(yuǎn)大于FPGA以及ASIC。
FPGA局限:為了實(shí)現(xiàn)可重構(gòu)特性,F(xiàn)PGA內(nèi)部有大量極細(xì)粒度的基本單元,但是每個(gè)單元的計(jì)算能力都遠(yuǎn)遠(yuǎn)低于GPU中的ALU模塊;在深度學(xué)習(xí)算法的運(yùn)行速度和功耗上,F(xiàn)PGA表現(xiàn)的都不如ASIC;FPGA價(jià)格較為昂貴,在某些情況下甚至?xí)哂贏SIC。
不可否認(rèn),對(duì)于當(dāng)前人工智能的發(fā)展,GPU和FPGA都做出了不小的貢獻(xiàn),但是從未來(lái)發(fā)展趨勢(shì)來(lái)看,人工智能專(zhuān)用芯片才是未來(lái)的核心。
從上面的一些比較我們可以看出,在功耗和速度上,GPU、FPGA與ASIC之間還是有著一定差距的。
針對(duì)人工智能芯片的通用與專(zhuān)用的區(qū)別,地平線機(jī)器人芯片專(zhuān)家馬鳳翔稱(chēng),相比于通用芯片,專(zhuān)用芯片是為特定場(chǎng)景而定制的,具備低功耗、低成本、高性能的優(yōu)勢(shì)。再通俗一點(diǎn)講,就如寒武紀(jì)創(chuàng)始人之一的陳云霽所舉出的例子,普通的處理器就好比“瑞士軍刀”,雖然通用,但不專(zhuān)業(yè),造成浪費(fèi),但是做菜的時(shí)候,還是菜刀得心應(yīng)手,而專(zhuān)業(yè)的深度學(xué)習(xí)處理器就是這把更高效、更快捷的“菜刀”。
與此同時(shí),不僅僅是性能的要求,隨著人工智能技術(shù)的發(fā)展,其應(yīng)用范圍也將進(jìn)一步擴(kuò)大。未來(lái),自動(dòng)駕駛、機(jī)器人、智能家居等等終將充斥我們的生活,這其中所隱藏的將是一個(gè)無(wú)可估量的市場(chǎng)需求。屆時(shí),不管是所需要處理的數(shù)據(jù),抑或是運(yùn)算速度,與現(xiàn)在相比都將不是一個(gè)量級(jí),若想做的更好,就只能向人工智能專(zhuān)用芯片靠攏。
人工智能專(zhuān)用芯片商業(yè)化IP授權(quán)是當(dāng)前的最佳出路
隨著寒武紀(jì)成為AI芯片領(lǐng)域首個(gè)“獨(dú)角獸”、華為麒麟970的推出,以及后面蘋(píng)果、三星等多家重量級(jí)廠商相繼宣布AI芯片的規(guī)劃,“如何實(shí)現(xiàn)技術(shù)、產(chǎn)品的商業(yè)化落地”就成為了接下來(lái)需要廠商們亟待解決的問(wèn)題。
目前,運(yùn)用ASIC架構(gòu)的人工智能專(zhuān)用芯片中,最典型、最具代表性的當(dāng)屬寒武紀(jì)旗下的產(chǎn)品和谷歌的TPU了,不同的是,前者服務(wù)的對(duì)象是廣大客戶,而后者則是服務(wù)于自己的人工智能系統(tǒng)Tensor-flow。
談及商業(yè)化,雖然中星微、寒武紀(jì)的產(chǎn)品此前都有所流片,但是從當(dāng)前的整體來(lái)看的話,相比于流片,IP授權(quán)或許更適合人工智能專(zhuān)用芯片,尤其是對(duì)于創(chuàng)企而言。至于原因,可以總結(jié)為兩點(diǎn):
第一,與其急著流片實(shí)現(xiàn)商業(yè)化,不如緩下腳步達(dá)到芯片生態(tài)圈
的確,對(duì)于企業(yè)來(lái)說(shuō),流片是一種能夠快速實(shí)現(xiàn)商業(yè)化的方法,并且收獲的利潤(rùn)也是可觀的。但是,這樣一來(lái)難免顯得有些激進(jìn),一不小心或許就會(huì)造成失誤。相比之下,通過(guò)IP授權(quán)來(lái)慢慢拉攏客戶構(gòu)建生態(tài)圈、“蠶食”人工智能芯片市場(chǎng)顯得更為從容有序。
說(shuō)到IP授權(quán),我們第一個(gè)想到的就是ARM,作為后起之秀的它通過(guò)IP授權(quán)的策略打敗了當(dāng)時(shí)的業(yè)內(nèi)老大Intel。ARM大中華區(qū)總裁吳雄昂曾一句話總結(jié)成功——建立了一個(gè)有強(qiáng)大活性和創(chuàng)新力的生態(tài)圈,為生態(tài)圈的合作伙伴提供了一種共贏模式,參與其中的企業(yè)有很高的成功率和利潤(rùn)空間。另外,ARM生態(tài)圈的成員并不受限于ARM平臺(tái),在此基礎(chǔ)上可以有無(wú)限的創(chuàng)新空間。
當(dāng)前,深度學(xué)習(xí)算法可能還沒(méi)有那么的成熟,而人工智能的極大需求又對(duì)芯片的性能和功耗提出了新要求。與此同時(shí),ASIC還有一個(gè)bug——架構(gòu)固定不具備靈活性,這是其略遜于FPGA的一處。不過(guò),通過(guò)IP授權(quán),這將允許客戶在指令集基礎(chǔ)上根據(jù)需求創(chuàng)建出自己的內(nèi)核架構(gòu),并可添加各種片內(nèi)外設(shè)比如通信接口等等,從而生產(chǎn)出自己的“處理器芯片”,就像此次的華為麒麟970。
目前來(lái)講,人工智能還處在一個(gè)初級(jí)階段,相比于“思維定式”,更為靈活的架構(gòu)或許將會(huì)更受歡迎。如此一來(lái),圍繞人工智能專(zhuān)用芯片將會(huì)逐步形成一個(gè)生態(tài)圈,這對(duì)于芯片企業(yè)以后的規(guī)劃而言將是重要的一步棋。
第二,人工智能專(zhuān)用芯片流片具備風(fēng)險(xiǎn)
前面也提過(guò),相比于人工智能通用芯片,人工智能專(zhuān)用芯片具備低成本低功耗的優(yōu)勢(shì),但是有一個(gè)前提,那就是實(shí)現(xiàn)高出貨量。
比如ASIC和FPGA,比起一次性成本,前者的成本是遠(yuǎn)遠(yuǎn)高于后者的,不過(guò),在同樣實(shí)現(xiàn)高量產(chǎn)的前提下,后者的成本將轉(zhuǎn)變?yōu)榍罢叩?0倍,甚至是100倍。因此,如果不能實(shí)現(xiàn)量產(chǎn)的話,這對(duì)于人工智能專(zhuān)用芯片將是一件極為不利的事。
當(dāng)然,在性能和功耗上,人工智能專(zhuān)用芯片遙遙領(lǐng)先,但也不能忽視其一旦流片,功能就不能更改的事實(shí),這也是造成人工智能專(zhuān)用芯片上市慢的一個(gè)原因所在。
結(jié)語(yǔ)
在多起事件的聯(lián)動(dòng)下,人工智能專(zhuān)用芯片已經(jīng)成為了一個(gè)“大藍(lán)?!?,引得國(guó)內(nèi)外科技巨頭、AI創(chuàng)企紛紛跳入其中,意圖攀上中間那座小島的制高點(diǎn)。
最后,攀上那座小島的只會(huì)是人工智能專(zhuān)用芯片,至于最后是誰(shuí),又是怎么攀上的,我們目前只能持以觀望的態(tài)度。