【全球AI芯片企業(yè)排名表中華為排行12,初創(chuàng)企業(yè)該從何突破?】1848年8月19日,《紐約先驅(qū)報(bào)》刊登了一則重磅消息,加州(加利福尼亞)發(fā)現(xiàn)了黃金!消息傳開,大批的人力投身于美國西部,引發(fā)了席卷全美的淘金熱潮,給加州這塊貧瘠的土地,帶來了財(cái)富與繁榮。
當(dāng)下的AI領(lǐng)域,正經(jīng)歷著這樣一場淘金熱。
資本家們毫不吝嗇,投入了數(shù)以億計(jì)的資金,融入的玩家大小林立,既有掌握先進(jìn)工具的科技巨頭,也有正不遺余力煉金的企業(yè)家,更多的是獨(dú)握一門煉金術(shù)的獨(dú)角獸。同時(shí),因?yàn)檫@片處女地足夠大,不管你是芯片制造商,還是算法提供商,抑或是云計(jì)算服務(wù)提供商,都可以獲取自己的利益。但是最終決定這場淘金熱能夠走得多遠(yuǎn)、影響多持久,AI芯片企業(yè)掌握了實(shí)際的話語權(quán)。
近日,市場研究公司CompassIntelligence發(fā)布了最新研究報(bào)告,全球AI芯片企業(yè)排名表中,英偉達(dá)(Nvidia)、英特爾(Intel)分列第一、第二名,中國企業(yè)華為、寒武紀(jì)、地平線,分列12、22、24位。雖然都在同一條賽道上奔跑,但是企業(yè)側(cè)重有所不同。
巨頭把持云端AI芯片
AI芯片,可以說是深度學(xué)習(xí)的專用芯片,具備在很高的內(nèi)在并行度、大量的浮點(diǎn)計(jì)算能力以及矩陣預(yù)算的能力,算法、算力、數(shù)據(jù),是它三個(gè)核心的元素。在相同的精度下,與傳統(tǒng)的通用CPU相比,它的處理速度更快、所需的服務(wù)器更少、功耗更低。一個(gè)簡單的顯性例子是,AI芯片下的處理能力每秒能夠達(dá)到5700張圖片,而如今所用的CPU則每秒僅能識別140張圖片。
AI芯片的興起要回溯到2013年,人們意外發(fā)現(xiàn),原來用于游戲的GPU在深度學(xué)習(xí)中發(fā)揮巨大的作用。這一發(fā)現(xiàn),使得GPU出身的英偉達(dá)瞬間占據(jù)了AI芯片的制高點(diǎn),基于深度學(xué)習(xí)發(fā)布了多款芯片。
人工智能芯片領(lǐng)域,可以分為面向云端數(shù)據(jù)中心的芯片和面向終端的嵌入式人工智能芯片兩大門類。而英偉達(dá)的GPU已經(jīng)成為在云端服務(wù)器的霸主,有報(bào)告顯示,世界上目前約有3000多家AI初創(chuàng)公司,大部分都采用了英偉達(dá)提供的硬件平臺。在端方面,英偉達(dá)推出了16nm的AI芯片XAVIER、自動駕駛平臺DRIVEPX,并且開源了DLA深度學(xué)習(xí)加速器項(xiàng)目。憑借著巨大的優(yōu)勢,英偉達(dá)的股價(jià)已經(jīng)從2016年初的30美元,飆升至如今的255美元,飛升了八倍之多。
從保守的角度來說,英偉達(dá)的潛在對手是英特爾。在云端市場,英特爾是老牌玩家,英偉達(dá)是新入局者。不過,英特爾發(fā)力較晚,通過連續(xù)收購?fù)瓿闪松鷳B(tài)布局,云端收購Altera之后推出了基于FPGA的專用深度學(xué)習(xí)加速卡,收購Nervana為AI優(yōu)化的KnightMill至強(qiáng)處理器。自動駕駛方面,與Mobileye和BMW結(jié)成了自動駕駛聯(lián)盟,并在移動端收購了Movidius。后續(xù)發(fā)力,業(yè)內(nèi)人士相當(dāng)看好英特爾。
實(shí)際上,真正挑起與英偉達(dá)在云端芯片較量的重?fù)?dān)是谷歌。自從決定研發(fā)AI芯片,也就是TPU(TensorProcessingUnit)后,谷歌一直悄無聲息。直到去年4月,谷歌一篇論文的發(fā)布,猶如一枚深水炸彈,讓業(yè)內(nèi)吃了一驚。隨后TPU的發(fā)布更是讓英偉達(dá)“慌了”。第三方平臺RiseML(riseml.com)做了一次對比評測。實(shí)驗(yàn)結(jié)果表明,在自定義的LSTM模型上,TPU更快。TPU(21402examples/s)比P100(1658examples/s)快16.9倍,比V100(2778examples/s)快7.7倍。RiseML給出的結(jié)論是:一旦TPU能夠容納更多的用戶使用,就可以成為英偉達(dá)GPU真正的替代者。
需要注意的是,柯潔對戰(zhàn)的AlphaGoMaster使用的就是第一代TPU,單機(jī)運(yùn)行,且物理服務(wù)器僅僅部署了4個(gè)TPU就打敗了柯潔。頗為遺憾的是,谷歌的TPU僅供自家使用,不對外出售,僅僅開放云端供大家使用。
初創(chuàng)團(tuán)隊(duì)更偏向終端側(cè)發(fā)力
英偉達(dá)首席科學(xué)家兼NVIDIAResearch高級副總裁BillDally博士表示,雖然AI領(lǐng)域大家似乎都在同一起跑線上,但是細(xì)分之后較為清晰可鑒的是,面向云端數(shù)據(jù)中心的芯片被巨頭們把持,因市場偏成熟,企業(yè)積累深厚,很難被超越,所以各大初創(chuàng)公司創(chuàng)業(yè)方向選擇的是面向終端的嵌入式人工智能芯片,如物聯(lián)網(wǎng)、智能駕駛、機(jī)器人等等,這是他們的機(jī)會所在。
這也是為什么地平線自2015年成立以來,突破的是面向終端的嵌入式人工智能芯片薄弱環(huán)節(jié)——在保證性能、可編程的前提下,芯片保持較低的功耗與成本。
地平線表示,他們研發(fā)歷時(shí)2年,才推出面向智能駕駛的征程處理器和面向智能攝像頭的旭日處理器。三項(xiàng)核心數(shù)據(jù)上,地平線做到了可每秒實(shí)現(xiàn)30幀1080P高清視頻流的實(shí)時(shí)處理;每幀支持200個(gè)并行目標(biāo)的檢測、識別和跟蹤;典型功耗僅1.5W,每幀處理時(shí)延小于30ms。
地平線采用的是自主設(shè)計(jì)研發(fā)的BPU芯片架構(gòu),是一款典型的異構(gòu)多指令多數(shù)據(jù)的系統(tǒng),架構(gòu)中心處理器是完整的系統(tǒng),存儲器架構(gòu)設(shè)計(jì)進(jìn)行了特別優(yōu)化,能使數(shù)據(jù)自由傳遞,進(jìn)行多種計(jì)算,讓不同部件同時(shí)運(yùn)轉(zhuǎn)起來,極大提高了器件利用率,提高AI運(yùn)算的效率。
寒武紀(jì)在終端發(fā)力之后,也在云端推出了產(chǎn)品。前不久的發(fā)布會上,不僅推出新一代終端智能處理器IP產(chǎn)品Cambricon1M,還發(fā)布了首款云端智能芯片CambriconMLU100,雙向發(fā)力讓業(yè)內(nèi)嘩然。寒武紀(jì)CEO陳天石表示,3年前就開始了兩顆芯片的研發(fā),時(shí)刻準(zhǔn)備著將寒武紀(jì)的產(chǎn)品放入云端。陳天石在發(fā)布會現(xiàn)場公布了在R-CNN算法下MLU100與TeslaV100和TeslaP4的計(jì)算延遲對比,數(shù)據(jù)顯示MLU100的計(jì)算延遲為125ms,TeslaV100的延遲為174ms,TeslaP4的延遲為1069ms。
現(xiàn)在來看,只有英偉達(dá)的體量,才有能力橫跨兩個(gè)領(lǐng)域垂直做深,甚至英特爾也是通過收購?fù)瓿刹季?。寒武紀(jì)的道路與英偉達(dá)相似,但從目前僅有的信息很難判斷寒武紀(jì)的產(chǎn)品性能,是否能超越英偉達(dá)TeslaV100、TeslaP4。比起各方多有涉足,業(yè)內(nèi)人士更希望寒武紀(jì)將垂直領(lǐng)域做得更深。
超越互聯(lián)網(wǎng)+的場景應(yīng)用
根據(jù)Tractica研究所的數(shù)據(jù),到2025年,AI年收入預(yù)計(jì)將達(dá)到368億美元。Tractica表示,迄今為止已經(jīng)確定了AI的27種不同細(xì)分行業(yè)以及191個(gè)使用案例。
UCLA博士李一雷認(rèn)為,人工智能落地兩個(gè)重要的點(diǎn)分別是自動駕駛和醫(yī)療,然而自動駕駛必須能通過各種極端情況下的驗(yàn)證才能上馬,輔助駕駛離現(xiàn)實(shí)比較接近。
作為AI的重頭戲,幾乎所有的AI芯片都在發(fā)力智能駕駛領(lǐng)域。因?yàn)槌鮿?chuàng)公司偏向端側(cè),應(yīng)用場景有所側(cè)重,像地平線這樣主攻算法+芯片的企業(yè),未來將在垂直領(lǐng)域做深,沿著規(guī)劃的三代架構(gòu),對芯片進(jìn)行逐年迭代,使其能力不斷升級,智能駕駛?cè)耘f是他們發(fā)力的重點(diǎn)行業(yè)領(lǐng)域。
相比而言,英偉達(dá)的核心雖然是GPU,但是它打造的是一個(gè)生態(tài)。自動駕駛所需要的運(yùn)算能力體現(xiàn)在云端和終端兩個(gè)方面,終端感知周圍環(huán)境,做出駕駛決策,而云端是將行駛的數(shù)據(jù),通過深度學(xué)習(xí)或者增強(qiáng)學(xué)習(xí)“訓(xùn)練”模型,最終應(yīng)用到車輛終端中。英偉達(dá)CEO黃仁勛預(yù)計(jì)明年自動駕駛的模擬和開發(fā)系統(tǒng)會成熟,2019年機(jī)器人出租車將飛速發(fā)展;2020-2021年底,第一輛全自動的L4級自動駕駛汽車上路。
豐富的生態(tài),尤其是云端建立深度學(xué)習(xí)的模型訓(xùn)練,使得英偉達(dá)的AI芯片擁有更為廣泛的應(yīng)用場景。其中寄予人類深厚希望的,更多是AI芯片在醫(yī)療上的賦能。以肺癌而言,以往醫(yī)生一般通過肉眼檢查CT掃描影像,從中尋找小塊結(jié)節(jié)并推斷結(jié)節(jié)的良性與惡性。但是肉眼的弊端是,如果早期結(jié)節(jié)很小便難以診斷,后期發(fā)現(xiàn)肺癌為時(shí)已晚,使得肺癌的存活率僅為17%。但有了GPU驅(qū)動的AI和深度學(xué)習(xí)技術(shù)來改變肺癌難以診斷的現(xiàn)狀。不僅易于診斷,還解放了醫(yī)生,肉眼檢查CT掃描影像花費(fèi)至少在十分鐘以上,現(xiàn)在只需要兩分鐘便可實(shí)現(xiàn)結(jié)節(jié)檢測及良惡性區(qū)分。據(jù)估計(jì),此系統(tǒng)一天可為醫(yī)生節(jié)約至少4小時(shí),從而使他們有更多的時(shí)間與病人交流或進(jìn)行更多研究工作。
AI芯片的加持,還給互聯(lián)網(wǎng)+未能有所改觀的傳統(tǒng)新領(lǐng)域帶來了新變化,比如與互聯(lián)網(wǎng)難以產(chǎn)生聯(lián)系的石油行業(yè)。據(jù)了解,每臺海上鉆井平臺每年大約會產(chǎn)生50TB的數(shù)據(jù),而其中只有不到1%的數(shù)據(jù)會被標(biāo)簽或分析??此破D難的數(shù)據(jù)分析現(xiàn)狀,恰恰給擁有海量計(jì)算能力的AI發(fā)揮巨大潛力的機(jī)會。
在勘探油氣藏的過程中,石油天然氣行業(yè)正在利用計(jì)算量越來越龐大的地震算法,用英偉達(dá)GPUAI解決方案進(jìn)行“事故預(yù)測、巖層辨別以及通過挖掘3D模型來創(chuàng)建高效的環(huán)境掃描,加快獲取鉆井許可的過程”,至少提速4—20倍。因強(qiáng)大的計(jì)算能力,使得斯倫貝謝、雪佛龍、道達(dá)爾、巴西石油以及雷普索爾等各大世界石油巨頭均部署了英偉達(dá)TeslaGPU,以加速地震處理的速度。
淘金熱,正在AI領(lǐng)域熱絡(luò)上映。不管是自動駕駛還是醫(yī)療、石油,這僅僅是AI淘金熱被發(fā)掘出來一小片領(lǐng)域,更多的機(jī)會還存在于國防、氣候、醫(yī)學(xué)、金融、生物信息等行業(yè)。比起互聯(lián)網(wǎng)+引起的效應(yīng),AI賦能的效果顯然更為革命與顯現(xiàn)。