作為AI芯片后入者的三星正提著大刀趕來(lái):據(jù)外媒爆料,三星已經(jīng)接近完成一款A(yù)I芯片的研發(fā),其性能已經(jīng)堪比蘋(píng)果的A11和華為麒麟970,三星極有可能在2月25日舉行的MWC2018大會(huì)上發(fā)布GalaxyS9的同時(shí),展示其新AI技術(shù)的能力。
據(jù)《韓國(guó)先驅(qū)報(bào)》網(wǎng)站報(bào)道,三星電子已經(jīng)基本完成第一款神經(jīng)處理單元(NPU)的開(kāi)發(fā)工作,準(zhǔn)備在今年晚些時(shí)候部署到設(shè)備上。NPU被廣泛稱(chēng)為AI芯片,據(jù)稱(chēng)三星將在即將發(fā)布的智能手機(jī)上搭載這款芯片,此舉有助于其手機(jī)趕超競(jìng)爭(zhēng)對(duì)手。
“據(jù)三星內(nèi)部人士爆料,三星已經(jīng)基本完成了服務(wù)器AI芯片的開(kāi)發(fā)工作,預(yù)計(jì)該芯片將出售給服務(wù)器廠(chǎng)商?!币幻鸄I專(zhuān)家告訴《韓國(guó)先驅(qū)報(bào)》。
除了CPU、GPU等之外,智能手機(jī)上再加上NPU的話(huà),手機(jī)本身就可以在沒(méi)有云服務(wù)器幫助的情況下處理、分析和存儲(chǔ)智能手機(jī)上產(chǎn)生的數(shù)據(jù)。NPU被廣泛認(rèn)為是智能手機(jī)的大腦。
目前,三星在這個(gè)領(lǐng)域落后于蘋(píng)果和華為這兩個(gè)最大的競(jìng)爭(zhēng)對(duì)手,后兩者都已經(jīng)推出了移動(dòng)端的AI芯片。蘋(píng)果公司去年發(fā)布了iPhoneX,使用NPU實(shí)現(xiàn)臉部識(shí)別和動(dòng)畫(huà)表情符號(hào)等人們熟知的功能。緊接著,華為推出了一款能夠隨時(shí)間學(xué)習(xí)用戶(hù)習(xí)慣的NPU,部署在Mate10Pro手機(jī)上。
盡管三星對(duì)于這個(gè)市場(chǎng)是后來(lái)者,但那位“AI專(zhuān)家”對(duì)韓國(guó)先驅(qū)報(bào)稱(chēng),“三星已經(jīng)達(dá)到蘋(píng)果和華為的技術(shù)水平,而且在今年下半年肯定會(huì)推出更好的芯片?!睋?jù)報(bào)道,三星的芯片每秒運(yùn)行的速度超過(guò)了蘋(píng)果的A11和華為的麒麟970。
此外,同一消息人士透露,三星可能將在2月25日舉行的MWC2018大會(huì)上發(fā)布GalaxyS9的同時(shí),展示其新AI技術(shù)的能力。
據(jù)稱(chēng)三星在人工智能相關(guān)項(xiàng)目上投入了大量資金,并與韓國(guó)各大學(xué)的教授和研究人員合作,以制造出相比競(jìng)爭(zhēng)對(duì)手更安全、更高效的芯片。
該消息人士透露,三星還正在為GalaxyNote9智能手機(jī)開(kāi)發(fā)一款增強(qiáng)的NPU,該款手機(jī)預(yù)計(jì)在今年9月份發(fā)布。就像之前的GalaxyNote7和Note8一樣,Note9可能成為三星的一個(gè)轉(zhuǎn)折點(diǎn)。
AI手機(jī)進(jìn)入戰(zhàn)國(guó)時(shí)代,芯片研發(fā)馬太效應(yīng)漸顯
正如上文所說(shuō),三星的這款A(yù)I芯片,主要的競(jìng)爭(zhēng)對(duì)手是蘋(píng)果和華為。目前,蘋(píng)果的iPhoneX和華為的Mate10(Pro)、V10等系列手機(jī)均已經(jīng)使用人工智能芯片,成為AI手機(jī)的領(lǐng)導(dǎo)者。
iPhoneX中的“A11生物神經(jīng)網(wǎng)絡(luò)引擎”(A11bionicneuralengine)芯片,每秒運(yùn)算次數(shù)最高可達(dá)6000億次,相當(dāng)于0.6TFlops(寒武紀(jì)NPU則是1.92TFlops,每秒可以進(jìn)行19200次浮點(diǎn)運(yùn)算),采用了六核心設(shè)計(jì),由2個(gè)高性能核心與4個(gè)高能效核心組成。相比A10,其中兩個(gè)性能核心的速度提升了25%,四個(gè)能效核心的速度提升了70%。工藝方面,A11采用了臺(tái)積電10nmFinFET工藝,集成了43億個(gè)晶體管。
A11能幫助加速人工智能任務(wù),包括FaceID,Animoji和AR應(yīng)用程序。A11同時(shí)支持CoreML,這是蘋(píng)果在WWDC開(kāi)發(fā)者大會(huì)上推出的一款新型機(jī)器學(xué)習(xí)框架。CoreML支持所有主要的神經(jīng)網(wǎng)絡(luò),如DNN、RNN、CNN等,開(kāi)發(fā)者可以把訓(xùn)練完成的機(jī)器學(xué)習(xí)模型封裝進(jìn)App之中。
華為麒麟970芯片,首次采用臺(tái)積電10nm工藝,集成55億個(gè)晶體管(驍龍835是31億顆,蘋(píng)果A10是33億顆),功耗降低20%。采用4個(gè)CortexA73核心,4個(gè)CortexA53核心,GPU為具有12個(gè)核心的Mali-G72MP12,每秒處理速度可達(dá)萬(wàn)億次。麒麟970芯片內(nèi)置全新升級(jí)自研相機(jī)雙ISP,支持人工智能場(chǎng)景識(shí)別、人臉追焦、智能運(yùn)動(dòng)場(chǎng)景檢測(cè),同時(shí)夜拍效果再次升級(jí)?;鶐Х矫妫梓?70采用了更先進(jìn)的4.5GLTE技術(shù),支持全球最高是LTECat.18規(guī)格,實(shí)現(xiàn)目前業(yè)界最高的1.2Gbps峰值下載速率。同時(shí)內(nèi)建TEE和inSE安全引擎,擁有更高的安全性。
不過(guò),三星、蘋(píng)果、華為“三國(guó)殺”的局面不會(huì)持續(xù)很久。
由于智能手機(jī)的競(jìng)爭(zhēng)進(jìn)入到嚴(yán)重的同質(zhì)化階段,跟全面屏一樣,人工智能芯片將會(huì)是手機(jī)廠(chǎng)商下一個(gè)“標(biāo)配”的重點(diǎn)。除了三星、蘋(píng)果、華為三巨頭,還有很多廠(chǎng)商涌入智能手機(jī)和AI芯片的競(jìng)爭(zhēng),例如最近傳聞將于2018年下半年上市的小米——2017年2月,小米自主研發(fā)的手機(jī)芯片澎湃S1問(wèn)世,成為國(guó)產(chǎn)手機(jī)中第二家擁有自主研發(fā)芯片能力的手機(jī)廠(chǎng)商。
人工智能芯片對(duì)手機(jī)性能提升、人機(jī)交互等功能上有巨大的想象空間,AI手機(jī)特別是高端旗艦AI手機(jī)的研發(fā)能力是能夠拉開(kāi)與對(duì)手差距的重要一步,手機(jī)市場(chǎng)格局也會(huì)隨著研發(fā)能力逐漸分化,強(qiáng)者更強(qiáng),弱者更弱的馬太效應(yīng)將逐漸凸顯。
移動(dòng)端AI芯片,誰(shuí)能笑到最后?
由于GPU存在功耗瓶頸,同時(shí)用戶(hù)越來(lái)越關(guān)心個(gè)人隱私安全與時(shí)效性,終端智能芯片的發(fā)展順應(yīng)時(shí)代所需。
終端的智能芯片則需要同時(shí)具備高性能與低功耗的特征。此外,終端也涵蓋了不同的應(yīng)用場(chǎng)景,都需要針對(duì)具體需求,在功耗、延遲、數(shù)據(jù)吞吐量、加速器方案的選擇上做出調(diào)整和優(yōu)化。
新智元對(duì)部分移動(dòng)端能夠支撐AI功能的芯片做了梳理:
谷歌:PixelVisualCore
2017年10月,Google在其官方博客上公開(kāi)了Pixel2中使用的一顆專(zhuān)用圖像處理協(xié)處理器——PixelVisualCore。這是Google在用于服務(wù)器的TPU之后推出的第二顆芯片,這次針對(duì)的是移動(dòng)端。PixelVisualCore由Google與Intel合作設(shè)計(jì)開(kāi)發(fā),主要用于圖像處理和機(jī)器學(xué)習(xí)。這塊芯片由8個(gè)IPU(每個(gè)包含512個(gè)ALU)+1個(gè)Cortex-A53核心組成,最大可提供3TFLOPS浮點(diǎn)運(yùn)算能力。
高通:驍龍845處理器
說(shuō)到手機(jī)芯片,怎能不提高通。高通在2017年12月初正式發(fā)布了驍龍845移動(dòng)平臺(tái)。驍龍845處理器采用10納米LPP制程工藝,其中GPU采用Adreno630,X20LTE調(diào)制解調(diào)器、WiFi、影像方面使用Spectra280ISP,以及Hexagon685DSP協(xié)處理器、音質(zhì)方面使用高通AqsticAudio、CPU采用四個(gè)2.8GHz大核+四個(gè)1.8GHz小核+2MB緩存的Kryo385CPU、移動(dòng)安全芯片,另在845中新增了一塊獨(dú)立內(nèi)存。AI方面,驍龍845主要通過(guò)Kryo385定制架構(gòu)、Adreno630、Hexagon685在終端異步運(yùn)算數(shù)據(jù)。相比835,驍龍845在AI上的計(jì)算能力是835的三倍,目前已經(jīng)可以支持S845GoogleTensorFlow、FacebookCaffe以及OpenNeuralNetworkExchange在內(nèi)的多款主流深度學(xué)習(xí)框架。
MovidiusVPUMyriad2
2016年9月,Intel發(fā)表聲明收購(gòu)了Movidius。Movidius專(zhuān)注于研發(fā)高性能視覺(jué)處理芯片?,F(xiàn)任CEO是原來(lái)德州儀器OMAP部門(mén)的總經(jīng)理,它的技術(shù)指導(dǎo)委員會(huì)也是實(shí)力強(qiáng)大,擁有半導(dǎo)體和處理器行業(yè)的元老級(jí)人物——被蘋(píng)果收購(gòu)的P.A.Semi創(chuàng)始人丹尼爾·多伯普爾(DanielDobberpuhl),卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)/計(jì)算機(jī)視覺(jué)專(zhuān)家金出武雄,以及前蘋(píng)果iPhone和iPod部門(mén)工程副總裁、資深工程師大衛(wèi)·圖普曼(DavidTupman)三人坐鎮(zhèn)。
其最新一代的Myriad2視覺(jué)處理器主要由SPARC處理器作為主控制器,加上專(zhuān)門(mén)的DSP處理器和硬件加速電路來(lái)處理專(zhuān)門(mén)的視覺(jué)和圖像信號(hào)。這是一款以DSP架構(gòu)為基礎(chǔ)的視覺(jué)處理器,在視覺(jué)相關(guān)的應(yīng)用領(lǐng)域有極高的能耗比,可以將視覺(jué)計(jì)算普及到幾乎所有的嵌入式系統(tǒng)中。該芯片已被大量應(yīng)用在Google3D項(xiàng)目Tango手機(jī)、大疆無(wú)人機(jī)、FLIR智能紅外攝像機(jī)、??瞪铐盗袛z像機(jī)、華睿智能工業(yè)相機(jī)等產(chǎn)品中。
寒武紀(jì)1H8和1H16
寒武紀(jì)于2016年發(fā)布了全球首款商用深度學(xué)習(xí)專(zhuān)用處理器IP——寒武紀(jì)1A處理器。寒武紀(jì)1A的橫空出世打破了多項(xiàng)記錄,受到了業(yè)界廣泛關(guān)注,入選了第三屆世界互聯(lián)網(wǎng)大會(huì)評(píng)選的十五項(xiàng)“世界互聯(lián)網(wǎng)領(lǐng)先科技成果”。2017年11月,在公司首次發(fā)布會(huì)上,CEO陳天石介紹了三款全新的智能處理器IP產(chǎn)品,其中就包括面向低功耗場(chǎng)景視覺(jué)應(yīng)用的寒武紀(jì)1H8、擁有更廣泛通用性和更高性能的寒武紀(jì)1H16。
陳天石介紹說(shuō),與寒武紀(jì)1A相比,新品在功耗、能效比、成本開(kāi)銷(xiāo)等方面進(jìn)行了優(yōu)化,性能功耗比再次實(shí)現(xiàn)飛躍,適用范圍覆蓋了圖像識(shí)別、安防監(jiān)控、智能駕駛、無(wú)人機(jī)、語(yǔ)音識(shí)別、自然語(yǔ)言處理等各個(gè)重點(diǎn)應(yīng)用領(lǐng)域。
地平線(xiàn)旭日和征程
2017年12月20日,地平線(xiàn)在北京舉行發(fā)布會(huì),推出的征程(Journey)和旭日(Sunrise)兩款面向計(jì)算機(jī)視覺(jué)的處理器,分別用于無(wú)人駕駛和智能攝像頭。旭日和征程都屬于嵌入式人工智能視覺(jué)芯片,分別面向智能駕駛和智能攝像頭。地平線(xiàn)首席芯片架構(gòu)師周峰對(duì)新智元介紹,這兩款芯片,芯片性能可達(dá)到1Tops,實(shí)時(shí)處理1080P@30幀,每幀可同時(shí)對(duì)200個(gè)目標(biāo)進(jìn)行檢測(cè)、跟蹤、識(shí)別。典型功耗做到1.5w。
深鑒聽(tīng)濤
2017年10月24日,深鑒科技召開(kāi)發(fā)布會(huì),正式對(duì)外宣布完成約4000萬(wàn)美元A+輪融資,由螞蟻金服與三星風(fēng)投領(lǐng)投。CEO姚頌還公布了一系列芯片計(jì)劃,由深鑒自主研發(fā)的芯片“聽(tīng)濤”、“觀(guān)海”將于2018年第三季度面市。
其中,“聽(tīng)濤”將于2018年上半年完成產(chǎn)品裝載,該系列芯片采用臺(tái)積電28納米制程,核心使用深鑒自己的亞里士多德架構(gòu),峰值性能1.1瓦4.1TOPS。亞里士多德架構(gòu)針對(duì)卷積神經(jīng)網(wǎng)絡(luò)而設(shè)計(jì)。目前,卷積神經(jīng)網(wǎng)絡(luò)一般用來(lái)處理圖像相關(guān)的智能問(wèn)題,而此架構(gòu)靈活與可擴(kuò)展的特性使它可被應(yīng)用于各種不同規(guī)格的終端中。
異構(gòu)智能:NovuTensor
在今年CES上,NovuMind(中文名稱(chēng)“異構(gòu)智能”)向業(yè)界首次展示其自主研發(fā)的第一款高性能、低功耗的AI芯片NovuTensor,號(hào)稱(chēng)可能是除了TPU之外,世界上跑得最快的單芯片。
NovuMind方面表示,這是截至目前世界上唯一能夠?qū)嶋H運(yùn)行的、性能達(dá)到主流GPU/TPU水平而性能/功耗比卻遠(yuǎn)超主流GPU/TPU的芯片——在功耗12w的情況下,NovuTensor每秒可識(shí)別300張圖像,每張圖像上,最多可檢測(cè)8192個(gè)目標(biāo),相比目前最先進(jìn)的桌面服務(wù)器GPU(250W,每秒可識(shí)別666張圖像),僅使用1/20電力即可達(dá)到其性能的1/2;而相比目前最先進(jìn)的移動(dòng)端或嵌入式芯片,相同用電的情況下,性能是其三倍以上。據(jù)了解,本次CES展示的僅僅是FPGA版本,等正在流片的ASIC芯片正式出廠(chǎng),性能將提高4倍,耗電將減少一半,耗能不超過(guò)5瓦、可進(jìn)行15萬(wàn)億次運(yùn)算的超高性能。
GTI光矛處理器
成立于2017年初的GyrfalconTechnologyInc.(簡(jiǎn)稱(chēng)GTI)近期以“光矛處理器Lightspeeur2801S”引發(fā)業(yè)內(nèi)關(guān)注,這也是一家由中國(guó)芯片老兵創(chuàng)立的公司,總部位于美國(guó)硅谷。其芯片方案基于APiM架構(gòu),有28000個(gè)并行神經(jīng)計(jì)算核,真正支持片上并行與原位計(jì)算,不需要使用外部存儲(chǔ)單元,克服了由存儲(chǔ)器帶寬而導(dǎo)致的性能瓶頸,在效率能耗比方面表現(xiàn)卓越,達(dá)到9.3Tops/Watt,無(wú)論在訓(xùn)練模式還是推理模式下均可提供高密度計(jì)算性能。
在今年的CES上,GTI推出了內(nèi)置Lightspeeur2801S芯片的Laceli人工智能計(jì)算棒,可以在1瓦的功率下提供超過(guò)每秒9.3萬(wàn)億次浮點(diǎn)運(yùn)算的性能,超越英特爾Movidius的神經(jīng)計(jì)算棒,后者每瓦功率范圍的運(yùn)算力則是0.1萬(wàn)億次。Laceli人工智能計(jì)算棒可以在多種深度學(xué)習(xí)場(chǎng)景中應(yīng)用,包括圖像和視頻識(shí)別、理解及描述,自然語(yǔ)言理解、自然語(yǔ)言處理等。