【盤點國產(chǎn)芯片公司的發(fā)展之路】近日,自適應(yīng)和智能計算的全球領(lǐng)導(dǎo)企業(yè)賽靈思公司(Xilinx,Inc.)宣布完成對深鑒科技的收購。深鑒科技是一家總部位于北京的初創(chuàng)企業(yè),擁有業(yè)界領(lǐng)先的機器學(xué)習(xí)能力,專注于神經(jīng)網(wǎng)絡(luò)剪枝、深度壓縮技術(shù)及系統(tǒng)級優(yōu)化。
作為國內(nèi)為數(shù)不多的幾家智能芯片初創(chuàng)企業(yè),此次被美國FPGA廠商賽靈思收購,對于不少置身事外的人而言,唏噓不已——國產(chǎn)芯片公司的發(fā)展之路除了被收購和被破產(chǎn),還有什么?
深鑒科技有限公司聯(lián)合創(chuàng)始人,清華大學(xué)副教授汪玉在剛剛結(jié)束的CCAI2018會上表示:公司創(chuàng)立之初,就是做基于FPGA的深度學(xué)習(xí)解決方案,本身的目的就是希望將自己所研發(fā)的技術(shù)能夠更廣泛的應(yīng)用。
賽靈思是FPGA領(lǐng)域的領(lǐng)頭羊,也是公司的早期投資者,也在公司的發(fā)展過程中提供了不少的幫助。因此被賽靈思收購,公司的技術(shù)可以得到大規(guī)模的應(yīng)用,也樂得其所。正所謂由FPGA而來,到FPGA中去。
汪玉,博士,清華大學(xué)電子工程系長聘副教授,從事高能效電路與系統(tǒng)研究,發(fā)表論文200余篇,IEEE/ACM雜志文章40余篇;谷歌學(xué)術(shù)引用3000余次。
擔(dān)任ACMSIGDAE-News主編,IEEETCAD、TCSVT編委,國際會議FPT2012,ISVLSI2018技術(shù)委員會主席,DATE、GLSVLSI等多個會議的TrackChair,ISLPED2012-2016財務(wù)主席,DAC等領(lǐng)域頂級會議技術(shù)委員會委員。
ACM杰出演講者,ACMFPGA技術(shù)委員會亞太地區(qū)唯一成員。獲得FPGA17、NVMSA17、ISVLSI12最佳論文,以及9次國際會議最佳論文提名。16年獲得NSFC優(yōu)秀青年基金。
曾獲得2017年中國計算機學(xué)會科學(xué)技術(shù)獎技術(shù)發(fā)明獎一等獎、中關(guān)村高聚工程-創(chuàng)新領(lǐng)軍人才等獎項。深度學(xué)習(xí)FPGA加速器在2016年知識產(chǎn)權(quán)轉(zhuǎn)化入股北京深鑒科技有限公司,打造世界最先進(jìn)的FPGA深度學(xué)習(xí)平臺。
國產(chǎn)AI芯片初創(chuàng)公司涿鹿中原
AI芯片隨著人工智能的發(fā)展,近幾年也成為了行業(yè)的熱點。國內(nèi)初創(chuàng)的企業(yè)中,有寒武紀(jì)、深鑒科技、地平線、西井科技等公司。
寒武紀(jì)創(chuàng)始團隊源自中國科學(xué)院計算技術(shù)研究所,公司以處理器IP授權(quán)的形式與全世界同行快速共享最新的技術(shù)成果,并幫助全球客戶快速設(shè)計和生產(chǎn)具備人工智能處理能力的芯片產(chǎn)品。
目前,寒武紀(jì)已同時擁有終端AI處理器IP和云端高性能AI芯片兩條產(chǎn)品線,終端處理器IP產(chǎn)品已衍生出1A、1H、1M等多個型號,芯片有“MLU100”和“MLU200”,MLU100智能芯片(Cambricon-MLU100)。
深鑒科技的深度學(xué)習(xí)加速模塊,可用于智能IPC、NVR/DVR,深度學(xué)習(xí)加速卡可用于視頻結(jié)構(gòu)化服務(wù)器。其面向AI異構(gòu)計算平臺DPU(Deep-LearningProcessorUnit,深度學(xué)習(xí)處理器)自主研發(fā)的原創(chuàng)深度學(xué)習(xí)SDKDNNDK?(DeepNeuralNetworkDevelopmentKit),為DPU平臺各種深度學(xué)習(xí)應(yīng)用開發(fā)和部署提供的一套高效全棧式解決方案。
地平線成立于2015年,主要是做CNN、DNN、RNN的加速器,基于創(chuàng)新的人工智能專用處理器架構(gòu)BPU(BrainProcessingUnit),自主設(shè)計研發(fā)了中國首款全球領(lǐng)先的嵌入式人工智能視覺芯片——面向智能駕駛的征程(Journey)系列處理器和面向智能攝像頭的旭日(Sunrise)系列處理器,并向行業(yè)客戶提供“芯片+算法+云”的完整解決方案。
西井科技則是一家專注研究NeuromorphicEngineering神經(jīng)形態(tài)工程的類腦強人工智能公司,希望構(gòu)造一種模擬人腦神經(jīng)元工作原理而制造出的芯片。
其仿生類腦神經(jīng)元芯片——deepsouth(深南),具有”自我學(xué)習(xí),自我實時提高”的特點,而且集成度更高、模板更易更換,解決實時的復(fù)雜的智能問題功耗為傳統(tǒng)芯片在同一任務(wù)下的幾十分之一到幾百分之一。還有深度學(xué)習(xí)類腦神經(jīng)元芯片——deepwell(深井),學(xué)習(xí)與識別速度遠(yuǎn)遠(yuǎn)高于運行在通用硬件(例如,CPU,GPU)上的傳統(tǒng)方法(例如,CNN),且功耗更低。
初創(chuàng)公司紛紛跑步進(jìn)入AI芯片市場,是看中了其中的市場機遇,但芯片市場的生存難度有多大?
從業(yè)人士表示,芯片是一個高技術(shù)含量,高投入的行業(yè),其盈利要靠大規(guī)模鋪量才能成行。但芯片行業(yè)本身是一個經(jīng)驗市場,初出茅廬的企業(yè)很難獲得行業(yè)伙伴的信任。同時,芯片的價格也進(jìn)入了白熱化的競爭,國產(chǎn)初創(chuàng)公司很難在多重壓力下突圍。
此次深鑒科技被收購,也被視作一條國產(chǎn)芯片廠商的出路,但大部分芯片公司,還需要自己解決生存問題。
中科院計算所研究員陳云霽也表示了相同的疑慮:國內(nèi)初創(chuàng)的芯片公司,要想獲得市場的信任是比較困難的,因此一條較為容易的路線是,可以將技術(shù)通過IP的形式打包,嵌入到行業(yè)應(yīng)用的芯片中,這樣的做法相對可取。
陳云霽,中科院計算所研究員,博士生導(dǎo)師。陳云霽帶領(lǐng)團隊研制了國際上首個深度學(xué)習(xí)處理器芯片“寒武紀(jì)”,目前已經(jīng)應(yīng)用在千萬級智能終端上。
深度學(xué)習(xí)處理器論文多次獲得計算機體系結(jié)構(gòu)頂級國際會議最佳論文獎,受到上百個國際知名機構(gòu)跟蹤引用。
被Science雜志評價為深度學(xué)習(xí)處理器的先驅(qū)和領(lǐng)導(dǎo)者。曾獲全國創(chuàng)新爭先獎、中國青年科技獎、國家自然科學(xué)基金“優(yōu)秀青年基金”、國家萬人計劃“青年拔尖人才”、中科院青年科學(xué)家獎和中國計算機學(xué)會青年科學(xué)家獎,并被MIT技術(shù)評論評為全球35位杰出青年創(chuàng)新者(2015年度)。
自動駕駛AI芯片的萌芽期
國產(chǎn)人工智能芯片初創(chuàng)企業(yè),創(chuàng)立時間往往比較短,因此在技術(shù)成熟性以及行業(yè)經(jīng)驗上,都相對比較欠缺。芯片的研發(fā)、生產(chǎn)會花費巨額的費用,其成本的回收有賴于銷量。因此初創(chuàng)企業(yè)大都將產(chǎn)品擴張到了多個領(lǐng)域。汽車作為一個龐大的市場,自然也是兵家必爭之地。
2018年6月,深鑒宣布推出自主研發(fā)的ADAS系統(tǒng)DPhiAuto,而且還與日本、美國、德國車企簽下合同。深鑒科技CEO姚頌表示:最慢3年,搭載深鑒DPhiAuto系統(tǒng)的量產(chǎn)車就會推出。
DPhiAuto是基于FPGA的自動駕駛嵌入式AI計算平臺,可以為輔助駕駛系統(tǒng)提供車輛檢測、行人檢測、車道檢測、語義分割、交通標(biāo)志識別、可行駛區(qū)域檢測等深度學(xué)習(xí)算法功能,是一套針對環(huán)境感知技術(shù)打造的軟硬件協(xié)同產(chǎn)品。
地平線在2017年就推了面向汽車后裝ADAS市場的征程(Journey)系列處理器,西井科技CEO譚黎敏在剛剛結(jié)束的2018高工智能汽車開發(fā)者大會(武漢站)會上就表示:deepwell的微秒級目標(biāo)識別速度,實現(xiàn)超高速自動避障(大于200公里/小時),同時自主識別空中/道路物體、交通標(biāo)志/周邊靜、動態(tài)物體,實現(xiàn)無需互聯(lián)網(wǎng)的本地化、高速、低功耗、自我學(xué)習(xí)的自主主動智能駕駛。
自動駕駛的發(fā)展延緩性,在芯片領(lǐng)域同樣存在。汪玉表示,他們目前還只關(guān)注ADAS領(lǐng)域的芯片應(yīng)用,因為ADAS功能是未來數(shù)年內(nèi)最有可能大規(guī)模量產(chǎn)普及的,相應(yīng)的處理芯片也才有大量生產(chǎn)、銷售的機會。
自動駕駛AI芯片屬于終端處理芯片,對功耗和算力的要去都比較高,業(yè)內(nèi)通常是以Tops/w的單位來表示芯片的性能,及單位瓦數(shù)內(nèi)每秒處理數(shù)據(jù)的速度。
業(yè)內(nèi)以算力著稱的NVIDIA,最新一代GPU可以達(dá)到1Tops/w,目前處理的圖片都是百萬像素級的,未來隨著要求的提升,圖像清晰度也會與日俱增,對應(yīng)的算力也要跟得上。
目前只有ASIC的算力,可以達(dá)到10Tops/w,而大部分FPGA都處在10Gops/w區(qū)間,經(jīng)過加速處理的FPGA也可以達(dá)到GPU1Tops/w的水平。
想要讓算力達(dá)到更高水平,無疑還需要做更多的努力,但在技術(shù)以及實踐上,需要克服更多未知的困難。而要讓自動駕駛AI芯片處理速度、功耗滿足瞬時性、可靠性等苛刻要求,這些坎兒又是必須要邁過的。
美國杜克大學(xué)電子與計算機工程系教授,昆山杜克大學(xué)應(yīng)用科學(xué)與工程研究院院長和大數(shù)據(jù)研究中心主任李昕也表示了類似的觀點,他以Uber事故為例,車規(guī)級AI芯片的軟硬件要求、規(guī)范比傳統(tǒng)AI芯片要高數(shù)個量級,在穩(wěn)定性和冗余性上都有特殊的要求。
因此,從AI芯片發(fā)展的階段上來看,目前尚處早期。
李昕,現(xiàn)為美國杜克大學(xué)電子與計算機工程系教授,昆山杜克大學(xué)應(yīng)用科學(xué)與工程研究院院長和大數(shù)據(jù)研究中心主任,美國NSFCAREER獎獲得者,IEEEFellow,大數(shù)據(jù)與人工智能專家,被富士康集團創(chuàng)始人、董事長郭臺銘先生譽為“世界知名的制造業(yè)大數(shù)據(jù)分析專家”。
李昕曾為美國卡內(nèi)基梅隆大學(xué)電子與計算機工程系助理教授和副教授,曾創(chuàng)立美國Xigmix公司,并擔(dān)任公司的首席技術(shù)官,后被Synopsys收購。出版著作4本,在國際頂級期刊發(fā)表論文50余篇,在國際頂級學(xué)術(shù)會議發(fā)表論文130余篇,獲得6次最佳論文獎和6次最佳論文提名。擔(dān)任國際頂級期刊IEEETrans.onCAD常務(wù)主編,IEEETrans.onBiomedicalEngineering、ACMTrans.onDAES、IEEED&T等副主編。