上周,蘋果公司在剛剛落成投入使用的“飛船”新總部(ApplePark)舉行2017年秋季新品發(fā)布會,整場發(fā)布會基本被iPhoneX搶盡了風頭(想采訪一下iPhone8/8p的心理陰影面積)。
iPhone8/8p和iPhoneX都搭載了蘋果自研的A11Bionic(仿生)芯片。雖然蘋果全程并沒有在這款芯片上花太多功夫介紹,但我們?nèi)耘f知道它集成了一個專用于機器學習的硬件——“神經(jīng)網(wǎng)絡引擎(NeuralEngine)”
可別小看了這塊A11,通過智東西仔細研究發(fā)現(xiàn),它不僅是iPhoneX中一眾“黑科技”的來源,而且蘋果為了打造這塊芯片早在9年前就開始了技術布局。
一、參數(shù)亮相,跑分爆表了
在介紹A11里專門用于機器學習的“神經(jīng)網(wǎng)絡引擎”之前,我們先來看看A11的基本參數(shù)。
工藝方面,A11采用了臺積電10nmFinFET工藝,集成了43億個晶體管(上一代采用16nm工藝的A10Fusion集成了33億個晶體管,華為麒麟970則用10nm工藝集成了55億個)。
A11搭載了64位ARMv8-A架構的6核CPU,其中包括2個名為“Monsoon”的性能核(performancecore)和4個名為“Mistral”的能效核(high-eggiciencycore),性能核比上一代A10里的快了25%,能效核則快了70%。
而且,與A10不同,A11中使用了蘋果自研的第二代新型性能控制器,允許6個CPU內(nèi)核同時使用,整體性能比上一代快了70%。
至于為什么分為性能核和能效核呢?當手機進行發(fā)短信、瀏覽網(wǎng)頁等輕量任務時,系統(tǒng)會選擇調(diào)用能耗更低的能效核(high-eggiciencycore),而當手機需要運行對計算能力要求更高的軟件時,則需要動用性能核(performancecore)進行處理,借此可以有效延長平均電池壽命。搭載了A11的iPhoneX在充滿電后,將會比iPhone7延長2個小時的待機時間。
A11的另外一大亮點就是首次搭載了蘋果自研的GPU,這是一款3核GPU,性能相比A10Fusion提升30%,只需要一半的功耗就能達到A10的表現(xiàn)。這是今年4月蘋果宣布和英國GPU設計公司ImaginationTechnologies“分手”后推出的首款自研GPU,針對AR、沉浸式3D游戲等方面都進行了優(yōu)化,比A10快了30%。
A11里還集成了蘋果自研的ISP、自研的視頻編解碼器等等。從種種強調(diào)的“自研”我們不難發(fā)現(xiàn),蘋果已經(jīng)越來越強調(diào)架構的自主化。在徹底跟老朋友ImaginationTechnologies分手后(并且導致人家股價斷崖式下跌70%后),蘋果的下一個自研目標也許會移到基帶技術上,與高通曠日持久的專利訴訟案件算得上是前兆了。
此外,我們也可以從A11在Geekbench的跑分上一窺究竟:在Geekbench中有A11的幾個跑分,其中單核性能最高的是4274,多核性能最高的是10438,而取這些跑分平均值后,單核性能是4169,多核性能是9836。
這是什么概念呢?跟上一代A10的“單核成績3332,多核成績5558”比起來,A11在兩方面的性能有接近30%和50%的飆升。而iPadPro中的A10X單核性能平均在3900左右,而多核性能是9200左右,依然弱于A11。
而Android陣營的種子選手——高通驍龍835的GeekBench成績?yōu)閱魏?000左右,多核6500左右。
二、A11就是“人工智能芯片”
這次,蘋果在自家的A11Bionic芯片上搭載了一個專用于機器學習的硬件——“神經(jīng)網(wǎng)絡引擎(neuralengine)”。
現(xiàn)在所謂的手機處理器,比如高通的835、蘋果的A11、麒麟970等,實際上所指的是一個“處理器包”封裝在一起,這個計算包專業(yè)一點說叫Soc(System-on-a-Chip),高大上的說法是“計算平臺”;根據(jù)分工不同,很多專用功能的處理單元加進來,比如我們最熟悉的是GPU,現(xiàn)在這個包里的獨立單元數(shù)量已經(jīng)越來越大,比如ISP(圖像處理)、Modem(通信模塊)、DSP(數(shù)字信號處理)等。
不同的數(shù)據(jù)進來,交給不同特長的計算模塊來處理將會得到更好的效果、更高的能效比,A11的神經(jīng)網(wǎng)絡引擎(neuralengine)跟麒麟970的NPU一樣,是在手機處理器平臺新加入的一個擅長神經(jīng)網(wǎng)絡計算的硬件模塊。
而這也是為什么從20nm、16nm、到現(xiàn)在的10nm、以及研發(fā)中的7nm,各大芯片設計商、代工商都在拼命把芯片技術往小了做,為的就是在不影響芯片大小的前提下擠進更多的獨立處理單元。
A11的神經(jīng)網(wǎng)絡引擎采用雙核設計,每秒運算次數(shù)最高可達6000億次,相當于0.6TFlops(寒武紀NPU則是1.92TFlops,每秒可以進行19200次浮點運算),以幫助加速人工智能任務,即專門針對FaceID,Animoji和AR應用程序的ASIC(專用集成電路/全定制AI芯片)。
有了神經(jīng)網(wǎng)絡引擎,蘋果高級副總裁PhilSchiller很有底氣的表示:
“A11Bionic是一款智能手機到目前為止所能擁有的最強勁、最智能的芯片。而基于ASIC的深度學習,實現(xiàn)了高準確率之外,還能比基于通用芯片(GPU、FPGA)的方案減少功耗?!?/p>
不過,蘋果對這款神經(jīng)網(wǎng)絡引擎的功耗、實測性能等方面都沒有進一步披露。
A11同時也支持CoreML,這是蘋果在今年WWDC開發(fā)者大會上推出的一款新型機器學習框架,能讓開發(fā)者更方便地將機器學習技術整合到自己的App中。CoreML支持所有主要的神經(jīng)網(wǎng)絡,如DNN、RNN、CNN等,開發(fā)者可以把訓練完成的機器學習模型封裝進App之中。
三、買買買,買出來的AI帝國
從去2010年開始,蘋果就沒有停止過收購人工智能創(chuàng)企的步伐,并且每次給出的都是慣常聲明:“蘋果會不時收購規(guī)模較小的科技公司。我們通常不討論目的或計劃?!狈浅S小笆铝朔饕氯?,深藏功與名”的意思。
而且,每個被蘋果收購的公司都會立即關閉對外的產(chǎn)品和服務,像是忽然從世界消失一般。
收購芯片廠商
以芯片為例,早在2008年,蘋果就以2.78億美元收購了2003年成立加州的高性能低功耗處理器制造商PASemi。
隨后在2010年,蘋果以1.21億美元收購了1997年成立的美國德州半導體邏輯設計公司Intrinsity,專注于設計較少晶體管、低能耗同時具備高性能的處理器。
2011年年底,蘋果又以3900萬美元的價格收購了以色列閃存控制器設計公司Anobit。
2013年8月1日,蘋果收購了成立于2007年的加州半導體公司PassifSemiconductor,其專長于低功耗無線通訊芯片(大膽地猜測一下AppleWatch的芯片技術是不是來自這里)。
其后的2015年底,蘋果再次斥資1820萬美元,收購了一間位于加州圣何塞北部的面積7萬平方英尺(6500平方米)的芯片制造工廠。這座工廠原屬于芯片制造商MaximIntegratedProducts,其設施包括了芯片制造工具,而且工廠地址靠近三星半導體公司。
從以上一連串的買買買我們可以看到,蘋果的芯片布局早在近十年前就開始了。
除了芯片之外,從2010年至今,蘋果已經(jīng)陸續(xù)收購了四五十家創(chuàng)企,包括語音識別、圖像/面部識別、計算機視覺、AR、數(shù)據(jù)挖掘、機器學習、地圖、定位等等,而這其中幾個比較具備代表性的有:
收購面部識別/表情追蹤廠商——Animoji和FaceID的技術來源
2010年,蘋果以2900萬美元收購瑞典面部識別創(chuàng)企PolarRose,他們開發(fā)的面部識別程序可以可以為用戶自動圈出照片中的人臉。
2015年11月,蘋果收購《星球大戰(zhàn)》背后的動作捕捉技術公司Faceshift,這家蘇黎世的創(chuàng)業(yè)公司開發(fā)了實時追蹤人臉表情,然后再用動畫表現(xiàn)出來的技術。該技術還可以實現(xiàn)面部識別。
2016年1月,蘋果收購了加州AI初創(chuàng)Emollient,該公司使用人工智能技術讀取圖片中的面部表情。
2017年2月,蘋果以200萬美元收購了面部識別以色列創(chuàng)企RealFace,該公司開發(fā)了一種獨特的面部識別技術,其中整合人工智能并將人類的感知帶回數(shù)字過程。
收購AR引擎巨頭
2015年5月,蘋果收購AR引擎巨頭德國Metaio公司。彼時Metaio與Vuforia并肩稱霸AR引擎行業(yè),Metaio擁有約15萬名開發(fā)者,Vuforia則擁有大約18萬,兩家的SDK開發(fā)者占到了當時整個市場的95%以上,在AR的行業(yè)地位有如Windows和MacOS之于PC。這個收購舉措,可以看作是ARkit的技術來源。
收購25年德國老牌眼球追蹤企業(yè)
而離現(xiàn)在最近的一次收購,就是蘋果今年6月時宣布收購德國老牌眼動追蹤企業(yè)SMI(SensoMotoricInstruments)。其歷史要追溯到1991年,SMI從柏林自由大學學術醫(yī)療研究院剝離出來,獨自成立眼球追蹤技術公司,迄今已經(jīng)有超過25年的發(fā)展歷史了。產(chǎn)品包括面向企業(yè)與研發(fā)機構的眼球追蹤設備/應用、醫(yī)療醫(yī)療眼控輔助設備、手機、電腦、VR設備等的眼控技術支持等。
目前,眼球追蹤技術已經(jīng)被集成在了iPhoneX里。在用FaceID解鎖時,只要你眼睛沒有看著屏幕,屏幕也是不會解鎖的。
四、用來干啥:FaceID背后的結構光學技術
既然是“人工智能芯片”,當然是用來做人工智能——人臉識別、圖像識別、面部表情追蹤、語音識別、NLP、SLAM等等。
而A11的神經(jīng)網(wǎng)絡引擎第一個重要的應用就是iPhoneX的刷臉解鎖——FaceID。
雖然刷臉解鎖并不是什么石破天驚的新技術,但是蘋果的FaceID解鎖跟普通的基于RGB圖像的人臉識別解鎖不同。寒武紀架構研發(fā)總監(jiān)劉少禮博士說:
“我們這次對蘋果A11的AI引擎了解不多,特別是功耗、實測性能等方面蘋果發(fā)布會基本沒有提。個人覺得iPhoneX這次最大的亮點是距離傳感器,用來支持3D的FaceID,這個功能在業(yè)內(nèi)還是引起了不小震動,后續(xù)會給予這功能開發(fā)出不少有趣的應用。通過結構光發(fā)射器和紅外攝像頭配合,可以捕捉人臉的深度信息,比之前用2D圖像作人臉識別進步了很多?!?/p>
根據(jù)原理和硬件實現(xiàn)方式的不同,行業(yè)內(nèi)所采用的3D機器視覺主要有三種:結構光、TOF時間光、雙目立體成像。
三種主流的3D視覺方案代表性產(chǎn)品
雙目立體成像方案軟件算法復雜,技術還不成熟;結構光方案技術成熟,功耗低,平面信息分辨率高,但是容易受光照影響,識別距離近;TOF方案抗干擾性好,識別距離遠,但是平面分辨率低,功耗較大。
綜合來看,結構光方案更加適合消費電子產(chǎn)品前置近距離攝像,可應用于人臉識別、手勢識別等方面,TOF方案更加適合消費電子產(chǎn)品后置遠距離攝像,可應用于AR、體感交互等方面。
iPhoneX的FaceID采用了人工智能加持的結構光方案:數(shù)據(jù)采集由該機正面上方的景深感知攝像機(即“劉海兒”,TrueDepthCameraSystem)完成,其紅外線發(fā)射器可以發(fā)射3萬個偵測點,利用神經(jīng)引擎(NeuralEngine)將反射回來的數(shù)據(jù)與儲存在A11芯片隔區(qū)內(nèi)的數(shù)據(jù)進行對比,實現(xiàn)用戶面部的3D讀取與處理。通過神經(jīng)網(wǎng)絡訓練的加持,F(xiàn)aceID失誤率僅為百萬分之一,遠小于TouchID的五萬分之一。
與此同時,iPhoneX還具備眼球追蹤功能,在你面對屏幕,但是眼睛沒有看著它的時候,也是不會解鎖的。所以,這樣的人臉解鎖是照片騙不了的。
而且,蘋果的軟件工程高級副總裁CraigFederighi曾表示,“我們不會在用戶注冊FaceID時收集數(shù)據(jù),它會保留在你的設備上,不會被發(fā)送到云端進行訓練。”符合蘋果一貫的“用戶隱私為上”理念。
最為神奇的是,用戶面容適應(化妝、佩戴眼鏡、長胡子、隨著年齡增長而變?nèi)莞淖兊龋┻^程需要用到的深度學習訓練也是在本地完成的。深度學習分為訓練(Training)和推理/應用(Inference)兩部分,訓練階段所需的計算量比應用階段的要大上許多。
另一方面,計算與訓練的本地化也有助于讓Siri變得更加智能。畢竟有不少人認為由于蘋果對用戶的隱私過于重視,導致Siri發(fā)展較慢,競爭對手們后來居上。
此外,在A11的加成下,iPhoneX前頭“劉海兒”實現(xiàn)的臉部追蹤技術還可以用于個人定制化表情Animoji(能捕捉并分析50多種不同的肌肉運動)、AR濾鏡等,新的互動的方式有望提高用戶的參與度和粘性,提高AR社交平臺的經(jīng)濟價值。而3D視覺所提供的景深信息和建模能力是現(xiàn)有普通攝像頭無法比擬的。
而iPhoneX還搭載了全新陀螺儀和加速計,刷新率達到60fps,可以實現(xiàn)準確的動作追蹤以及很好的渲染效果。在發(fā)布會上,蘋果全球市場營銷高級副總裁PhilSchiller是這么說的:“這是第一款真正為AR打造的智能手機?!?/p>
五、火熱的AI芯片產(chǎn)業(yè)
當前人工智能芯片主要分為GPU、ASIC、FPGA。代表分別為NVIDIATesla系列GPU、Google的TPU、Xilinx的FPGA。此外,Intel還推出了融核芯片XeonPhi,適用于包括深度學習在內(nèi)的高性能計算,但目前根據(jù)公開消息來看在深度學習方面業(yè)內(nèi)較少使用。
其中,蘋果的A11、寒武紀的A1、谷歌的TPU等都屬于ASIC,也就是專用集成電路。
ASIC(ApplicationSpecificIntegratedCircuit)。顧名思義,ASIC就是根據(jù)特定的需求而專門設計并制造出的芯片,能夠優(yōu)化芯片架構,針對性的提出神經(jīng)網(wǎng)絡計算處理的指令集,因而在處理特定任務時,其性能、功耗等方面的表現(xiàn)優(yōu)于CPU、GPU和FPGA;但ASIC算法框架尚未統(tǒng)一,因此并未成為目前主流的解決方案。
谷歌ASIC產(chǎn)品探索
現(xiàn)有的ASIC包括谷歌的TPU、我國中科院計算所的寒武紀、應用于大疆無人機和??低曋悄軘z像頭的MovidiusMyriad芯片、曾用于Tesla汽車自動駕駛和ADAS的Mobileye芯片等針對特定算法以及特定框架的全定制AI芯片。
此外,更近一步的的AI芯片前景,大概是IBM的TrueNorth這類的類腦芯片(BPU)。類腦芯片的目的是開發(fā)出新的類腦計算機體系結構,會采用憶阻器和ReRAM等新器件來提高存儲密度,目前技術遠未成熟。
結語:我們離手機AI芯片還有多遠?
在蘋果的推動下,專用AI處理單元可能會越來越成為智能手機芯片的發(fā)展趨勢。畢竟目前在生物識別、圖形圖像識別、用戶使用習慣學習等方面都越來越依賴機器學習技術,而不太穩(wěn)定的網(wǎng)絡帶寬(大家記不記得早期Prisma要等好久才能生成圖片)、個人隱私、功耗比等問題也在驅(qū)動著手機芯片集成專用AI處理單元的發(fā)展。
總的來說,無論是A11還是之前的麒麟970,都是讓AI在手機端開始由軟到硬落地的表現(xiàn),是人工智能進一步產(chǎn)業(yè)化落地的一個典型代表。