英特爾在首屆AI開發(fā)者大會公開首款商用神經(jīng)網(wǎng)絡(luò)處理器,VPU性能飆升3-4倍

時間:2018-06-12

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:本次AI開發(fā)者大會上,Rao就爽快公開了英特爾新一代AI芯——英特爾NervanaNNP-L1000,代號為“SpringCrest”的專用人工智能芯片,而這款芯片也即將成為英特爾第一款商用神經(jīng)網(wǎng)絡(luò)處理器產(chǎn)品,并計劃在2019年發(fā)布。

【英特爾在首屆AI開發(fā)者大會公開首款商用神經(jīng)網(wǎng)絡(luò)處理器,VPU性能飆升3-4倍】

這是我第二次見到NaveenRao。

與初見一樣,聊到AI,他的話匣子一下被打開,一直有層出不窮的想法與理論冒出,滿腹經(jīng)綸,侃侃而談。

英特爾全球副總裁兼人工智能產(chǎn)品事業(yè)部(AIPG)總經(jīng)理NaveenRao

與他這種溫暖的教授般的氣質(zhì)形成“反萌差”的是他對極限運動的熱愛。這位40剛出頭的AI專家還是一名運動健將,以至于在滑雪、滑板、騎自行車、駕駛賽車、摔跤和打籃球的生涯中,弄傷了全部手指?;蛟S就是這樣一位冒險家,更適合帶動人工智能,在他創(chuàng)立的深度學(xué)習(xí)初創(chuàng)公司Nervana被英特爾收購后,Nervana被迅速整合到英特爾AI核心戰(zhàn)略之中,現(xiàn)在Rao已經(jīng)成為英特爾人工智能事業(yè)群(AIPG)的掌舵人。

Rao說來到英特爾,“這里是一個開放的文化”,他很喜歡團隊合作,然而調(diào)用資源并不是一件容易的事,但英特爾在產(chǎn)品的市場化方面擁有豐富的經(jīng)驗,強大的向心力正將公司各部門之間扭成一股勁,朝著一個目標通力協(xié)作。

在英特爾,實干永遠比空談更重要。在英特爾首屆AI開發(fā)者大會上,由Rao率隊帶領(lǐng),英特爾人工智能業(yè)務(wù)相關(guān)部門的“狠角色”集中露面,這應(yīng)該是英特爾AI史上一次先例。要知道,除了英特爾內(nèi)部會議,能夠在公開場合看到一群“大牛”如此乖巧的集中出現(xiàn),幾乎是零概率事件。

但英特爾并沒有讓人失望。

這一次它拿出了一支配置超高的英特爾“AI銀河戰(zhàn)隊”(姑且叫這名吧),如下圖,從左到右依次是:

JenniferHuffstetler,英特爾數(shù)據(jù)中心事業(yè)部副總裁兼數(shù)據(jù)中心產(chǎn)品和存儲營銷總經(jīng)理

ReynetteAu,英特爾可編程解決方案事業(yè)部副總裁

JackWeast,英特爾無人駕駛解決方案資深首席工程師兼首席架構(gòu)師

GayleSheppard,英特爾新技術(shù)事業(yè)部副總裁兼Saffron人工智能事業(yè)部總經(jīng)理

RemiEl-Ouazzane,英特爾新技術(shù)事業(yè)部副總裁兼Moviduis總經(jīng)理

JonathonBallon,英特爾物聯(lián)網(wǎng)事業(yè)部副總裁

NaveenRao,英特爾公司副總裁兼人工智能產(chǎn)品事業(yè)部總經(jīng)理

盡管這陣容堪比漫威“復(fù)仇者聯(lián)盟”,但依舊有“大神”在畫框外。

英特爾人工智能事業(yè)部副總裁、Nervana團隊核心成員CareyKloss

CareyKloss是英特爾人工智能事業(yè)群副總裁、Nervana團隊核心成員,雖然并沒有在上圖中出現(xiàn),但他向科技行者表達出對團隊的熱愛,“英特爾有迄今為止我見過的最佳的后硅培養(yǎng)(post-siliconbring-up)和架構(gòu)分析?!币舱蛉绱?,Nervana神經(jīng)網(wǎng)絡(luò)處理器(NervanaNeuralNetworkProcessor,NNP)才獲得巨大提升。

事實上,NNP也是英特爾醞釀已久的“殺手锏”。在本次AI開發(fā)者大會上,Rao就爽快公開了英特爾新一代AI芯——英特爾NervanaNNP-L1000,代號為“SpringCrest”的專用人工智能芯片,而這款芯片也即將成為英特爾第一款商用神經(jīng)網(wǎng)絡(luò)處理器產(chǎn)品,并計劃在2019年發(fā)布。

盡管Rao并沒有再多透露新代AI芯片的細節(jié),但同為Nervana創(chuàng)始團隊的CareyKloss卻掌握著機密——我們當然不會放過他。就在AI開發(fā)者大會期間,科技行者與他進行了一次“接地氣”對話,原來打著“如意算盤”的英特爾還可以這樣玩。

NervanaNNP:新AI芯性能飆升3-4倍,但威力還沒完全釋放

在Rao長達1小時的主題演講中,最重磅的發(fā)布非英特爾Nervana神經(jīng)網(wǎng)絡(luò)處理器莫屬了,它對英特爾的意義非同小可。

如果拿去年10月首次公布的“LakeCrest”(NervanaNNP系列初代芯片代號)做一個比喻,可以說“LakeCrest”就像一場“及時雨”,成功幫助英特爾在AI專用芯片競爭中站住腳。但英特爾卻提出了一個更大的目標,即到2020年要將深度學(xué)習(xí)訓(xùn)練的性能提升100倍。而Crest家族很可能成為英特爾目標實現(xiàn)的最快途徑。

要知道一塊芯片的打造并非易事,如果背后沒有一支瘋狂、專注的芯片開發(fā)團隊,它也將是一塊不足掛齒的芯片。所以懂門道的內(nèi)行人更專注的問題是:Nervana神經(jīng)網(wǎng)絡(luò)處理器系列芯片背后的英特爾IC設(shè)計團隊,究竟是如何打造出這顆能在現(xiàn)有性能上再飆升3-4倍的“SpringCrest”?

雖然CareyKloss口風很緊,但關(guān)于Nervana神經(jīng)網(wǎng)絡(luò)處理器,科技行者還是在與他的聊天中,拿到以下犀利信息:

1、LakeCrest和SpringCrest的主要區(qū)別

LakeCrest作為第一代處理器,在GEMM(矩陣運算)和卷積神經(jīng)上都實現(xiàn)了非常好的計算利用率。這不僅僅是指96%吞吐量的利用率,而是在沒有充分定制化的情況下,Nervana也在大多數(shù)情況下實現(xiàn)GEMM高于80%的計算利用率。當開發(fā)下一代芯片時,如果能夠保持高計算利用率,新的產(chǎn)品在性能上有3到4倍的性能提升。

2、LakeCrest計算利用率達到96%,為什么到SpringCrest不升反而降了?

這是一個市場策略,把利用率適當下降。有些情況確實可以實現(xiàn)98%,在沒有資源沖突時,每個硅芯片都完全運行的情況下,可以達到99%甚至100%計算利用率。但英特爾想展示的是大多數(shù)情況下能能實現(xiàn)的利用率,所以適當調(diào)整了。

3、為什么Nervana芯片的發(fā)布節(jié)奏一再延期?

分為兩個階段,Nervana在2014年成立之初就開始研發(fā)LakeCrest,,當時整個團隊大概45人,正在構(gòu)建一個最大的Die(硅芯片),我們開發(fā)了Neon(深度學(xué)習(xí)軟件),還構(gòu)建了云棧,這些都是小團隊所完成的。但這也是挑戰(zhàn)所在,小團隊成長會有陣痛,Nervana花了很長時間才把第一批產(chǎn)品拿出來,直到去年芯片才真正問世。關(guān)于SpringCrest為何選擇2019年年底推出,因為需要集成更多的Die(硅芯片),獲得更快的處理速度,但需要一定的時間去制造硅片,也需要硅片變成新的神經(jīng)網(wǎng)絡(luò)處理器,這是延遲的原因。目前來看,SpringCrest正處于合理的節(jié)奏中,已具備明年取得成功的所有要素。

4、延遲給英特爾帶來了哪些不利影響?

CareyKloss并不認為英特爾會在神經(jīng)網(wǎng)絡(luò)處理器上處于劣勢,因為英特爾的反應(yīng)速度相對較快,比如逐步轉(zhuǎn)向bfloat是一個重要因素,它是業(yè)內(nèi)廣泛采用的針對神經(jīng)網(wǎng)絡(luò)的一種數(shù)值型數(shù)據(jù)格式,很受市場歡迎,未來英特爾將在人工智能產(chǎn)品線上擴大對bfloat16的支持,包括至強處理器和FPGA。

5、拿nGraph與CUDA相比:沒在怕的

拋開硬件層面,英特爾還在軟件部署上加足馬力。目前,英特爾AIPG事業(yè)部正在開發(fā)名為nGraph的軟件,該軟件是一個框架中立的深度神經(jīng)網(wǎng)絡(luò)(DNN)模型編譯器。英特爾正在把TensorFlow、MXNet、PaddlePaddle、CNTK和ONNX等深度學(xué)習(xí)框架集成在nGraph之上。

同樣是一個平臺概念,很多人喜歡拿GPU代表企業(yè)英偉達與英特爾做比較,事實上,CareyKloss就直言了nGraph與競爭對手CUDA平臺的區(qū)別。

“nGraph與CUDA還是不一樣的。CUDA你可以理解為nGraph的底面,我們稱之為變壓器。nGraph通過一個固定的API接收來自TensorFlow,Caffe或MXNet的輸入,然后通過圖形編譯器進行性能優(yōu)化,排除一些不需要的東西,然后將其發(fā)送給CPU的MKL-DNN。所以CPU仍然使用MKL-DNN,即使在nGraph中也是如此?!安浑y看出,英特爾也有意把芯片開發(fā)放在統(tǒng)一平臺上,將nGraph打造成為開發(fā)基于所有英特爾芯片的AI應(yīng)用程序的接口做統(tǒng)一。

相比于新一代NervanaNNP-L1000還處于研發(fā)階段,英特爾另一款專注于計算機視覺的芯片VPU實際已經(jīng)商用。關(guān)于這款芯片,英特爾又寄托了怎樣的市場期望,來看另一位同樣在畫框外的大神的解答。

MovidiusVPU:可能是計算機視覺領(lǐng)域的殺手級應(yīng)用,包括Windows10

GaryBrown是英特爾Movidius營銷主管,他的主要工作是將Movidius研發(fā)的產(chǎn)品買到一個好市場,把買賣做大。他對科技行者說,“任何與計算機視覺和攝像頭有關(guān)的東西都能夠用到Movidius”。

英特爾Movidius營銷主管GaryBrown

在Movidius研發(fā)的芯片被稱作視覺處理單元VPU,是一種兼具計算機視覺和智能攝像頭處理器的芯片,所做的處理分為三類:第一類是ISP(圖像信號)處理,第二類是基于攝像頭捕捉技術(shù)的處理,第三類是計算機視覺和深度學(xué)習(xí)。據(jù)GaryBrown透露,目前VPU在VR產(chǎn)品、機器人技術(shù)、智能家居、工業(yè)攝像頭和AI攝像頭、監(jiān)控和安保領(lǐng)域“生意”了得。

之所以廣受歡迎,無疑是VPU所具備的兩點優(yōu)勢:一是能直接在本地攝像頭上運行神經(jīng)網(wǎng)絡(luò),與把數(shù)據(jù)傳送到云端再發(fā)送回本地相比,延遲更低、用電量更少、時間更短,也意味著更低的帶寬和成本;另外一點則是節(jié)能技術(shù),用前端算法降低功耗,就可以關(guān)閉大部分芯片,只運作小部分最優(yōu)化的面部檢測功能,而當一張臉出現(xiàn)時,其他芯片則被啟動,這樣能一直保持面部監(jiān)控系統(tǒng)開啟,對于家用攝像頭續(xù)航6個月沒問題。目前,Movidius還在最新產(chǎn)品MyriadX的VPU中加入神經(jīng)計算引擎,能將芯片在深度神經(jīng)網(wǎng)絡(luò)中的性能提升10倍。

“抓拍神器”谷歌Clips相機是VPU的另一個典型應(yīng)用。這塊體積小巧甚至連屏幕都沒有的相機卻可以“自動”記錄下畫面,實際上背后正是VPU在發(fā)揮作用。以AI驅(qū)動攝像頭,聽上去很酷,但這還只是VPU應(yīng)用的“冰山一角”。因為英特爾對VPU還寄希望于更大的“生意”,遠遠超出了硬件范疇,十分重視與軟件巨頭微軟Windows10的合作。

“Windows10可能即將成為MovidiusVPU巨大市場之一?!盙aryBrown變得興奮起了,“微軟最近為Windows10研發(fā)出新的API,叫做WindowsML,代表機器學(xué)習(xí),大家可以為Windows10寫應(yīng)用,將機器學(xué)習(xí)轉(zhuǎn)移到MovidiusVPU,開發(fā)人員能夠運用WindowsML進行應(yīng)用開發(fā),比如視覺應(yīng)用、視頻會議應(yīng)用、智能助手進行圖片搜索,通過圖像識別功能搜索有趣的事情?!币簿褪钦f,如果在Windows10系統(tǒng)中運用了WindowsML,就意味著無需一定要在CPU上運行機器學(xué)習(xí)了。

GaryBrown還表示,目前也有PC廠商和他洽談將VPU直接放入電腦的新模塊,但名字不方便透露。

除了芯片在市場“聲名遠揚”,讓人出乎意料的是Movidius的另一個強項竟然是軟件。因為“Movidius團隊很多成員屬于開發(fā)組,硬件只是我們產(chǎn)品的一部分,而軟件開發(fā)者工具包包含庫、驅(qū)動、開源和對應(yīng)固件,也是Movidius產(chǎn)品線之一”,GaryBrown還表示,英特爾新版本的軟件開發(fā)者工具叫OpenVINO,該工具包能夠幫助開發(fā)者在云端(例如TensorFlow,MXNet和Caffe等熱門框架)創(chuàng)建和培訓(xùn)AI模型,并將其部署到各種產(chǎn)品中,像Movidius與海康威視的合作就是采用這種模式。

目前Movidius的客戶有75%集中在物聯(lián)網(wǎng)領(lǐng)域,這并不稀奇。如果對Movidius稍有了解,會知道其實這家計算機視覺初創(chuàng)公司最早由英特爾物聯(lián)網(wǎng)部門在一年半前負責收購,為了輸出更全面的AI能力,現(xiàn)在英特爾內(nèi)部各部門之間都有著蛛網(wǎng)般交織的關(guān)系,包括AI在物聯(lián)網(wǎng)的滲透,這也是英特爾最重要的業(yè)務(wù)之一,如何打這張“組合牌”?又一位大牛登場了。

英特爾AIxIoT:重點放在“智能”物體,不只是計算能力

JonathonBallon是英特爾物聯(lián)網(wǎng)事業(yè)部副總裁,擅長歸納的他,開場就拋出了大會關(guān)于物聯(lián)網(wǎng)內(nèi)容的三條總結(jié):

物聯(lián)網(wǎng)沒有一個萬能的架構(gòu),根據(jù)不同的場景有許多種架構(gòu);

不是所有的人工智能都發(fā)生在數(shù)據(jù)中心端或云端,人工智能運行在分布式計算架構(gòu)中:從云端、網(wǎng)絡(luò)到邊緣設(shè)備;

英特爾在軟件工具方面做了很大投資,英特爾相信軟件是硬件平臺實現(xiàn)差異性的重要因素,nGraph和OpenVINO這兩個工具的互補性,能夠讓異構(gòu)架構(gòu)發(fā)揮出最佳性能。

英特爾物聯(lián)網(wǎng)事業(yè)部副總裁JonathonBallon

言簡意賅,正如JonathonBallon所言,物聯(lián)網(wǎng)沒有一個萬能的架構(gòu),但要如何一擊即中?英特爾似乎有獨特的思考與門路。

“我們重點放在智能物體上,不只是計算能力。”JonathonBallon進一步解釋,“一臺帶有芯片的設(shè)備,具有計算能力,這叫做計算設(shè)備,但這并不意味著它是智能的。當把計算設(shè)備連上網(wǎng)絡(luò),把數(shù)據(jù)分離出來,這時這個設(shè)備稱為物聯(lián)網(wǎng)設(shè)備,但它還不一定是智能設(shè)備。物聯(lián)網(wǎng)設(shè)備和智能設(shè)備之間的區(qū)別是:后者有學(xué)習(xí)能力,這就是人工智能能夠發(fā)揮巨大作用的地方?!?/p>

如果將這種思維映射到醫(yī)療成像領(lǐng)域,JonathonBallon也談到“智能”將演變的軌跡:“或許過去十年,我們專注于快速完成影像獲取,但現(xiàn)在AI發(fā)展已經(jīng)跨越這個臺階,我們思考的是如何比醫(yī)生更快速準確分析影響,讓AI系統(tǒng)能夠用幾分鐘的時間就處理完1萬張醫(yī)學(xué)影像,并向放射科醫(yī)生指出哪些影像應(yīng)該特別關(guān)注,下一步還要與相關(guān)病例聯(lián)系起來,提供診斷和治療方案?!?/p>

同樣的顛覆還會發(fā)生在零售市場:英特爾與京東打造的D-MART“無人商店”,已經(jīng)在多個智能門店以及智能售賣機項目中部署試用。無人商店用到的機器學(xué)習(xí)算法主要集中在知人、知貨、知場3個方向,由于涉及線上線下數(shù)據(jù)打通,將視頻等非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)數(shù)據(jù)等,需要用到機器視覺領(lǐng)域CNN(卷積神經(jīng)網(wǎng)絡(luò))算法,智慧供應(yīng)鏈方面用到的傳統(tǒng)機器學(xué)習(xí)算法,如SVM、統(tǒng)計學(xué)的線形回歸、邏輯回歸等。綜合考慮,京東選擇了英特爾的邊緣服務(wù)器做硬件層支持。

從醫(yī)療到零售還只看到物聯(lián)網(wǎng)實踐的小小縮影,事實上英特爾正在嘗試一個通用邏輯或者說方法論,將物聯(lián)網(wǎng)的部署在所有行業(yè)上打通。在JonathonBallon看來,物聯(lián)網(wǎng)也擁有專屬的“摩爾定律”,不同行業(yè)的IOT都會經(jīng)歷三個相同階段:連接,智能以及自治,而自治階段是未來物聯(lián)網(wǎng)發(fā)展的終極趨勢所在。英特爾與京東、亞馬遜打造的“無人商店”就是一個完全自主運營的實例。

當談到競爭,JonathonBallon表示并不擔心?!坝⑻貭柕膬?yōu)勢在于善加利用分布式計算架構(gòu),專注于打造端到端的解決方案,包括設(shè)備、網(wǎng)關(guān)、網(wǎng)絡(luò)、云、數(shù)據(jù)中心等?!笨梢钥吹剑粌H是AI產(chǎn)品組合,關(guān)于物聯(lián)網(wǎng),英特爾也已經(jīng)攢好“組合牌”,從設(shè)備到云已備好了一整套完整的產(chǎn)品組合方案。

所以,英特爾的手上都有哪些牛X底牌?

英特爾從來都不會直接地告訴別人它的AI能力有多強,但未來你身邊的AI可能都有“Intelinside”。

就像沒聽說過MovidiusVPU,但你可能知道大疆今年推出了一款具有手勢識別遙控功能的迷你無人機;不熟悉Moblieye這個名字,但你大概聽過特斯拉Autopilot的自動駕駛功能;沒研究過英特爾AI平臺,但你或許會被2020年東京奧運會的直播效果驚艷;甚至,在如今大多數(shù)人工智能硬件公司采用的芯片前,都要加一個英特爾商標。

事實上,借由其體量的優(yōu)勢,英特爾在AI硬件方面完成了深遠布局。從訓(xùn)練到推理,從服務(wù)器到終端的AI全產(chǎn)業(yè)鏈上,都有intelinside的身影。如果說數(shù)據(jù)洪流帶來巨大機遇和挑戰(zhàn),多種多樣的應(yīng)用需求需要不同的解決方案和技術(shù)來滿足,同理人工智能也是如此。紛繁復(fù)雜的工作負載也需要不同類型和特點的人工智能產(chǎn)品來支撐,這就需要提供更全面的企業(yè)級方案。

在人工智能策略上,英特爾實際上一直強調(diào)的是“廣度”,即對于每一種架構(gòu)風格,英特爾都有一個或多個的產(chǎn)品組合,讓各種規(guī)模的機構(gòu)都能通過英特爾開啟自己的人工智能研發(fā)。例如,英特爾正在與Novartis合作,使用深度神經(jīng)網(wǎng)絡(luò)來加速高內(nèi)涵篩選——這是早期藥品研發(fā)的關(guān)鍵元素。雙方的合作把訓(xùn)練圖片分析模型的時間從11個小時縮短到了31分鐘。

當然,要釋放AI潛力,僅“廣度”還是不夠的,還應(yīng)該有更全面的考慮。在一年多漫長梳理與整合之后,英特爾終于拿出了一套相對完善的產(chǎn)品組合方案——英特爾人工智能全棧式解決方案,包括至強可擴展處理器、英特爾Nervana神經(jīng)網(wǎng)絡(luò)處理器和FPGA、網(wǎng)絡(luò)以及存儲技術(shù)等;針對深度學(xué)習(xí)/機器學(xué)習(xí)而優(yōu)化的基于英特爾架構(gòu)的數(shù)學(xué)函數(shù)庫(IntelMKL)以及數(shù)據(jù)分析加速庫(IntelDAAL)等;支持和優(yōu)化開源深度學(xué)習(xí)框架如Spark、Caffe、Theano以及Neon等;構(gòu)建以英特爾Movidius和Saffron為代表的平臺以推動前后端協(xié)同人工智能發(fā)展。

這就夠了嗎?當然不是。

差點漏掉了“Loihi”。它是英特爾正在研發(fā)的神經(jīng)擬態(tài)計算芯片,能夠像大腦一樣通過脈沖或尖峰傳遞信息,通過“異步激活”方式進行計算,使機器學(xué)習(xí)更有效率,同時對于計算力的需求更小。但Rao也指出,Loihi目前只是一個研究項目,是英特爾的一個重要研究方向但不是唯一方向。

“如果我們能提高的話,這項技術(shù)將成為潛力股?!?/p>

“與此同時,還有量子計算,它是創(chuàng)造更多計算能力的方法?!?/p>

中傳動網(wǎng)版權(quán)與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(m.u63ivq3.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0