【深度學(xué)習(xí)開(kāi)發(fā)框架的競(jìng)賽漸顯,中國(guó)AI未來(lái)紅利如何布局?】最近很多海外企業(yè)之中在發(fā)生一種很有趣的改變,那就是AI正在脫離其他部門附屬品的角色,成為一個(gè)獨(dú)立的部門或事業(yè)部。
先是CEO納德拉對(duì)微軟大動(dòng)干戈地進(jìn)行了重組,將原Windows部門重組成“設(shè)備與體驗(yàn)”和“云計(jì)算與人工智能平臺(tái)”。很快谷歌也宣布將原來(lái)的人工智能及搜索部門一分為二,將人工智能部分獨(dú)立出來(lái),歸由原來(lái)谷歌大腦的負(fù)責(zé)人JeffDean領(lǐng)導(dǎo)。不久蘋果又挖角了谷歌前人工智能及搜索部門主管JohnGiannandrea,任命其領(lǐng)導(dǎo)機(jī)器學(xué)習(xí)和人工智能戰(zhàn)略并直接向TimCook匯報(bào)。
(蘋果雇用谷歌前人工智能主管JohnGiannandrea)
對(duì)于AI行業(yè)來(lái)說(shuō),這顯然是好消息。谷歌和微軟一樣,原本將AI與自身最核心的業(yè)務(wù)歸攏在一起,如今將兩者區(qū)分開(kāi)來(lái),無(wú)疑是一種提升對(duì)AI重視程度的表現(xiàn)。未來(lái)的風(fēng)向或許是,深度學(xué)習(xí)不再是某一項(xiàng)業(yè)務(wù)的衍生品或附庸,甩掉原生根系的糾纏,走向獨(dú)立發(fā)展、高頻競(jìng)爭(zhēng)的快車道時(shí)代。
而在整個(gè)AI快道比拼當(dāng)中,硬件算力、數(shù)據(jù)算法等等元素?zé)o一不處于白熱化的競(jìng)賽之中,幾乎每天都有新的論文、新的產(chǎn)品問(wèn)世。可隱藏在快道底層的,卻是一個(gè)極易被忽視,但卻實(shí)際至關(guān)重要的問(wèn)題——深度學(xué)習(xí)開(kāi)發(fā)框架。
每位AI開(kāi)發(fā)者每天都會(huì)使用它,可外界對(duì)它的關(guān)注卻少之又少。但深度學(xué)習(xí)開(kāi)發(fā)框架絕非一灘死水,悄然之中谷歌、Facebook、百度三大AI巨頭,正在圍繞深度學(xué)習(xí)框架展開(kāi)一場(chǎng)新的“三國(guó)殺”。
AI要沖:深度學(xué)習(xí)正在變成一件更專注、更系統(tǒng)的事
在谷歌原來(lái)的業(yè)務(wù)結(jié)構(gòu)中,谷歌大腦本是一個(gè)偏重于研究的團(tuán)隊(duì),在深度學(xué)習(xí)、NLP、CV等等領(lǐng)域的國(guó)際期刊和學(xué)術(shù)上發(fā)表了大量論文,并且將開(kāi)發(fā)框架TensorFlow歸攏到自己旗下。
隨著近一兩年間AI相關(guān)技術(shù)的應(yīng)用性增強(qiáng),谷歌大腦的上述研究結(jié)果也開(kāi)始有機(jī)會(huì)進(jìn)一步投入產(chǎn)業(yè)。谷歌這一次提升AI業(yè)務(wù)的重要性,或許是在謀劃AI業(yè)務(wù)獨(dú)立開(kāi)發(fā)和系統(tǒng)性業(yè)務(wù)布局的可能——AI與工業(yè)、AI醫(yī)療影像……當(dāng)技術(shù)前景越來(lái)越廣闊時(shí),就進(jìn)一步展現(xiàn)出了深度學(xué)習(xí)開(kāi)發(fā)框架在產(chǎn)業(yè)關(guān)系中的戰(zhàn)略要沖地位。深度學(xué)習(xí)開(kāi)發(fā)框架可以圈定開(kāi)發(fā)者和應(yīng)用,從而釋放谷歌在AI方面的技術(shù)能力和未來(lái)TPU的計(jì)算能力。
巨頭們紛紛開(kāi)始調(diào)整架構(gòu),意味著深度學(xué)習(xí)正在走向系統(tǒng)化和專注化,這以數(shù)據(jù)、感知與運(yùn)算的深度纏繞的產(chǎn)業(yè)領(lǐng)域,開(kāi)發(fā)以及開(kāi)發(fā)者生態(tài)自然成為了產(chǎn)業(yè)活躍度的基石,有關(guān)開(kāi)發(fā)生態(tài)的競(jìng)爭(zhēng)則直接體現(xiàn)在了深度學(xué)習(xí)開(kāi)發(fā)框架的發(fā)展中。
比如,F(xiàn)acebook就不愿讓谷歌獨(dú)享深度學(xué)習(xí)開(kāi)發(fā)平臺(tái)帶來(lái)生態(tài)收益,在去年年初推出了針對(duì)意味十足的開(kāi)發(fā)平臺(tái)PyTorch。并且在去年9月聯(lián)手微軟旗下的CNTK和Caffe2,推出了一套開(kāi)放的神經(jīng)網(wǎng)絡(luò)交換格式,為的是在谷歌生態(tài)愈發(fā)封閉時(shí),提升場(chǎng)內(nèi)其他選手之間框架格式的互通性。
而在中國(guó),百度的PaddlePaddle也在不斷發(fā)展,憑借本土化特色吸引了國(guó)內(nèi)的開(kāi)發(fā)者,綜合GitHubpullrequest的數(shù)據(jù)來(lái)看,PaddlePaddle已經(jīng)成為了全球開(kāi)發(fā)熱度增速最高的開(kāi)源深度學(xué)習(xí)平臺(tái)。同時(shí)隨著百度在斯坦福、加州伯克利等海外高校頻繁開(kāi)展技術(shù)交流活動(dòng),PaddlePaddle甚至在逐步走向世界舞臺(tái)。
不知不覺(jué)間,這三大科技巨頭專屬的深度學(xué)習(xí)框架,正在展開(kāi)一場(chǎng)新的三強(qiáng)爭(zhēng)霸。
降低一切門檻:開(kāi)發(fā)框架三國(guó)殺在爭(zhēng)什么?
在我們談?wù)揂I開(kāi)發(fā)時(shí),我們就究竟在談?wù)撌裁矗?/strong>
更多的開(kāi)發(fā)者:開(kāi)發(fā)者數(shù)量顯然是一切的前提,數(shù)量廣闊的開(kāi)發(fā)者就像蒲公英的種子,會(huì)把深度學(xué)習(xí)開(kāi)發(fā)框架以及相關(guān)的軟硬件服務(wù)帶到各個(gè)企業(yè)中去,幫助巨頭們的AI布局在四處扎根生長(zhǎng)。
更活躍的開(kāi)發(fā)生態(tài):建立在大量開(kāi)發(fā)者數(shù)量之上,用案例和經(jīng)驗(yàn)對(duì)開(kāi)發(fā)社區(qū)進(jìn)行填充,鼓勵(lì)開(kāi)源和共享,讓AI的開(kāi)發(fā)變得更加簡(jiǎn)單,從而進(jìn)入更多行業(yè)和場(chǎng)景。
更高級(jí)別的開(kāi)發(fā)項(xiàng)目:自身框架中誕生一款殺手級(jí)應(yīng)用,可能是每個(gè)巨頭都會(huì)有的理想目標(biāo)。高價(jià)值和高效用的應(yīng)用AI很可能帶來(lái)大量簇?fù)碚?,一齊涌向該框架的生態(tài)之中。
總之,如何降低門檻以一切手段吸引開(kāi)發(fā)者進(jìn)入,成為了三大開(kāi)發(fā)框架的共同目標(biāo)。
最典型的例子就是TensorFlow與PyTorch之間的競(jìng)爭(zhēng)。
在目前的開(kāi)發(fā)框架中,TensorFlow憑借著谷歌的技術(shù)優(yōu)勢(shì)一直表現(xiàn)的較為強(qiáng)勢(shì),在開(kāi)發(fā)者越來(lái)越多時(shí),其開(kāi)發(fā)社區(qū)生態(tài)也在進(jìn)行良性發(fā)展。
但占據(jù)了優(yōu)勢(shì)后,TensorFlow開(kāi)始隨著谷歌一同收攏自身的開(kāi)發(fā)生態(tài)。比如谷歌曾經(jīng)推出過(guò)一系列賦能開(kāi)發(fā)者的培訓(xùn)計(jì)劃,向開(kāi)發(fā)者提供課程教學(xué)。但結(jié)果是所有的教學(xué)全部都建立在TensorFlow之上,所提供的硬件API也只能接入TensorFlow,而TensorFlow的社區(qū)資源和開(kāi)發(fā)工具更新,又部署在谷歌云之上。并且TensorFlow在最近單方面和Caffe等開(kāi)發(fā)平臺(tái)“友盡”,使得開(kāi)發(fā)者們無(wú)法進(jìn)行平臺(tái)之間的遷移。
而Facebook就抓住了這一點(diǎn)。將原來(lái)的開(kāi)發(fā)工具Torch進(jìn)行升級(jí),聯(lián)手微軟打造神經(jīng)網(wǎng)絡(luò)交換格式幫助開(kāi)發(fā)者降低遷移成本。同時(shí)PyTorch設(shè)計(jì)了更方便的數(shù)據(jù)加載API接口,使開(kāi)發(fā)過(guò)程中加載并行數(shù)據(jù)更加順暢,相比TensorFlow降低了不少API方面的學(xué)習(xí)成本。
在自定義擴(kuò)展上,PyTorch也改變了TensorFlow依靠樣板代碼才能實(shí)現(xiàn)的情況,通過(guò)為CPU/GPU編寫接口這種更易行的方式添加自定義拓展,使得開(kāi)發(fā)過(guò)程中的自由度大大提高。
綜合來(lái)看,在開(kāi)發(fā)框架的競(jìng)爭(zhēng)中,賽點(diǎn)在于更低的學(xué)習(xí)成本和遷移成本,以及更高的易用性和社區(qū)友好度。
在這幾個(gè)方面,西方戰(zhàn)場(chǎng)之外的PaddlePaddle也以靈活、易用著稱。
在應(yīng)用效率上,PaddlePaddle在運(yùn)行RNN算法時(shí)比其他主流框架占用更少的內(nèi)存,速度卻提升了1-2倍。
在訓(xùn)練部分的調(diào)用方式上PaddlePaddle集中了瀏覽器和客戶端等多種主流調(diào)用方式,并支持CPU、GPU、FPGA等多種硬件,從而極力降低開(kāi)發(fā)成本。同時(shí)還支持多種深度學(xué)習(xí)模型,使得開(kāi)發(fā)者可以更關(guān)注模型的高層結(jié)構(gòu),拋開(kāi)底層編碼,使得TensorFlow里需要數(shù)行代碼才能實(shí)現(xiàn)的功能,在PaddlePaddle里可能只需要一兩行。
除此之外,PaddlePaddle還展示出了很多適用于應(yīng)用層面的功能。例如在最新的Fluid版本中讓開(kāi)發(fā)過(guò)程更接近常見(jiàn)的高級(jí)語(yǔ)言,減少深度學(xué)習(xí)中“黑箱”狀況的出現(xiàn),讓開(kāi)發(fā)者不再用“玄學(xué)”調(diào)參,更進(jìn)一步明晰開(kāi)發(fā)和優(yōu)化中產(chǎn)生的對(duì)應(yīng)關(guān)系,使得開(kāi)發(fā)過(guò)程更有可復(fù)制性。
還包括PaddlePaddle支持彈性使用計(jì)算資源完成深度學(xué)習(xí)訓(xùn)練,根據(jù)需求變化設(shè)置資源消耗的彈性區(qū)間。對(duì)于時(shí)常面對(duì)著繁多計(jì)算任務(wù)的大型企業(yè)來(lái)說(shuō),此舉可以幫助他們節(jié)約大量資源,讓深度學(xué)習(xí)的開(kāi)發(fā)和訓(xùn)練成本進(jìn)一步降低。
近日有新聞報(bào)道,Google發(fā)布TensorFlow.js,支持在瀏覽器上進(jìn)行機(jī)器學(xué)習(xí)的相關(guān)工作,但在降低開(kāi)發(fā)者使用瀏覽器發(fā)展機(jī)器學(xué)習(xí)的門檻方面,PaddlePaddle確實(shí)做得更早也相對(duì)成熟。同時(shí)為了讓更多開(kāi)發(fā)者和企業(yè)能夠?qū)F(xiàn)有項(xiàng)目接入到中PaddlePaddle,PaddlePaddle做到了從基礎(chǔ)訓(xùn)練到分布架構(gòu)徹底開(kāi)源。這一點(diǎn)即使在以開(kāi)源精神著稱的硅谷都很稀有。
當(dāng)然在中國(guó)市場(chǎng)范圍來(lái)看,PaddlePaddle最大的優(yōu)勢(shì)還是擁有唯一提供適用中文文檔與數(shù)據(jù)集的開(kāi)發(fā)框架社區(qū)。中國(guó)市場(chǎng)作為區(qū)別于歐美世界之外的獨(dú)立極,坐擁龐大的中國(guó)AI產(chǎn)業(yè)與開(kāi)發(fā)集群,這些產(chǎn)業(yè)和開(kāi)發(fā)者都需要適用于本土的經(jīng)驗(yàn)體系,也自然會(huì)被PaddlePaddle的社區(qū)氛圍吸引。綜合這些優(yōu)勢(shì),PaddlePaddle完全可以與歐美巨頭們一戰(zhàn)。
關(guān)注未來(lái)紅利:PaddlePaddle的崛起帶來(lái)中美AI對(duì)標(biāo)新命題
在理想狀態(tài)下,通過(guò)開(kāi)發(fā)框架牢牢把控開(kāi)發(fā)者體系,在自身平臺(tái)上不斷產(chǎn)生生態(tài)效應(yīng),收割未來(lái)必然出現(xiàn)的AI時(shí)代現(xiàn)象級(jí)產(chǎn)品與應(yīng)用,這一流程才是巨頭們所關(guān)注的目標(biāo)。
同時(shí)我們要知道,所謂的把現(xiàn)象級(jí)產(chǎn)品和應(yīng)用放到AI這一定語(yǔ)之下,就意味著這些應(yīng)用可能與社交媒體聯(lián)系,關(guān)乎著我們的輿情數(shù)據(jù),也可能與自動(dòng)駕駛聯(lián)系,關(guān)乎著每一輛汽車的行駛路線。
在這時(shí)我們不得不提出另一個(gè)可能,在中美貿(mào)易戰(zhàn)的大背景下,中國(guó)AI開(kāi)發(fā)群體,尤其是AI企業(yè),使用TensorFlow等平臺(tái)的風(fēng)險(xiǎn)指數(shù)正在提升。
就拿美國(guó)向全球提供免費(fèi)GPS技術(shù)來(lái)說(shuō),曾經(jīng)很多國(guó)家甚至在軍用設(shè)施上也利用GPS進(jìn)行定位技術(shù),但在99年印巴戰(zhàn)爭(zhēng)時(shí),美國(guó)出于利益直接關(guān)閉了印巴地區(qū)所有的GPS服務(wù)。想象一下,兩軍交戰(zhàn)之時(shí),忽然所有人都不知道自己的位置信息,這是一件多么恐怖的事情?
最近中興被裹挾在中美貿(mào)易戰(zhàn)爭(zhēng)中,進(jìn)而引發(fā)的芯片恐慌更提醒了我們,市場(chǎng)經(jīng)濟(jì)和全球化不會(huì)是一柄絕對(duì)中立的保護(hù)傘,技術(shù)的自主權(quán)很可能在關(guān)鍵時(shí)刻成為阿克琉斯之踵。這一點(diǎn)在人工智能中更是如此。
如今TensorFlow早已不再是單純的開(kāi)發(fā)框架,而關(guān)系著技術(shù)、云服務(wù)等等多種模塊。如果同樣的狀況復(fù)制到AI上,如果有一天深度學(xué)習(xí)模型已經(jīng)埋藏在我們生活作業(yè)的種種細(xì)節(jié)深處,谷歌卻因?yàn)榉N種原因停止向中國(guó)提供云服務(wù),我們連遷移模型都十分被動(dòng)。因而造成的結(jié)果很可能比今天的芯片問(wèn)題更加恐怖,自動(dòng)駕駛突然失靈,自動(dòng)化工業(yè)生產(chǎn)突然向人力求救,這一切造成的不僅僅是生產(chǎn)效率的降低,而是人們的生活陷入混亂。
這時(shí)PaddlePaddle對(duì)于中國(guó)開(kāi)發(fā)者的優(yōu)勢(shì),就不僅僅是易用性和靈活性了。PaddlePaddle的適時(shí)崛起,似乎在將開(kāi)發(fā)者引入另一種可能:建立完全本土化的開(kāi)發(fā)框架和社區(qū),連接在地化的數(shù)據(jù)、計(jì)算服務(wù)和技術(shù),中國(guó)AI可以實(shí)現(xiàn)由開(kāi)發(fā)到技術(shù)創(chuàng)新,再到產(chǎn)業(yè)模塊與商業(yè)化的完全自生態(tài)流程。而PaddlePaddle的快速部署優(yōu)勢(shì),可以讓中國(guó)開(kāi)發(fā)者在世界范圍內(nèi)的AI應(yīng)用競(jìng)賽上獲得更多速度優(yōu)勢(shì)?;蛟S當(dāng)海外還在利用TensorFlow調(diào)試底層代碼時(shí),中國(guó)開(kāi)發(fā)者就已經(jīng)通過(guò)PaddlePaddle實(shí)現(xiàn)模型的應(yīng)用了。AI自生態(tài)的靠攏過(guò)程不是因?yàn)槎惚茱L(fēng)險(xiǎn),而是因?yàn)楸就粱拇_是更高效的選擇。
這樣一來(lái),中國(guó)AI領(lǐng)域就可以完全脫離對(duì)美國(guó)的依賴,這在兩國(guó)科技產(chǎn)業(yè)競(jìng)爭(zhēng)的大背景下,由此帶來(lái)的自主和安全就顯得尤為關(guān)鍵和重要。如今深度學(xué)習(xí)開(kāi)發(fā)框架的競(jìng)賽剛剛開(kāi)始,代表著中國(guó)AI開(kāi)發(fā)品牌,甚至中國(guó)AI未來(lái)紅利的PaddlePaddle如何布局,或許會(huì)為這場(chǎng)競(jìng)爭(zhēng)增加更多看點(diǎn)。