現(xiàn)在我們都對AI很熟悉了,也知道算法的完善離不開海量的數(shù)據(jù)。數(shù)據(jù)量越大,算法給出的結(jié)果可能就越精準,越“如人意”。人對世界的感知,很大一部分是基于我們的感官獲取的“數(shù)據(jù)”。機器人和目前很火的無人駕駛依靠的則是來自傳感器的數(shù)據(jù)。隨著傳感器獲取和處理的數(shù)據(jù)量越來越大,智能機器人的發(fā)展也將到達一個“臨界點”。本文的兩位作者分別是AlexHousley和SantiagoTenorio。AlexHousley是Seldon的創(chuàng)始人兼CEO,他的公司Seldon是一個機器學(xué)習(xí)部署平臺,為數(shù)據(jù)科學(xué)團隊提供圍繞基礎(chǔ)架構(gòu),協(xié)作和法規(guī)遵從的新功能;SantiagoTenorio是Rewired的一名合伙人,Rewired是一家以機器人為重點的創(chuàng)業(yè)工作室,投資應(yīng)用科學(xué)和技術(shù),提高機器的認知度。本文編譯自venturebeat的原題為“AIinnovationwilltriggertheroboticsnetworkeffect”的文章。
只要是想擴展業(yè)務(wù)或建立網(wǎng)絡(luò)的人,應(yīng)該對“網(wǎng)絡(luò)效應(yīng)”很熟悉。例如,使用像eBay、淘寶這樣的市場平臺,買家和賣家越多,它就越完善,用處也就越大。那么,數(shù)據(jù)的網(wǎng)絡(luò)效應(yīng)指的就是,隨著服務(wù)使用的增加,服務(wù)也變得越來越完善的動態(tài)過程,比如,隨著機器學(xué)習(xí)模型訓(xùn)練數(shù)據(jù)量的增加,模型得到的結(jié)果也越來越準確。
網(wǎng)絡(luò)外部性(networkexternality)——又稱網(wǎng)絡(luò)效應(yīng)(networkeffect)或需求方規(guī)模經(jīng)濟(demand-sideeconomiesofscale),指在經(jīng)濟學(xué)或商業(yè)中,消費者選用某項商品或服務(wù),其所獲得的效用與“使用該商品或服務(wù)的其他用戶人數(shù)”具有相關(guān)性時,此商品或服務(wù)即被稱為具有網(wǎng)絡(luò)外部性。最常見的例子是電話或社交網(wǎng)絡(luò)服務(wù):采用某一種社交媒體的用戶人數(shù)越多,每一位用戶獲得越高的使用價值。
無人駕駛車輛和其他智能機器人依賴的是傳感器,這些傳感器產(chǎn)生的海量數(shù)據(jù)量,并且越來越龐大。獲取的數(shù)據(jù)可以被用來構(gòu)建更好的AI模型,然后機器人可以依靠這些AI模型,做出實時決策,并在真實世界、真實環(huán)境中“找到方向”。
當今智能機器人的核心是AI與傳感器的融合,可以產(chǎn)生了良性的反饋循環(huán)——我們也可以稱之為機器人“網(wǎng)絡(luò)效應(yīng)”。目前,我們正處于引爆這一網(wǎng)絡(luò)效應(yīng)、徹底改變機器人的臨界點。
AI的快速演變
人工智能的下一個探索領(lǐng)域是機器人技術(shù),如果你想知道這背后的原因,那你得先了解了解人工智能本身是如何演變的。
近年發(fā)展起來的機器智能系統(tǒng)能夠利用海量的數(shù)據(jù),但在上世紀90年代中期,根本還沒有這些數(shù)據(jù),互聯(lián)網(wǎng)也還處于起步階段。隨著存儲和計算方面的進步的出現(xiàn),快速,經(jīng)濟地存儲及處理大量數(shù)據(jù)成為可能。不過,這些工程上的進步本身并不能解釋人工智能的快速發(fā)展。
開源的機器學(xué)習(xí)庫和框架雖然看起來“沒什么動靜”,但是起到了同等重要的作用。15年前,在科學(xué)計算框架Torch發(fā)布BSD許可證時,里面包括的許多算法現(xiàn)在的數(shù)據(jù)科學(xué)家還在使用,包括深度學(xué)習(xí),多層感知器,支持向量機和K最近鄰算法。
軟件許可證是一種格式合同,由軟件作者與用戶簽訂,用以規(guī)定和限制軟件用戶使用軟件(或其源代碼)的權(quán)利,以及作者應(yīng)盡的義務(wù)。常用的軟件許可證包括:GPL、BSD許可證、私權(quán)軟件許可證。
最近,像TensorFlow和PyTorch這樣的開源項目也為這個共享的知識庫做出了寶貴的貢獻,讓不同背景的軟件工程師能夠開發(fā)新的模型和應(yīng)用程序。計算機域的專家需要大量的數(shù)據(jù)來創(chuàng)建和訓(xùn)練這些模型。因此,大公司擁有巨大的優(yōu)勢,因為他們可以利用現(xiàn)有的數(shù)據(jù)網(wǎng)絡(luò)效應(yīng)。
傳感器數(shù)據(jù)和處理能力
自20世紀60年代初以來,就已經(jīng)有光的探測和測距(激光雷達)傳感器了。這些傳感器已經(jīng)在地理信息學(xué),考古學(xué),林業(yè),大氣研究,國防和其他行業(yè)中業(yè)以及經(jīng)投入使用。近年來,激光雷達也已成為自主導(dǎo)航的首選傳感器。
Google無人駕駛車輛上的激光雷達傳感器每秒可產(chǎn)生750MB的數(shù)據(jù)。機上的8臺計算機視覺攝像機每秒鐘產(chǎn)生1.8GB的數(shù)據(jù)。所有這些數(shù)據(jù)都需要實時處理,但是集中計算(在云端)在實時的高速情況下,還不夠快。為了解決這個計算不夠快的瓶頸,我們通過分散計算,來提高處理能力。
目前大多數(shù)自主車輛的解決方案是使用兩個車載“盒子”,每個盒子都配備IntelXeonE5CPU和4到8個NvidiaK80GPU加速器。最高性能表現(xiàn)情況下,這消耗5000W以上的電力。Nvidia新推出的DrivePXPegasus等硬件創(chuàng)新技術(shù)也開始嘗試更有效地突破這一瓶頸。
AI發(fā)展臨界點
我們處理傳感器數(shù)據(jù)和融合各種數(shù)據(jù)模式的能力將繼續(xù)推動智能機器人的發(fā)展。為了使這種傳感器融合能實時發(fā)生,需要把機器學(xué)習(xí)和深度學(xué)習(xí)模型分散開來。當然,分散式AI對分散式處理器的要求更為復(fù)雜。
值得慶幸的是,機器學(xué)習(xí)和深度學(xué)習(xí)計算效率正不斷提高。Graphcore的智能處理單元(IPU)和Google的張量處理單元(TPU)等成本也不斷降低,在規(guī)模上加速神經(jīng)網(wǎng)絡(luò)的性能的提高。
在其他方面,IBM正在開發(fā)模擬大腦解剖學(xué)的神經(jīng)形態(tài)晶片。芯片雛形使用一百萬個神經(jīng)元,每個神經(jīng)元有256個突觸。該系統(tǒng)特別適合于解讀感官數(shù)據(jù),因為它的設(shè)計是模擬人類大腦解釋和分析感知數(shù)據(jù)的方式。
所有這些來自傳感器的數(shù)據(jù),意味著我們正處于機器人網(wǎng)絡(luò)效應(yīng)的臨界點,這個轉(zhuǎn)變將對人工智能,機器人及其各種應(yīng)用產(chǎn)生巨大影響。
數(shù)據(jù)新世界
機器人網(wǎng)絡(luò)效應(yīng)的影響,不僅在于新技術(shù)和新機器能夠更快地處理更大的數(shù)據(jù)量,而且還能處理更多不同類型的數(shù)據(jù)。新的傳感器將能夠檢測和捕獲讓我們“意想不到”的數(shù)據(jù),因為人類感知的局限性,這些數(shù)據(jù)我們可能根本想象不到。機器和智能設(shè)備會把豐富的數(shù)據(jù)傳送到云端和鄰近的代理,為決策提供信息,加強協(xié)調(diào),并在模型改進中持續(xù)發(fā)揮重要作用。
這些進步比許多人意識到的要快得多。例如,Aromyx使用受體和先進的機器學(xué)習(xí)模型來構(gòu)建傳感器系統(tǒng),并為氣味和口味數(shù)據(jù)的采集,索引和搜索提供平臺。該公司的EssenceChip是一種一次性傳感器,輸出生化信號。這些信號與當人類聞到或品嘗食物或飲料時,發(fā)送到人類大腦的信號是一樣的。
OpenBionics正在開發(fā)機器人仿生手臂,仿生手臂依靠從手臂套筒內(nèi)的傳感器收集觸覺數(shù)據(jù),借此來控制手和手指的移動。這種非侵入式設(shè)計能夠通過機器學(xué)習(xí)模型,將電極感測到的精細肌肉張力,轉(zhuǎn)化為仿生手中的復(fù)雜運動反應(yīng)。
傳感器數(shù)據(jù)將有助于推動AI的發(fā)展。AI系統(tǒng)也同時擴展我們處理數(shù)據(jù)的能力,并幫助我們發(fā)現(xiàn)這些數(shù)據(jù)的創(chuàng)造性用途。除此之外,這也將激發(fā)新的機器人外形設(shè)計要素,幫助我們收集更多不同模式的數(shù)據(jù)。當我們以新的方式提升“看”的能力時,我們周圍的看似“日?!钡氖澜?,很快就會成為下一個發(fā)現(xiàn)的前沿。