十年前,谷歌開(kāi)始布局無(wú)人駕駛汽車(chē)項(xiàng)目,將昂貴的光學(xué)雷達(dá)及高清地圖技術(shù)作為其戰(zhàn)略發(fā)展目標(biāo)。時(shí)至今日,這兩項(xiàng)技術(shù)仍然是谷歌無(wú)人駕駛項(xiàng)目的重要支柱。
基于光學(xué)雷達(dá)和相機(jī)所獲取的數(shù)據(jù),我們可以通過(guò)算法在地圖上定位無(wú)人汽車(chē),但是這個(gè)方法還未能很好地滿足實(shí)際要求。無(wú)人駕駛汽車(chē)要實(shí)現(xiàn)在復(fù)雜環(huán)境或不斷變化的街道中駕駛,需要有很好的感知及決策能力,而這本身就具有不確定性。
現(xiàn)在,我們主要依靠人工智能技術(shù)——深度學(xué)習(xí)來(lái)解決這個(gè)問(wèn)題。與以往不同的是,我們不再使用預(yù)設(shè)算法,而是讓系統(tǒng)通過(guò)實(shí)例學(xué)習(xí),自主學(xué)會(huì)如何對(duì)一個(gè)輸入做出正確的響應(yīng)??梢哉f(shuō),對(duì)于大部分感知任務(wù)以及一些低級(jí)的控制問(wèn)題,深度學(xué)習(xí)是目前最有效的解決方法。
無(wú)人駕駛汽車(chē)需要通過(guò)感知系統(tǒng)去辨識(shí)正在運(yùn)動(dòng)的物體(汽車(chē),行人)及固定不動(dòng)的物體(路燈柱、路的邊緣)。它可以通過(guò)三種方式檢測(cè)動(dòng)態(tài)對(duì)象,包括相機(jī)、激光掃描儀和雷達(dá)。在這三種方式中,相機(jī)是最便宜的,但在過(guò)去,將圖像轉(zhuǎn)化為檢測(cè)對(duì)象很困難,所以這也是使用率最低的方式。而通過(guò)深度學(xué)習(xí),我們發(fā)現(xiàn)無(wú)人駕駛汽車(chē)?yán)斫夂褪褂眠@些圖像的能力顯著提高。
更讓人興奮的是,我們發(fā)現(xiàn)“多任務(wù)深度學(xué)習(xí)”使得無(wú)人駕駛技術(shù)取得更進(jìn)一步進(jìn)展。多任務(wù)深度學(xué)習(xí)是指同時(shí)訓(xùn)練系統(tǒng)去識(shí)別車(chē)道標(biāo)志線、汽車(chē)以及行人,其訓(xùn)練結(jié)果優(yōu)于這三個(gè)子系統(tǒng)獨(dú)立執(zhí)行,這是因?yàn)樵趩我痪W(wǎng)絡(luò)中,信息可以被共享。
無(wú)人駕駛技術(shù)不是完全依賴于預(yù)先設(shè)定的地圖,而是僅將地圖作為其中一個(gè)數(shù)據(jù)流,并結(jié)合傳感器獲取的數(shù)據(jù)幫助系統(tǒng)進(jìn)行決策。比如,神經(jīng)網(wǎng)絡(luò)系統(tǒng)通過(guò)地圖信息預(yù)先獲取人行橫道的位置,進(jìn)而對(duì)檢測(cè)準(zhǔn)備通過(guò)的行人,這比僅僅依靠圖像數(shù)據(jù)要準(zhǔn)確得多。
在過(guò)去,由于自動(dòng)駕駛汽車(chē)駕駛不平穩(wěn),導(dǎo)致許多人乘坐自動(dòng)駕駛汽車(chē)時(shí)會(huì)產(chǎn)生暈車(chē)的感覺(jué)?,F(xiàn)在,深度學(xué)習(xí)可以幫助我們緩解這個(gè)讓人頭疼的問(wèn)題,讓自動(dòng)駕駛汽車(chē)學(xué)會(huì)人類(lèi)的駕駛方式及技巧,會(huì)讓乘客感覺(jué)更加自然。
現(xiàn)在,深度學(xué)習(xí)只是剛開(kāi)始在無(wú)人駕駛技術(shù)領(lǐng)域中嶄露頭角。但正如它對(duì)圖片搜索和語(yǔ)音識(shí)別的突破性貢獻(xiàn)一樣,深度學(xué)習(xí)可能會(huì)改變無(wú)人駕駛技術(shù)的未來(lái)。
更多資訊請(qǐng)關(guān)注汽車(chē)制造頻道