從2010年第一輛谷歌無人駕駛汽車上路,到2014年搭載自動駕駛功能的特斯拉ModelS正式上市,無人駕駛汽車的發(fā)展速度超越想象。雖然上世紀70年代無人駕駛技術(shù)在可行性和實用化方面已經(jīng)取得了突破性進展,但是直到最近谷歌、蘋果、特斯拉等科技企業(yè)的加入,才使得無人駕駛受到消費者的關注與認可??赡苊總€人小時候都會有這樣的想象:如果汽車能自己開車該多好啊……如今這樣的想象終于變成了現(xiàn)實,其背后呈現(xiàn)的技術(shù)原理卻不僅僅是一輛車那么簡單。
從無人駕駛到機器視覺
無人駕駛顧名思義就是不需要駕駛員操作的情況下汽車可以自動行駛,這并不是指汽車在實驗場上進行前進、后退、倒車、剎車等簡單操作,而是需要汽車在真實且復雜的路況上滿足用戶的出行需求。比如早高峰需要汽車快速且安全地載著用戶從家到公司,長途旅行需要汽車精確識別當?shù)亟煌ǚㄒ?guī)而不會違章,在擁擠的底下車庫可以自動找到停車位并精確入庫……這些使用場景對無人駕駛汽車提出了非常嚴苛的要求。所以無人駕駛汽車不僅僅是一輛汽車,它涉及了多方面的技術(shù)融合,比如自動控制、體系結(jié)構(gòu)、人工智能、視覺計算等等,今天要和大家探討的則是機器視覺。
以特斯拉ModelS為例,想要實現(xiàn)自動駕駛功能必須購買包含前置距離雷達、攝像頭和圍繞在車身四周的12個超聲波傳感器在內(nèi)的自動駕駛套件,并且升級至最新的7.0系統(tǒng)。借助自適應巡航和輔助轉(zhuǎn)向技術(shù),ModelS已經(jīng)可以實現(xiàn)自動車道保持、自動變道和自動泊車三大功能。雖然這看起來更像是輔助駕駛,但是一定程度上已經(jīng)可以替代駕駛員的工作。ModelS上安裝的傳感器可以實現(xiàn)對周圍物體的監(jiān)測(比如測量前后車距),使用攝像頭進行監(jiān)測比傳統(tǒng)的超聲波傳感器更加精確和敏捷(因為周圍的汽車都處于高速運動的狀態(tài)),這就是機器視覺在無人駕駛汽車上的應用。
機器視覺讓無人機有了眼睛
今年3月大疆發(fā)布了新產(chǎn)品精靈4,這架內(nèi)置了5個攝像頭的無人機尤其引人關注。除了機身下方的云臺相機可用于攝影外,精靈4內(nèi)置的4個攝像頭均用來實現(xiàn)環(huán)境感知與壁障功能,這就是機器視覺在無人機行業(yè)的深入應用。無人機高速旋轉(zhuǎn)的槳葉使其具有一定的危險性,只有在戶外GPS信號良好的地方才可以安全飛行,而沒有GPS信號且充滿了各種電磁干擾的室內(nèi)則是無人機的“地獄”。但是內(nèi)置機器視覺攝像頭的無人機可以根據(jù)光流定位技術(shù)實現(xiàn)精確的定位與懸停,在室內(nèi)也可以穩(wěn)定飛行,這就大大拓展了無人機的使用場景。所以機器視覺讓無人機行業(yè)的發(fā)展進入了一個新的階段。
除了可以輔助定位和懸停外,機器視覺使得無人機的安全性進一步提升。以精靈4為例,前置的雙攝像頭可以實時感知前方飛行環(huán)境,如果遇到障礙物則實時調(diào)整飛行航線實現(xiàn)自動壁障。有了機器視覺攝像頭的加持,無人機仿佛有了眼睛,飛行安全性大大提升。這背后體現(xiàn)的技術(shù)原理則是飛控技術(shù)與機器視覺的深度融合,大疆CEO汪濤評價精靈4說:“至今為止我最滿意的產(chǎn)品,歡迎來到機器視覺的時代。”
機器視覺技術(shù)催熟機器人市場
機器人也許是智慧卻又孤獨的人類能夠制造出的最接近人類自身的產(chǎn)物,美國麥肯錫公司預測未來10年機器人市場將達到萬億美元的規(guī)模,比爾蓋茨更是表示二十年后家家戶戶都會擁有機器人。人類希望機器人也能夠擁有感覺、思維和學習能力,從而成為人類的助手和朋友。在組成機器人的三大模塊中,感知模塊是必備條件。有專家指出:“具有視覺、聽覺和觸覺,能夠自主行動的機器人才是真正意義上的機器人。”
機器視覺是人工智能正在快速發(fā)展的一個分支,人們希望機器擁有視覺并在某些應用中超越人類的完成人不可能完成的工作。在商業(yè)應用中,機器視覺技術(shù)可以幫助機器人廠商打造高端交互性強的智能機器人,并且隨著人工智能的發(fā)展以及云計算、大數(shù)據(jù)應用的深化,能夠讓機器人在非結(jié)構(gòu)化的環(huán)境中自主實現(xiàn)識別、思考和決策。
總結(jié):機器視覺的前景充滿機遇與挑戰(zhàn)
前不久一輛使用自動駕駛模式的特斯拉ModelS在美國佛羅里達州高速公路上發(fā)生了嚴重的車禍,駕駛員當場死亡,這是世界上第一例自動駕駛汽車致用戶死亡的案例。美國政府宣布已開始調(diào)查這起車禍,并正在評估肇事車特斯拉ModelS所裝配的自動駕駛系統(tǒng),這使得市場上狂熱的無人駕駛風潮暫時冷卻下來。特斯拉公司強調(diào),“自動駕駛系統(tǒng)只是輔助功能,這個系統(tǒng)是一項新技術(shù),仍然處于市場測試的第二階段。”
一年前,百度DLI副院長余凱辭職創(chuàng)業(yè)的新聞受到很多人的關注。近日余凱受邀參加了IEEE舉辦的CVPR會議(計算機視覺和模式識別領域的重要學術(shù)會議),在研討會期間余凱分享了自己的創(chuàng)業(yè)團隊“地平線”近期在智能交通領域的成果。最讓他引以為傲的成績是,基于DenseBox的算法在KITTI的全球排名中位列第一。KITTI數(shù)據(jù)集排名由德國卡爾斯魯厄理工學院和芝加哥豐田技術(shù)研究所聯(lián)合創(chuàng)辦,是國際上權(quán)威性較高的機動車輔助駕駛應用技術(shù)評估的算法評測平臺。也就是說余凱的地平線團隊在無人駕駛汽車與機器視覺領域走到了國際的前沿。
“特斯拉的企業(yè)風格仍屬于較激進的一派,因為包括技術(shù)在內(nèi),整個行業(yè)并沒有想象的那么成熟。”在談到特斯拉車主身亡事故時,余凱這樣對記者說。而說起在無人駕駛輔助系統(tǒng)全球領先的Mobileye公司時,余凱表示地平線提供的針對輔助駕駛的硬件和軟件方案在性能層面的部分指標甚至比Mobileye更高,而且基于中國復雜多變的路況特別優(yōu)化了一些識別算法。“比如說我在人群密集的中國馬路上開車,看到帶平板的三輪摩托很平常,但基于國外路況設計的Mobileye并不能識別到”。
不管市場會有怎樣的反映,人工智能的浪潮已經(jīng)襲來,首當其沖的就是機器視覺的技術(shù)革命。無人機、自動駕駛、智能醫(yī)生、智能安防等應用領域不斷突破,全球互聯(lián)網(wǎng)和半導體巨頭紛紛布局,顯示出智能圖像處理將是下一個競技場,機器視覺技術(shù)已經(jīng)迎來了黃金發(fā)展的時期。特斯拉會繼續(xù)完善自家Model汽車的無人駕駛功能,大疆會繼續(xù)深耕消費級無人機領域的視覺壁障與光流定位技術(shù),而地平線已經(jīng)勇敢地告別了互聯(lián)網(wǎng)模式,選擇了一條更踏實的技術(shù)性路線。工業(yè)4.0時代,機器視覺這個環(huán)節(jié)不可或缺。