視覺感知正在經(jīng)歷一輪新的市場(chǎng)變革。
特斯拉“拋棄”傳統(tǒng)毫米波雷達(dá),原因是目前的視覺(攝像頭)與雷達(dá)的前融合,還無法經(jīng)受復(fù)雜道路場(chǎng)景的考驗(yàn),尤其是非4D成像雷達(dá)無法在感知能力上與攝像頭的分辨率匹配(前融合)。
目前,在面向高階智能駕駛賽道,一部分廠商不斷強(qiáng)化純視覺感知能力,比如,特斯拉、Mobileye(也在布局4D成像雷達(dá)、激光雷達(dá)),同時(shí)依賴數(shù)據(jù)訓(xùn)練迭代;另一部分則尋求通過雙目立體視覺+激光雷達(dá)+高分辨率雷達(dá)來實(shí)現(xiàn),比如,雷克薩斯、奔馳S。
同時(shí),單目攝像頭也在尋求擴(kuò)展“深度估計(jì)”感知能力,比如,密集光流技術(shù)+自監(jiān)督單目圖像深度估計(jì)。不過,通過平面2D幀來實(shí)現(xiàn)3D視圖,單目系統(tǒng)存在可靠性難題(比如,對(duì)不同復(fù)雜場(chǎng)景、動(dòng)靜態(tài)物體感知的性能指標(biāo)能否達(dá)到同樣的水準(zhǔn)),技術(shù)門檻較高。
在行業(yè)人士看來,距離準(zhǔn)確度和精度是更高級(jí)別自動(dòng)輔助駕駛的關(guān)鍵組成部分。激光雷達(dá)、4D成像雷達(dá)是解決方案之一,但仍需要可見光/紅外攝像頭感知能力的提升來配合。
突破方向之一,就是雙目立體視覺。這個(gè)在過去被行業(yè)視為小眾技術(shù)路線的方案,正在演變成高階智能駕駛系統(tǒng)的主流方案。同時(shí),更多供應(yīng)商的進(jìn)入,也讓雙目立體視覺(甚至搭配雷達(dá)的情況下)的系統(tǒng)成本具備挑戰(zhàn)傳統(tǒng)1V1R的可行性。
在前裝市場(chǎng),去年開始,雙目立體視覺的搭載車型也在增加,并且不再只是豪華品牌的專屬。比如,吉利旗下星越L、領(lǐng)克07/09、極狐阿爾法S華為HI版以及更多自主品牌新車正在陸續(xù)“升級(jí)”雙目立體視覺配置。
一、重新認(rèn)識(shí)“雙目立體視覺”
高工智能汽車研究院監(jiān)測(cè)數(shù)據(jù)顯示,2021年全年國(guó)內(nèi)新車(自主+合/獨(dú)資)標(biāo)配雙目立體視覺ADAS上險(xiǎn)量為22.4萬(wàn)輛,同比上年增長(zhǎng)13.71%。而在供應(yīng)端,除了日立、Veoneer、大陸、博世等傳統(tǒng)雙目立體視覺方案商,也有不少初創(chuàng)公司進(jìn)入賽道。
實(shí)際上,不管是瑞薩、TI、安霸還是英偉達(dá)、高通等芯片廠商,對(duì)于雙目立體視覺應(yīng)用都有支持。比如,瑞薩的R-Car V3H,除了支持多傳感融合、高達(dá)800萬(wàn)像素?cái)z像頭的ISP,同時(shí)支持用于CNN、密集光流、立體視覺和物體分類的專用硬件加速器。
而在面向域控制器賽道,安霸半導(dǎo)體最新發(fā)布的大算力SoC-CV3(等效算力500TOPS,上圖為架構(gòu))就自帶了雙目立體視覺引擎和稠密光流引擎,從而實(shí)現(xiàn)深度檢測(cè)和運(yùn)動(dòng)感知。
考慮到高階智能駕駛賽道還處于早期階段,不同技術(shù)路線的博弈還沒有定論。這為雙目立體視覺(實(shí)際上斯巴魯量產(chǎn)搭載雙目和Mobileye成立時(shí)間都在1999年)提供了爭(zhēng)奪份額的機(jī)會(huì)。
兩年前,Xilinx宣布將與斯巴魯合作,基于汽車級(jí)Zynq UltraScale+多處理器芯片系統(tǒng)(MPSoC),為其下一代雙目高級(jí)駕駛輔助系統(tǒng)提供算力支持。同時(shí),雙目立體視覺方案商也同步更換為Veoneer。
按照斯巴魯?shù)恼f法,新一代系統(tǒng)采用的圖像處理技術(shù)可以掃描立體攝像機(jī)捕捉到的所有信息,并創(chuàng)建高精度的3D點(diǎn)云,從而更好的應(yīng)對(duì)高級(jí)別自動(dòng)駕駛場(chǎng)景。
隨后,豐田旗下豪華品牌雷克薩斯在2020年底正式上市最新一代LS轎車,除了搭載由電裝開發(fā)的激光雷達(dá),還有雙目立體攝像頭,可以實(shí)現(xiàn)在高速公路上自動(dòng)換道并實(shí)現(xiàn)換道超車。
緊接著,去年底梅賽德斯·奔馳全新一代Drive Pilot系統(tǒng)(首發(fā)搭載新一代S級(jí)轎車)獲得監(jiān)管機(jī)構(gòu)L3級(jí)(低速)自動(dòng)駕駛上路許可,前置雙目立體視覺+毫米波雷達(dá)+激光雷達(dá)的配置成為焦點(diǎn)。
按照此前公開的數(shù)據(jù),這套感知系統(tǒng)的選裝價(jià)格低于9500美元。其中,雙目立體視覺感知(視場(chǎng)角70度)由Veoneer提供,完全集成硬件和感知軟件(CNN+3D立體視覺,對(duì)車前物體進(jìn)行精確分類和定位),支持車道檢測(cè)、可行駛區(qū)域檢測(cè)、小障礙物檢測(cè)和三維物體分類。
這其中,雙目立體視覺與激光雷達(dá)的數(shù)據(jù)前融合能力被激發(fā)。
從物理性能來看,激光雷達(dá)通過測(cè)量光信號(hào)從物體反射到車端傳感器所需要的時(shí)間來提供距離測(cè)量。類似的,雙目立體視覺也提供距離估計(jì),基于從兩個(gè)不同的視角獲取的視覺信息的三角測(cè)量結(jié)果。
而通過立體視覺生成的數(shù)據(jù)更豐富,這反過來使激光雷達(dá)的障礙檢測(cè)更容易。此外,在弱光場(chǎng)景下,立體視覺的分辨率也很高(這一點(diǎn)在4D成像雷達(dá)也可以奏效)。
此外,在測(cè)距方面,立體視覺通過處理兩幅圖像得到的間接測(cè)量。但無論如何,立體視覺都能夠提供遠(yuǎn)程(不強(qiáng)制要求精確測(cè)量距離)和短程(要求高精度執(zhí)行精確機(jī)動(dòng))應(yīng)用所需的精度水平。
在這方面,立體視覺可以與激光雷達(dá)形成很好的互補(bǔ)關(guān)系。同時(shí),立體視覺提供的雙重圖像還可以用來并行執(zhí)行單目CNN算法,如物體分類。而其特有的優(yōu)勢(shì)在于,不需要單目視覺過于依靠深度學(xué)習(xí)能力,實(shí)現(xiàn)對(duì)未知障礙物的感知。
“我們把立體視覺的機(jī)械工程問題轉(zhuǎn)變?yōu)檐浖栴},”NODAR公司創(chuàng)始人Dr. Leaf Jiang表示,針對(duì)遠(yuǎn)距離探測(cè),可以基于軟件算法創(chuàng)新,實(shí)現(xiàn)兩顆攝像頭超大距離的寬基線配置,同時(shí)允許機(jī)械公差和主動(dòng)補(bǔ)償功能。
與此同時(shí),目前一些車企搭載的多目攝像頭方案,也同樣可以通過立體視覺成像方案來進(jìn)行“硬件復(fù)用”。比如,兩顆攝像頭的視場(chǎng)交集部分,即便是不同焦距、不同距離的攝像頭。這打破了過去對(duì)雙目立體視覺的傳統(tǒng)認(rèn)知(固定基線、規(guī)格統(tǒng)一)。
案例之一就是特斯拉。
在“棄用”雷達(dá)的同時(shí),特斯拉在FSD軟件中開始采用多攝像頭+實(shí)時(shí)運(yùn)行神經(jīng)網(wǎng)絡(luò)的技術(shù)路線,這其中就可能采用了兩種技術(shù),主要就是通過軟件技術(shù)來實(shí)現(xiàn)硬件“升級(jí)”。
一是類似立體視覺,通過兩顆攝像頭重疊視場(chǎng)或者類似虛擬立體技術(shù)(實(shí)際分辨率是原有攝像頭的1/8,同時(shí)在中距區(qū)間內(nèi)發(fā)揮作用);二是運(yùn)動(dòng)視差技術(shù),通過連續(xù)幀追蹤物體(與背景和其他物體相對(duì)移動(dòng)),來實(shí)現(xiàn)深度預(yù)估。
最近,特斯拉宣布,在原有Model 3和Model Y車型基礎(chǔ)上,今年2月中旬開始,Model S和Model X車型也開始“移除”毫米波雷達(dá)。這意味著,特斯拉正式完成全系車型的純視覺感知能力,技術(shù)成熟度已經(jīng)達(dá)到一定水準(zhǔn)。
“每增加一個(gè)傳感器,就會(huì)增加系統(tǒng)的輸入帶寬要求。因此,需要找到傳感器的最優(yōu)配置,應(yīng)該限制傳感器的總數(shù),但不限制捕獲的數(shù)據(jù)的數(shù)量和類型?!碧厮估膶@牧线@樣寫道。
當(dāng)然,還有一些企業(yè)采用非可見光紅外攝像頭來補(bǔ)充立體視覺感知的能力。比如,QuadSight的四目視覺系統(tǒng),在現(xiàn)有雙目立體系統(tǒng)的基礎(chǔ)上,增加了兩個(gè)紅外攝像頭,這使得探測(cè)范圍從可見光擴(kuò)展到紅外波段。
二、爭(zhēng)奪規(guī)?;涞貦C(jī)會(huì)
但要成為主流,任何一種感知方案都要經(jīng)受成本的考驗(yàn)。
而對(duì)于雙目立體視覺方案來說,短期內(nèi)更大的機(jī)會(huì)或許在法規(guī)(新車評(píng)級(jí))入門級(jí)市場(chǎng)。畢竟,在高階智能駕駛賽道,任何技術(shù)路線還都處于小規(guī)模上車周期。
高工智能汽車研究院監(jiān)測(cè)數(shù)據(jù)顯示,2021年度中國(guó)市場(chǎng)(不含進(jìn)出口)15萬(wàn)元及以下新車上險(xiǎn)量達(dá)到1120.11萬(wàn)輛,占全部新車比重超50%,同比保持小幅增長(zhǎng)。
而在ADAS(L0-L2)部分,這個(gè)價(jià)格區(qū)間的前裝搭載率僅為19.73%,低于市場(chǎng)平均水平近20個(gè)百分點(diǎn)。這個(gè)區(qū)間由于成本敏感度高,近年來,基于純單目前向視覺感知方案異軍突起。
此前,包括采埃孚、法雷奧、智駕科技、知行科技、福瑞泰克等Tier1供應(yīng)商開始前裝交付基于單攝像頭(寬視場(chǎng)角)的L1/L2級(jí)輔助駕駛方案,再通過360度環(huán)視/周視,可以實(shí)現(xiàn)更高階感知。
2020年7月,采埃孚在中國(guó)市場(chǎng)首發(fā)量產(chǎn)基于單攝像頭(S-Cam4.8)的L2單車道智能駕駛系統(tǒng),搭載于自主品牌哈弗SUV熱銷車型,該項(xiàng)目由采埃孚中國(guó)團(tuán)隊(duì)負(fù)責(zé)開發(fā)。更多的中國(guó)供應(yīng)商也在入局。
比如,知行科技的第二代產(chǎn)品IFC2.0(單目攝像頭方案)提升了2倍的FOV(100°),提供十字路口輔助相關(guān)功能;同時(shí),基于比第一代提升3倍的算力,可以同時(shí)跟蹤更多的目標(biāo)。這套性價(jià)比極高的方案同樣可實(shí)現(xiàn)L2級(jí)自動(dòng)駕駛輔助系統(tǒng)。
按照該公司的說法,單攝像頭方案對(duì)整個(gè)系統(tǒng)的識(shí)別、定位、規(guī)劃、控制等環(huán)節(jié)的精度要求非常高,方案的成功量產(chǎn)充分證明公司在核心算法、軟硬件開發(fā)和系統(tǒng)集成驗(yàn)證方面的技術(shù)能力。
此外,按照高階智能駕駛技術(shù)架構(gòu)的發(fā)展趨勢(shì),這套基于單目感知的低成本、高性價(jià)比方案同時(shí)可以作為復(fù)雜多傳感+域控制器方案的冗余備份。不過,單目要“優(yōu)化”性能,需要大量的數(shù)據(jù)迭代。
隨著新車評(píng)級(jí)指標(biāo)的逐步升級(jí),以及車企對(duì)于技術(shù)路線選擇、功能差異化的考慮,也給了雙目立體視覺感知方案一次突圍的機(jī)會(huì)。“如果從系統(tǒng)開發(fā)角度,而不是單一的硬件考慮,雙目立體視覺方案已經(jīng)可以與單目抗衡成本,”行業(yè)人士指出。
一直以來,受限于成本及量產(chǎn)開發(fā)難度、可選供應(yīng)商數(shù)量少等原因,雙目立體視覺僅僅是小眾化的感知方案,但在不依靠毫米波雷達(dá)的情況下,同樣具備獨(dú)立實(shí)現(xiàn)各種ADAS功能的能力。
同時(shí),隨著高分辨率攝像頭的逐步上車,車端處理器能力的提升以及實(shí)時(shí)在線校準(zhǔn)、深度學(xué)習(xí)實(shí)現(xiàn)分類等技術(shù)的成熟,雙目立體視覺方案已經(jīng)具備挑戰(zhàn)能力。和幾年前相比,供應(yīng)商的能力和方案成熟度也已經(jīng)進(jìn)入新的周期。
以元橡科技自主研發(fā)的智能立體視覺高級(jí)ADAS系統(tǒng)解決方案為例,可以智能識(shí)別全類型障礙物、精準(zhǔn)記錄位置信息,30米以內(nèi)精度達(dá)到99%,最遠(yuǎn)可探測(cè)200米距離(平均誤差低于5%),實(shí)時(shí)畫面延遲達(dá)到毫秒級(jí)。
此外,通過幾代系統(tǒng)的迭代升級(jí),根據(jù)美國(guó)公路安全協(xié)會(huì)(IIHS)的數(shù)據(jù),斯巴魯?shù)腅yeSight(立體視覺)駕駛輔助系統(tǒng)可以將追尾事故的可能性降低至多85%,甚至比很多搭載單目+毫米波雷達(dá)的車型數(shù)據(jù)還要高出不少。
而傳統(tǒng)的單目視覺最大的瓶頸在于對(duì)訓(xùn)練樣本的依賴,即便擁有海量數(shù)據(jù)用來訓(xùn)練深度模型,仍然無法保證能夠正確處理所有場(chǎng)景,特別是對(duì)于低頻出現(xiàn)的非常見障礙物。這也是為什么不少企業(yè)開始動(dòng)起了“數(shù)據(jù)迭代,驅(qū)動(dòng)系統(tǒng)優(yōu)化”的模式。
不同的是,雙目立體攝像頭是一個(gè)具有天然測(cè)量能力的傳感器,能直接得到物體空間位置和大小,可以對(duì)任意障礙物進(jìn)行檢測(cè),而不只針對(duì)事先訓(xùn)練的模型,避免因漏檢造成意外風(fēng)險(xiǎn)。
同時(shí),這也是一個(gè)天然融合的傳感器,將深度學(xué)習(xí)和圖像學(xué)習(xí)進(jìn)行有效糅合(特斯拉似乎在專利中也有提及),以應(yīng)對(duì)部分惡劣天氣和照明條件,從而解決單目感知的全場(chǎng)景覆蓋的瓶頸。
這也解決了目前絕大部分單目+毫米波雷達(dá)融合方案的可靠性難題。但同時(shí),視覺側(cè)能力的提升,意味著毫米波雷達(dá)可以專注于自己的能力范圍,比如,提高車輛空間感知能力。
這意味著,相比于“前融合”的開發(fā)難度,雙目立體視覺+雷達(dá)降低了系統(tǒng)開發(fā)成本?!鞍l(fā)揮各自所長(zhǎng),比拉郎配,效果更好”。
以全新奔馳S級(jí)轎車L3級(jí)系統(tǒng)為例,Veoneer的雙目立體感知方案,基于CNN深度學(xué)習(xí)技術(shù),結(jié)合3D立體視覺,對(duì)車前物體進(jìn)行精確分類和定位,實(shí)現(xiàn)車道檢測(cè)、自由空間檢測(cè)、小障礙物檢測(cè)和三維物體分類。
相比較而言,這款車搭載的毫米波雷達(dá)和激光雷達(dá)都不是性能“爆表”的產(chǎn)品。比如,法雷奧的第二代混合固態(tài)激光雷達(dá)SCALA2,大陸集團(tuán)的長(zhǎng)距離毫米波雷達(dá)ARS510(并非ARS540的4D成像)。
這意味著,從系統(tǒng)而非單一傳感器角度來看,雙目立體視覺的優(yōu)勢(shì)在于可以降低其他傳感器與感知系統(tǒng)進(jìn)行協(xié)同數(shù)據(jù)融合開發(fā)的難度和成本。
“這將打開全新的感知組合設(shè)計(jì)選項(xiàng),并站在系統(tǒng)的角度降低全生命周期開發(fā)成本,再加上攝像頭的復(fù)用,還可以提供冗余的感知能力?!睒I(yè)內(nèi)人士表示。
數(shù)據(jù)顯示,從去年開始,國(guó)內(nèi)不少車企(包括商用車、乘用車)已經(jīng)開始選擇雙目立體視覺方案作為前裝量產(chǎn)定點(diǎn),預(yù)計(jì)未來三年,將是放量周期。