“車(chē)載攝像頭”本身是指代并不算明確的詞,因?yàn)槿缃竦钠?chē)搭載越來(lái)越多的攝像頭,而不同作用的攝像頭,其規(guī)格和標(biāo)準(zhǔn)又是不盡相同的。
車(chē)載攝像頭大致分成了ADAS攝像頭、視覺(jué)攝像頭、車(chē)艙內(nèi)攝像頭、CMS、A V自動(dòng)駕駛。
這個(gè)分類(lèi)似乎是有些交疊的,但大方向上車(chē)內(nèi)與車(chē)外的攝像頭有差別,而讓人看的攝像頭與純粹用于數(shù)據(jù)分析的攝像頭又有差別。打個(gè)比方,手機(jī)攝像頭拍的照片要求拍得好看,是要發(fā)朋友圈的;而車(chē)載攝像頭要以“拍得到”為最高準(zhǔn)則。
汽車(chē)上的攝像頭按照是否給人看,也可以分成兩大類(lèi)。文首提到視覺(jué)攝像頭即視覺(jué)應(yīng)用是需要給人看的,像是電子后視鏡、某些環(huán)視系統(tǒng)。還有一類(lèi)是計(jì)算機(jī)視覺(jué)(機(jī)器視覺(jué)),應(yīng)用于自動(dòng)駕駛、自動(dòng)泊車(chē),這種攝像頭所攝畫(huà)面價(jià)值更不在于給人看,而是做數(shù)據(jù)分析。
自2012年機(jī)器學(xué)習(xí)成為新的熱門(mén),AI如今的發(fā)展變得如火如荼。機(jī)器學(xué)習(xí)是計(jì)算機(jī)視覺(jué)可應(yīng)用的一種解決問(wèn)題的方法。越來(lái)越多的神經(jīng)網(wǎng)絡(luò)把一些傳統(tǒng)的計(jì)算機(jī)視覺(jué)方法按在地上摩擦。在計(jì)算機(jī)視覺(jué)領(lǐng)域,AI成為一個(gè)不得不談的話題:計(jì)算機(jī)視覺(jué)因此能夠?qū)崿F(xiàn)更快速和準(zhǔn)確的圖像分類(lèi)、目標(biāo)檢測(cè)、目標(biāo)跟蹤、語(yǔ)義分割等。
車(chē)規(guī)級(jí)圖像質(zhì)量規(guī)范
如今的車(chē)載圖像傳感器,到底有哪些技術(shù)要求。ISO16505針對(duì)的主要是人眼視覺(jué)相關(guān)系統(tǒng)質(zhì)量的規(guī)范,比如說(shuō)電子后視鏡、環(huán)視系統(tǒng)等;不對(duì)人眼可見(jiàn)的機(jī)器視覺(jué)部分是非強(qiáng)制的。
IEEE P2020對(duì)于人眼視覺(jué)和機(jī)器視覺(jué)應(yīng)用都有對(duì)應(yīng)的規(guī)范,但這類(lèi)規(guī)范推進(jìn)的速度似乎還是比較緩慢。2018年9月發(fā)布的IEEE P2020 Automotive Imaging White Paper白皮書(shū)提到汽車(chē)攝像頭圖像質(zhì)量尚未被完全定義好,諸多關(guān)鍵指標(biāo)不明確。
與此同時(shí),P2020明確包含7個(gè)工作組,還是多少能夠看到未來(lái)的趨勢(shì)。歐陽(yáng)堅(jiān)在此前的演講中也提過(guò),“交通領(lǐng)域會(huì)遇到LED燈,紅綠燈時(shí)高頻閃爍的LED燈,如果不對(duì)高頻閃爍的頻率做處理,抓拍的信息就是殘缺不全的?!比搜蹖?duì)于頻率高于90Hz的閃爍不會(huì)有所察覺(jué),但對(duì)圖像傳感器而言,曝光時(shí)長(zhǎng)與LED光源調(diào)制信號(hào)產(chǎn)生一些錯(cuò)位時(shí),就產(chǎn)生了頻閃信息捕捉不全的問(wèn)題。
這一點(diǎn)實(shí)則也是思特威、OmniVision這類(lèi)圖像傳感器廠商研究的重要課題之一,雖然可能并非單純面向車(chē)載領(lǐng)域。而P2020工作組1針對(duì)這種頻閃,所做的工作包括闡明flicker產(chǎn)生的原因和細(xì)節(jié);列舉flicker出現(xiàn)的情況和潛在影響;定義flicker的測(cè)試方法和關(guān)鍵測(cè)試指標(biāo);定義flicker對(duì)人類(lèi)視覺(jué)/機(jī)器視覺(jué)影響的客觀測(cè)試指標(biāo)。
其二,P2020明確的工作組3研究針對(duì)計(jì)算機(jī)視覺(jué)的圖像質(zhì)量(Image quality for computer vision)。其方向主要更偏系統(tǒng)級(jí)測(cè)試。相比EMVA1288這種更偏單個(gè)組件的測(cè)試,系統(tǒng)級(jí)測(cè)試對(duì)于實(shí)際應(yīng)用是更有價(jià)值的。前面提到許多圖像質(zhì)量規(guī)范,比如其中的一些光學(xué)偽像、多攝像頭系統(tǒng)就不只是攝像頭乃至后端計(jì)算,其中一個(gè)組件的問(wèn)題。
車(chē)載圖像傳感器有哪些技術(shù)需求?
要將所有標(biāo)準(zhǔn)規(guī)范中提及的測(cè)試項(xiàng)悉數(shù)列出還是不現(xiàn)實(shí)的,所以我們根據(jù)圖像傳感器企業(yè)目前著力的宣傳點(diǎn)、新標(biāo)準(zhǔn)中針對(duì)車(chē)載攝像頭新出現(xiàn)的部分來(lái)嘗試總結(jié)ADAS/A V機(jī)器視覺(jué)對(duì)于圖像傳感器而言,提出了哪些要求,又有哪些新的發(fā)展方向。這里只討論圖像質(zhì)量,不探討車(chē)規(guī)級(jí)本身對(duì)于電子元器件在溫度、天氣等方面的嚴(yán)苛要求。
除了未來(lái)全自動(dòng)駕駛將變得更依托于機(jī)器視覺(jué),面向人類(lèi)視覺(jué)的圖像增強(qiáng)要求越來(lái)越低之外,還提到了幾個(gè)趨勢(shì):
(1)達(dá)到140dB的動(dòng)態(tài)范圍,800萬(wàn)像素單目分辨率、200萬(wàn)像素立體視覺(jué)相機(jī),超過(guò)60fps的幀率,高靈敏度;
(2)在0.001lux照度下,曝光時(shí)間不大于1/30秒的情況下,信噪比大于1;
(3)HDR高動(dòng)態(tài)范圍的同時(shí),要求運(yùn)動(dòng)偽像更少;
(4)LED flickering問(wèn)題消除。
這幾點(diǎn)實(shí)則都不出意外,也是當(dāng)代圖像傳感器廠商普遍在努力的方向,包括圖像傳感器自身的高動(dòng)態(tài)范圍、更高的分辨率、幀率,以及低照度下的靈敏度和低噪聲。雖然報(bào)告中列舉的部分參數(shù)還有些超前,現(xiàn)在的圖像傳感器制造商在這些目標(biāo)的實(shí)現(xiàn)上,卻都有自己的特長(zhǎng)。比如針對(duì)低光照環(huán)境,不少?gòu)S商在變革像素結(jié)構(gòu),同時(shí)開(kāi)始采用雙增益轉(zhuǎn)換來(lái)兼顧白天和夜間場(chǎng)景。
這里比較值得一提的是趨勢(shì)中提到的后兩點(diǎn)。首先是HDR高動(dòng)態(tài)范圍,以及要求更低的運(yùn)動(dòng)偽像。其中HDR是車(chē)載攝像頭所需實(shí)現(xiàn)的基本特性。畢竟當(dāng)場(chǎng)景光比很大時(shí),如果攝像頭拍攝的畫(huà)面有部分區(qū)域過(guò)曝或欠曝,計(jì)算機(jī)視覺(jué)分析工作A V就無(wú)法拿到對(duì)應(yīng)的數(shù)據(jù)。從圖像傳感器的角度,實(shí)現(xiàn)HDR有多重曝光、雙增益、大小像素分離,以及提高像素阱容等方法。
時(shí)域多重曝光的HDR方案在成像領(lǐng)域很常見(jiàn),但在ADAS/方向上的適用度正逐步降低——因?yàn)檐?chē)載攝像頭要求畫(huà)面不能有運(yùn)動(dòng)偽像,且必須抑制LED頻閃。所以像思特威這樣的廠商,開(kāi)始傾向于采用單幀空間域多曝光的方案,典型的方法像是隔行多曝光:圖像傳感器上每?jī)尚袨殚L(zhǎng)曝光,兩行為短曝光。ISSCC曾收錄過(guò)思特威有關(guān)單幀HDR技術(shù)的論文。
另外抑制運(yùn)動(dòng)偽像一個(gè)重點(diǎn)就是全局曝光(或全局快門(mén))。全局曝光也是現(xiàn)在幾乎所有圖像傳感器制造商都在爭(zhēng)奪的技術(shù)高地。傳統(tǒng)卷簾快門(mén)(rolling shutter)因?yàn)椴捎弥鹦衅毓獾姆绞剑臄z高速運(yùn)動(dòng)物體時(shí)會(huì)有果凍效應(yīng)(圖1)。全局快門(mén)是讓所有像素同時(shí)開(kāi)始和結(jié)束曝光,也就規(guī)避了這種形式的影像失真。
索尼的Pregius全局快門(mén)傳感器比較知名——ISSCC曾收錄過(guò)索尼一篇每個(gè)像素都應(yīng)用獨(dú)立ADC的論文(像素級(jí)互聯(lián)),這是快速讀出實(shí)現(xiàn)全局快門(mén)的技術(shù)之一;OmniVision也有類(lèi)似的技術(shù)介紹。索尼今年發(fā)布的第四代全局快門(mén)圖像傳感器終于也用上了BSI背照式技術(shù),減小了像素尺寸。此前思特威在宣傳中也提到,思特威是“全球?yàn)閿?shù)不多率先將全局曝光和BSI技術(shù)融合的公司之一”。
至于前文就提到的LED頻閃消除(圖2),這兩年思特威、OmniVision都在不遺余力地宣傳自家的圖像傳感器LED閃爍抑制技術(shù)。畢竟在自動(dòng)駕駛、智慧交通領(lǐng)域,LED頻閃導(dǎo)致攝像頭捕捉到的交通標(biāo)志、紅綠燈讀秒信息不全,會(huì)導(dǎo)致后端AI系統(tǒng)的誤判。
一般來(lái)說(shuō),LED頻閃抑制可以通過(guò)保持LED頻閃與圖像傳感器快門(mén)同步的方式,問(wèn)題是不同LED規(guī)格不一致,所以這種理論上的方案是不可行的。另外也可以通過(guò)HDR,在捕捉LED燈的畫(huà)面時(shí),確保能夠用更長(zhǎng)的曝光時(shí)間來(lái)捕捉更全面的信息。圖像傳感器廠商應(yīng)用的都是這個(gè)大思路,雖然在具體實(shí)施上存在差別,例如OmniVision應(yīng)用的是大小分離像素。
機(jī)器視覺(jué)感知的未來(lái)
從更偏系統(tǒng)的角度來(lái)看,大概還有一些技術(shù)趨勢(shì)是值得一談的。比如在傳感器角度,車(chē)載領(lǐng)域各種傳感器的融合會(huì)是個(gè)趨勢(shì),不僅是多攝系統(tǒng),還可能是不同類(lèi)別視覺(jué)傳感器的融合,比如LiDAR與攝像頭融合的傳感器;還有RGB-IR傳感器,為圖像傳感器融入紅外感知能力(如果把傳感器探討范圍擴(kuò)展到IR傳感器,可能還涉及到近紅外響應(yīng)增強(qiáng)等技術(shù)趨勢(shì),SWIR紅外攝像頭等)。
從整個(gè)成像/視覺(jué)系統(tǒng)的角度看,圖像傳感器將融合部分邊緣算力,可能也會(huì)成為一個(gè)趨勢(shì)。比如索尼就將AI邊緣計(jì)算與圖像傳感器做了結(jié)合(IMX500);SK hynix去年也在新聞稿中提到,基于先進(jìn)半導(dǎo)體制造工藝,堆棧式傳感器中,將一個(gè)簡(jiǎn)單的AI硬件引擎加入到傳感器下層的ISP中,已經(jīng)是可行的了……雖然這些暫時(shí)還不是面向汽車(chē)市場(chǎng)的。
思特威前兩年推出AISENS傳感器芯片平臺(tái),就是“感知與計(jì)算一體的通用AI傳感器芯片平臺(tái)”,此前思特威也提及以3D堆疊的方式將數(shù)據(jù)處理die與傳感器die封裝到一起。這個(gè)平臺(tái)如今似乎正趨于進(jìn)一步的商用化。
在機(jī)器視覺(jué)領(lǐng)域,基于事件的視覺(jué)傳感器是可以替代傳統(tǒng)基于幀的圖像傳感器技術(shù)的。而在成像領(lǐng)域,傳統(tǒng)圖像傳感技術(shù)本身是沒(méi)有問(wèn)題的。機(jī)器視覺(jué)領(lǐng)域的變革,大概還會(huì)有一波全新的浪潮。