隨著機(jī)器視覺(jué)技術(shù)的持續(xù)創(chuàng)新,其在工業(yè)生產(chǎn)中的應(yīng)用優(yōu)勢(shì)也在逐漸擴(kuò)大。機(jī)器視覺(jué)檢測(cè)速度快、檢測(cè)精度高、對(duì)環(huán)境要求較低,且能夠做到24小時(shí)持續(xù)作業(yè)。不僅如此,機(jī)器視覺(jué)在觀測(cè)精度方面達(dá)到256灰度級(jí),大大超過(guò)人眼識(shí)別的64灰度級(jí),能夠分辨微小的目標(biāo),達(dá)到觀測(cè)微米級(jí)目標(biāo)的能力。
機(jī)器視覺(jué)技術(shù)的發(fā)展,使其應(yīng)用范圍逐漸擴(kuò)展到工業(yè)、農(nóng)業(yè)、航天、交通等國(guó)民經(jīng)濟(jì)的各個(gè)行業(yè)。據(jù)相關(guān)部門(mén)預(yù)測(cè),2025年機(jī)器視覺(jué)行業(yè)的市場(chǎng)規(guī)模將達(dá)到246億元,且隨著行業(yè)的快速發(fā)展,近幾年的行業(yè)復(fù)合增長(zhǎng)率將達(dá)到25.5%。
3D所造,無(wú)限視界。
這是另一個(gè)視界,以前我們所說(shuō)機(jī)器視覺(jué),通常是指2D的視覺(jué)系統(tǒng),即通過(guò)攝像頭拍到一個(gè)平面的照片,然后通過(guò)圖像分析或比對(duì)來(lái)識(shí)別物體,能看到物體一個(gè)平面上特征。
過(guò)于“平面”的2D機(jī)器視覺(jué),在AI初探階段和應(yīng)用上半場(chǎng),是主流也可發(fā)揮幾大應(yīng)用價(jià)值;而當(dāng)轉(zhuǎn)型深水區(qū),痛點(diǎn)應(yīng)用場(chǎng)景與深挖數(shù)據(jù)價(jià)值,就難以繼任了。
專攻場(chǎng)景,那為了更加透明與徹底的“開(kāi)眼看世界”,3D機(jī)器視覺(jué),隨即而至。
01.
機(jī)器視覺(jué)持續(xù)火熱,下游應(yīng)用場(chǎng)景擴(kuò)展
在智能制造的浪潮中,生產(chǎn)線對(duì)工業(yè)設(shè)備質(zhì)量檢驗(yàn)的要求不斷增加,在這一環(huán)境下,機(jī)器視覺(jué)系統(tǒng)憑借快速獲取圖像信息并進(jìn)行分析的能力,受到眾多行業(yè)的青睞,為機(jī)器視覺(jué)在多領(lǐng)域應(yīng)用鋪平了道路。
近年來(lái),機(jī)器視覺(jué)行業(yè)的新技術(shù)不斷發(fā)展,在識(shí)別、定位、檢測(cè)、測(cè)量等多方面能力有進(jìn)一步提升。識(shí)別功能可以檢查物品的存在或不存在,以及判斷是否有缺陷;定位功能可以快速找到檢測(cè)產(chǎn)品并確認(rèn)其位置;檢測(cè)功能可以將表面存在缺陷的產(chǎn)品進(jìn)行檢出;測(cè)量功能能夠通過(guò)非接觸測(cè)量的方式,自動(dòng)測(cè)量產(chǎn)品的外觀尺寸。
除此之外,3D視覺(jué)的出現(xiàn)也進(jìn)一步帶動(dòng)機(jī)器視覺(jué)行業(yè)市場(chǎng)的火熱。3D視覺(jué)系統(tǒng)能夠更詳細(xì)地檢測(cè)產(chǎn)品,無(wú)論是在檢測(cè)應(yīng)用中進(jìn)行更高級(jí)識(shí)別,還是在計(jì)量應(yīng)用中實(shí)現(xiàn)更好對(duì)象的差異化,3D視覺(jué)能帶來(lái)更多先進(jìn)的功能。受益于機(jī)器視覺(jué)相關(guān)技術(shù)的發(fā)展,其場(chǎng)景應(yīng)用邊界持續(xù)擴(kuò)展,目前已經(jīng)在汽車、醫(yī)療、物流、新能源、半導(dǎo)體等制造行業(yè)有大量的應(yīng)用案例。
從下游應(yīng)用產(chǎn)業(yè)來(lái)看,3D視覺(jué)已經(jīng)在汽車、半導(dǎo)體、薄膜、鋰電、面板、3C、光伏、物流、PCB、食品飲料等多個(gè)行業(yè)落地。
正面戰(zhàn)場(chǎng),各家使出看家本領(lǐng)搶市場(chǎng)、推方案,在后方戰(zhàn)場(chǎng),他們?cè)诜雷o(hù)等級(jí)、穩(wěn)定性、精度、掃描速度、數(shù)據(jù)傳輸?shù)鹊确矫嫱诤拥?、修筑高墻?/p>
在這場(chǎng)共同奔赴的背后,出現(xiàn)了四股代表勢(shì)力:機(jī)器視覺(jué)元老、AI視覺(jué)企業(yè)、機(jī)器人部落、互聯(lián)網(wǎng)科技巨頭。
02.
3D機(jī)器視覺(jué),入安防
而關(guān)于這一切,可追本溯源。
對(duì)于3D 的AI機(jī)器,被大眾所關(guān)注,還源于蘋(píng)果公司2017年iPhone X中首次搭載3D結(jié)構(gòu)光技術(shù),其技術(shù)原理是通過(guò)近紅外激光器向物體投射具有一定結(jié)構(gòu)特征的光線,再由專門(mén)的紅外攝像頭進(jìn)行采集獲取物體的三維結(jié)構(gòu),通過(guò)運(yùn)算對(duì)信息進(jìn)行深入處理成像。
該技術(shù)經(jīng)過(guò)多年輪轉(zhuǎn)與進(jìn)化,依然沿用至今,可見(jiàn)3D機(jī)器視覺(jué)技術(shù),還是早晨七八點(diǎn)鐘的太陽(yáng),仍然升起中。
除了最為人所知的結(jié)構(gòu)光技術(shù),3D機(jī)器視覺(jué)另外兩大技術(shù)方向是雙目視覺(jué)、ToF(飛行時(shí)間法)。
之于安防,從平面到立體的視覺(jué)革命也可追溯,雙目技術(shù)應(yīng)用也在2017年左右,頭部企業(yè)的雙目攝像機(jī)初出茅廬,而發(fā)展至今連很多智能門(mén)禁產(chǎn)品也采用雙目技術(shù)來(lái)增加視覺(jué)的立體感。
既然是安防行業(yè)應(yīng)用最為成熟的3D機(jī)器視覺(jué)雛形,還是有必要介紹下,何為雙目視覺(jué)。
它的原理就像我們?nèi)说膬芍谎劬?,用兩個(gè)視點(diǎn)觀察同一景物,以獲取在不同視角下的感知圖像,然后通過(guò)三角測(cè)量原理計(jì)算圖像的視差,來(lái)獲取景物的三維信息。
這絕非1+1=2的兩個(gè)攝像頭簡(jiǎn)單堆料,而是從三維角度在視覺(jué)中的立體感知,所以,很多雙目攝像機(jī)就僅僅只是多了個(gè)攝像頭的視覺(jué)場(chǎng)景而已,這絕非本文探討之處。
江河入海流,安防要流入AIoT汪洋大海,在機(jī)器視覺(jué)的征途,才萬(wàn)里長(zhǎng)征第一步。
而接下來(lái)的一步,是著力提升圖像視頻類感知的深度和緯度,一改2D時(shí)代過(guò)于依賴于光照和顏色/灰度變化,提升測(cè)量精度易受變量照明條件制約能力,同時(shí),讓4K等超高清真正規(guī)?;@是3D的擅長(zhǎng),在主動(dòng)光技術(shù)、空間三維數(shù)據(jù)、背景分離等方面帶來(lái)質(zhì)變。
那隨之而解的問(wèn)題是,安防中的2D與3D場(chǎng)景應(yīng)用,有何不同。
其一,是光線,2D攝像頭在光線較暗的場(chǎng)景下成像質(zhì)量非常差,尤其是需要附加類似智能分析的功能時(shí),分析效率存在較大問(wèn)題,會(huì)有很多錯(cuò)檢、漏檢,雖然會(huì)有紅外光進(jìn)行補(bǔ)充,但實(shí)際上在紅外上做智能分析會(huì)缺失很多信息。
其二,是人體特征檢測(cè),2D只有XY這樣的平面信息,缺乏深度數(shù)據(jù),無(wú)法對(duì)目標(biāo)進(jìn)行精準(zhǔn)定位與持續(xù)跟蹤。
最后,目標(biāo)重疊的時(shí)候,2D攝像頭很難把分析目標(biāo)從背景中分離出來(lái)。而且2D無(wú)法做活體檢測(cè),人臉識(shí)別中,如果沒(méi)有3D的活體檢測(cè),很容易受到照片與視頻的偽裝攻擊。
為此,3D機(jī)器視覺(jué)入安防,視界前所未見(jiàn)。
首先,3D是主動(dòng)光技術(shù),可以在完全無(wú)光照環(huán)境下正常的工作。在強(qiáng)光、逆光環(huán)境下也能達(dá)到較好成像效果。
第二,可以獲取空間中的三維數(shù)據(jù),包括尺寸測(cè)量,空間中人、車的位置,身高、體重、距離、速度等,都可以精準(zhǔn)的計(jì)算出來(lái)。
另外還可以進(jìn)行背景分離,實(shí)現(xiàn)實(shí)時(shí)的、動(dòng)態(tài)的人體人像摳圖,在進(jìn)行智能分析時(shí)去除背景干擾,提高算法分析準(zhǔn)確率。
還可以進(jìn)行活體檢測(cè)與識(shí)別,在家庭安防、車內(nèi)安防等私密場(chǎng)景中,我們只需要一些深度信息,即可以實(shí)現(xiàn)這種安全監(jiān)控與行為分析。
總之,人工智能的核心任務(wù)之一就是讓機(jī)器能夠像人一樣感知世界、理解世界。
人類對(duì)于世界的理解主要依靠視覺(jué),視覺(jué)信息占人腦處理信息比重高達(dá)85%,聲音及其他感官占15%,處理視覺(jué)信息的神經(jīng)元也在人腦中占面積最大。
并且,人眼是非常典型的三維相機(jī),人腦處理的也是立體的視覺(jué)信息,正是由于人類具備立體視覺(jué)能力,在生物進(jìn)化過(guò)程中才能躲避天敵、圍捕打獵、使用工具等,實(shí)現(xiàn)與三維世界的準(zhǔn)確交互。
要讓機(jī)器像人一樣,先要具備人眼一樣的立體感知能力,還要有能夠處理和理解三維信息的大腦算法,即三維全棧技術(shù)的相機(jī)和算法兩個(gè)方面。
3D機(jī)器視覺(jué),打開(kāi)新的成長(zhǎng)空間,開(kāi)啟另一個(gè)視界。
03.
一片藍(lán)海,搶票市場(chǎng)“入場(chǎng)券”
心在桃園外,兀自笑春風(fēng),3D機(jī)器視覺(jué)以場(chǎng)景為靶心,技術(shù)能力的進(jìn)階之風(fēng)將吹滿地,看其市場(chǎng),可謂“滿城盡帶黃金甲”。
一來(lái),新基建的幾年在疫情肆虐下,盡管AI科技向善,為戰(zhàn)疫寫(xiě)下了濃墨重彩一筆,但3D機(jī)器視覺(jué)的應(yīng)用卻鮮而有之,這一市場(chǎng),仍然是方興未艾。
多年積壓的市場(chǎng)痛點(diǎn)與剛需,在國(guó)家發(fā)布諸多利好政策下,推動(dòng)3D機(jī)器視覺(jué)產(chǎn)業(yè)發(fā)展,同時(shí)工業(yè)制造智能化升級(jí)的市場(chǎng)需求旺盛,政策、需求“雙動(dòng)力”打開(kāi)了3D機(jī)器視覺(jué)市場(chǎng)藍(lán)海。
這一片藍(lán)海,究竟有多大?據(jù)GGII數(shù)據(jù)預(yù)測(cè),2025年中國(guó)機(jī)器視覺(jué)市場(chǎng)總規(guī)模將達(dá)到468.74億元,其中2D視覺(jué)市場(chǎng)規(guī)模將超過(guò)360億元。
數(shù)據(jù)還顯示,2021年我國(guó)3D視覺(jué)市場(chǎng)增速超過(guò)100%,預(yù)計(jì)到2023年3D視覺(jué)市場(chǎng)規(guī)模將達(dá)到35億元左右,到2025年3D機(jī)器視覺(jué)市場(chǎng)規(guī)模將超過(guò)100億元。
從數(shù)據(jù)中可以看出,2D視覺(jué)技術(shù)仍是當(dāng)下主流,但3D視覺(jué)技術(shù)則是未來(lái)趨勢(shì)。
目前,金融支付、智能門(mén)鎖、軌道交通、智能汽車等領(lǐng)域都對(duì)3D傳感器以及3D算法有著極大的需求,保守估計(jì)已成千億級(jí)藍(lán)海市場(chǎng)。
海闊天空任魚(yú)躍,盡管是市場(chǎng)藍(lán)海,但謹(jǐn)慎者也不乏一眾,認(rèn)為3D機(jī)器視覺(jué)仍然處于長(zhǎng)尾市場(chǎng),需求還需培育中。
同時(shí),算法的高山,還得再攀登。就像建筑一幢高樓,人們?cè)诟懈湃A麗外殼的同時(shí),更應(yīng)該注意到它打下的牢固地基。目前市面上基于 3D 視覺(jué)的應(yīng)用可千姿百態(tài),而如何從“同質(zhì)化”中獲取獨(dú)樹(shù)一幟的體驗(yàn),還得看核心功底,即背后的算法了。
04.
圍捕打獵,場(chǎng)景爭(zhēng)奪戰(zhàn)一觸即發(fā)
專攻賽道后,很多3D機(jī)器視覺(jué)廠家盡管先行一步,但后繼者前仆后繼,如圍捕打獵,在場(chǎng)景之中,定勝負(fù)。
其實(shí)可以看到這一市場(chǎng)格局或現(xiàn)狀,為客戶創(chuàng)造價(jià)值,這仿佛是每家AI企業(yè)不變的企業(yè)愿景和努力方向,但真正做到的,卻并不多,這也是很多AI企業(yè)光有技術(shù)卻無(wú)場(chǎng)景落地的尷尬現(xiàn)狀。
關(guān)于三維機(jī)器視覺(jué)在安防應(yīng)用場(chǎng)景,從技術(shù)端可以從視頻結(jié)構(gòu)化和識(shí)別技術(shù)上突破,來(lái)反哺場(chǎng)景,實(shí)現(xiàn)技術(shù)價(jià)值。
以識(shí)別技術(shù)為例來(lái)看,3D機(jī)器視覺(jué)的這個(gè)三維不僅體現(xiàn)在數(shù)據(jù)收集上,在識(shí)別算法上,采用的也是針對(duì)三維數(shù)據(jù)的人臉識(shí)別算法,因此在準(zhǔn)確率、安全性等方面都應(yīng)提升。
作為蘋(píng)果同源結(jié)構(gòu)光技術(shù),基于結(jié)構(gòu)光能夠保證在近距離情況下的極高精度,用于識(shí)別的三維深度感知技術(shù)在4K分辨率5米范圍內(nèi),精度達(dá)到1mm誤差,人臉重建精度保持在平均1.5mm以內(nèi),三維人像識(shí)別錯(cuò)誤率可做到十億分之一??梢詫⒅亟ň茸龅胶撩准?jí),且移動(dòng)設(shè)備幀率達(dá)到40幀/秒。
這個(gè)精度,保證了可以動(dòng)態(tài)采集并重建場(chǎng)景中的三維信息,同時(shí)提高對(duì)身份信息的采集和管控效率結(jié)構(gòu)光深度感知、三維實(shí)時(shí)高精度重建、三維跟蹤識(shí)別及感知等技術(shù)方向,再進(jìn)一步。
當(dāng)然,從應(yīng)用端來(lái)看,智能所向往是安防業(yè)務(wù)從事后查證向事前預(yù)警前移的需求變化。
而行業(yè)邏輯是越是高清,越是數(shù)據(jù)量豐富與立體的感知,越能為最終智能決策與分析,提供最優(yōu)感知源,這也是3D機(jī)器視覺(jué)可以破局之道。
在智能時(shí)代誰(shuí)都不可能一肩擔(dān)起,生態(tài)共創(chuàng)與共建,是放之四海而皆準(zhǔn)的另一法則,征途不易,除了自身加強(qiáng)還得廣結(jié)良友,與之為伴,一榮俱榮。
除了三維機(jī)器視覺(jué)的千萬(wàn)場(chǎng)景的遍地開(kāi)花需要生態(tài)之力,在行業(yè)壁壘的破局中,也如此。
現(xiàn)階段3D視覺(jué)行業(yè)的核心難點(diǎn)集中在產(chǎn)業(yè)鏈匹配并不完善,由于三維機(jī)器視覺(jué)仍屬于較前沿的技術(shù),供應(yīng)鏈匹配上存在技術(shù)難度高、標(biāo)準(zhǔn)不統(tǒng)一等諸多問(wèn)題,整合產(chǎn)業(yè)鏈?zhǔn)?D視覺(jué)產(chǎn)業(yè)化應(yīng)用的必要路徑。
3D視覺(jué)技術(shù)棧和產(chǎn)業(yè)鏈相比2D更長(zhǎng),3D視覺(jué)技術(shù)棧包括深度感知、三維重建和三維應(yīng)用,每個(gè)環(huán)節(jié)都有較高的技術(shù)門(mén)檻,要做3D機(jī)器視覺(jué)全棧技術(shù)的企業(yè),只能低作堰、淺淘灘。
歸根結(jié)底,無(wú)限之界、無(wú)限視界,3D機(jī)器視覺(jué)場(chǎng)景爭(zhēng)奪與排位賽,必然又是一次洗禮。遠(yuǎn)行至遠(yuǎn)方,每一步,都鏗鏘。