人工智能的興起與深度感知的藍(lán)海
經(jīng)過(guò)了兩年的發(fā)展,國(guó)內(nèi)的O2O創(chuàng)業(yè),該倒閉的倒閉,該合并的合并,或抱團(tuán)取暖,或投入BAT的麾下,進(jìn)入到2016年以來(lái),基本可以說(shuō)是格局已定。在O2O領(lǐng)域格局已定的情況下,創(chuàng)業(yè)者和投資人把目光更多地投向了企業(yè)服務(wù)(SaaS)、泛娛樂(lè)(IP、直播)、AR/VR以及人工智能(自動(dòng)駕駛、無(wú)人機(jī)、機(jī)器人)等領(lǐng)域。
在AR/VR以及自動(dòng)駕駛、無(wú)人機(jī)、機(jī)器人等人工智能領(lǐng)域,對(duì)深度感知的需求十分突出。比如在機(jī)器人領(lǐng)域,使用基于深度攝像頭的視覺(jué)系統(tǒng)進(jìn)行視覺(jué)導(dǎo)航、識(shí)別外界的環(huán)境、規(guī)劃路徑、實(shí)現(xiàn)避障工作等,已經(jīng)成為了公認(rèn)的解決方案。
雖然市場(chǎng)對(duì)深度感知技術(shù)需求趨于井噴,但是目前可以提供深度感知產(chǎn)品和方案的公司卻不多。
一方面是因?yàn)樯疃雀兄鳛槿斯ぶ悄艿闹匾M成部分,其技術(shù)門(mén)檻很高,創(chuàng)始團(tuán)隊(duì)如果沒(méi)有相關(guān)領(lǐng)域的技術(shù)大拿,項(xiàng)目很難啟動(dòng)。
另一方面是深度感知已經(jīng)成為各大科技巨頭的角逐之地,Apple、Microsoft、Facebook/Oculus、Intel、Google等巨頭早已瞄準(zhǔn)該技術(shù),瘋狂收購(gòu)這個(gè)領(lǐng)域的創(chuàng)業(yè)公司,比如Intel收購(gòu)RealSense、蘋(píng)果收購(gòu)Kinect的技術(shù)供應(yīng)商PrimeSense,Oculus收購(gòu)PebblesInterfaces。有些甚至只要有不錯(cuò)的產(chǎn)品demo,就能夠被收編。
上述大公司的收購(gòu),無(wú)一例外都在為自己的產(chǎn)品構(gòu)建核心技術(shù)門(mén)檻,為內(nèi)部生態(tài)服務(wù),并不對(duì)外提供產(chǎn)品和服務(wù),因此導(dǎo)致專(zhuān)業(yè)的深度感知供應(yīng)商變得非常稀缺,尤其是PrimeSense被蘋(píng)果收購(gòu),于2015年停止對(duì)外授權(quán)和供貨后,在市場(chǎng)領(lǐng)域留下了很大的空白。
目前,國(guó)內(nèi)從事深度視覺(jué)技術(shù)開(kāi)發(fā)的公司屈指可數(shù),此時(shí)可以對(duì)外提供深度感知產(chǎn)品和方案的公司,必定成為市場(chǎng)的寵兒。
深度感知的三種解決方案
目前的深度感知方案,主要產(chǎn)品就是深度攝像頭。深度攝像頭除了能夠獲取平面圖像以外,還可以獲得拍攝對(duì)象的深度信息,也就是三維的位置和尺寸信息,于是整個(gè)計(jì)算系統(tǒng)就獲得了環(huán)境和對(duì)象的三維立體數(shù)據(jù)。
按技術(shù)分類(lèi),深度攝像頭可分為以下三類(lèi)主流技術(shù):結(jié)構(gòu)光、雙目視覺(jué)和TOF飛行時(shí)間法。
結(jié)構(gòu)光
結(jié)構(gòu)光是目前最主流、應(yīng)用最廣泛的深度感知方案,其基本原理是由結(jié)構(gòu)光投射器向被測(cè)物體表面投射可控制的光點(diǎn)、光條或光面結(jié)構(gòu),并由圖像傳感器獲得圖像,通過(guò)系統(tǒng)幾何關(guān)系,利用三角原理計(jì)算得到物體的三維坐標(biāo)。國(guó)內(nèi)從事單目結(jié)構(gòu)光方案開(kāi)發(fā)的有深圳奧比中光科技有限公司、南京華捷艾米軟件有限公司等,市場(chǎng)上的典型產(chǎn)品有Kinect1代。
結(jié)構(gòu)光方案優(yōu)勢(shì)在于技術(shù)成熟,識(shí)別距離遠(yuǎn),深度圖像分辨率可以做得比較高,但容易受光照影響。
雙目視覺(jué)
雙目只需安裝兩個(gè)攝像頭,利用雙目立體視覺(jué)成像原理,通過(guò)兩個(gè)攝像機(jī)來(lái)提取包括三維位置在內(nèi)的信息進(jìn)行深度感知。市場(chǎng)上的典型的產(chǎn)品有LeapMotion,大疆無(wú)人機(jī)等。
由于不涉及光學(xué)系統(tǒng),因此雙目視覺(jué)的成本是三種深度感知方案中最低的。不足的是,這種技術(shù)需要龐大的程序計(jì)算量,對(duì)硬件設(shè)備有一定配置要求,同時(shí)受外界環(huán)境影響大,比如環(huán)境光線昏暗、背景雜亂、有遮擋物等情況下不適用。
TOF飛行時(shí)間法
TOF是飛行時(shí)間(TimeofFlight)技術(shù)的縮寫(xiě),基本原理是傳感器發(fā)出經(jīng)調(diào)制的近紅外光,遇物體后反射,傳感器通過(guò)計(jì)算光線發(fā)射和反射時(shí)間差或相位差,來(lái)?yè)Q算被拍攝景物的距離,以產(chǎn)生深度信息,此外再結(jié)合傳統(tǒng)的相機(jī)拍攝,就能將物體的三維輪廓以不同顏色代表不同距離的地形圖方式呈現(xiàn)出來(lái)。目前國(guó)內(nèi)TOF方案的有深圳樂(lè)行天下科技有限公司等,市場(chǎng)上的典型產(chǎn)品有Kinect2代。
TOF其實(shí)是相對(duì)結(jié)構(gòu)光和雙目視覺(jué)來(lái)說(shuō)受環(huán)境影響最小的技術(shù),不過(guò)由于傳感器芯片并不成熟,成本很高,所以實(shí)現(xiàn)量產(chǎn)困難。另一方面,TOF分辨率不高,因此不適合精度要求高的場(chǎng)景。
深度感知前景可期
前面我們已經(jīng)說(shuō)到,深度感知可以被用在人工智能領(lǐng)域?qū)崿F(xiàn)避障、定位、導(dǎo)航等功能,但是深度攝像頭的應(yīng)用遠(yuǎn)不止這些,而且隨著技術(shù)的發(fā)展,整個(gè)行業(yè)也正在為深度感知尋找更加豐富的應(yīng)用場(chǎng)景。
1.工業(yè)領(lǐng)域
2005年創(chuàng)建于以色列的PrimeSense公司是深度感知民用化的先驅(qū),由它提供技術(shù)方案的微軟Kinect成為深度攝像頭在消費(fèi)領(lǐng)域的開(kāi)山之作,并帶動(dòng)整個(gè)業(yè)界對(duì)該技術(shù)的民用開(kāi)發(fā)。在此之前,深度攝像頭在在工業(yè)領(lǐng)域已有應(yīng)用,比如為機(jī)械臂、工業(yè)機(jī)器人等提供圖形視覺(jué)服務(wù)。
2.智能監(jiān)控
在安防領(lǐng)域,深度攝像頭主要用行為分析,在某些特定的場(chǎng)景下,通過(guò)動(dòng)作軌跡進(jìn)而識(shí)別出人背后的意圖,可以提前進(jìn)行預(yù)警。另外,深度感知還能夠用于檢測(cè)一個(gè)區(qū)域的人流量,在商場(chǎng)、電影院、公交車(chē)等場(chǎng)景有很大需求。
3.物流領(lǐng)域
英特爾在近年來(lái)的CES和IDF上都力推RealSense并提出更多的案例,印象深刻的是,它可以運(yùn)用物流倉(cāng)儲(chǔ)上,實(shí)時(shí)檢測(cè)包裹的大小,計(jì)算倉(cāng)庫(kù)的空間,提供最佳的擺放建議。
4.AR/VR
在AR/VR設(shè)備應(yīng)用中,遠(yuǎn)距離深度攝像頭用于環(huán)境感知和建模;靜距離深度攝像頭用于手勢(shì)識(shí)別。目前三大頭顯(HTCvive、Oculusrift、PSVR)都具備了配套的體感交互,微軟HoloLens則在內(nèi)部集成了兩套深度攝像頭來(lái)感知周?chē)沫h(huán)境和物體,從而實(shí)現(xiàn)了虛擬物體和真實(shí)環(huán)境的完美融合。預(yù)計(jì)將來(lái)幾乎所有的的AR設(shè)備和一半以上的VR設(shè)備,都將配備深度攝像頭,這兩類(lèi)應(yīng)用的崛起,也將大力推送深度攝像頭市場(chǎng)的增長(zhǎng)。
所以,雖然目前深度感知技術(shù)發(fā)展尚屬早期,在硬件性能、算法程序等方面面臨諸多限制,很多場(chǎng)景的的應(yīng)用也還處在商業(yè)化探索的階段。但是隨著攝像機(jī)、運(yùn)算程序以及運(yùn)算硬件跟上后,這項(xiàng)引領(lǐng)全新人機(jī)交互方式的技術(shù)前景可期。