上世紀(jì)70年代中,MIT人工智能實驗室正式開設(shè)“機(jī)器視覺”課程,近半個世紀(jì)來機(jī)器視覺持續(xù)是一個非?;钴S的研究領(lǐng)域,全球性的研究熱潮,使得機(jī)器視覺獲得了蓬勃發(fā)展,機(jī)器視覺在工業(yè)制造領(lǐng)域已獲得了廣泛的應(yīng)用,比如在不適合人類工作的環(huán)境中,利用機(jī)器視覺代替?zhèn)鹘y(tǒng)人工測量/試;或用于需要高性能、精密機(jī)器視覺組件的專業(yè)設(shè)備制造領(lǐng)域。但總體來講,機(jī)器視覺不僅依然一個相當(dāng)新且仍有很多工作要做的研究領(lǐng)域,更是一個深藏?zé)o限潛力的金礦。
在此次采訪中,大部分的廠商的關(guān)注焦點(diǎn)都更貼近大眾生活相關(guān),放在了消費(fèi)電子、可穿戴產(chǎn)品、汽車ADAS以及智能化監(jiān)控等領(lǐng)域。比如CEVA公司投資者關(guān)系與企業(yè)傳播副總裁RichardKingston就透露“我們已經(jīng)將計算機(jī)視覺DSP授權(quán)許可予八家企業(yè),其中包括三家移動領(lǐng)域的OEM廠商。”加拿大CogniVue公司業(yè)務(wù)開發(fā)副總裁TomWilson認(rèn)為“可穿戴和汽車領(lǐng)域?qū)⒋嬖诜浅?qiáng)烈的增長機(jī)遇。”
視覺處理向3D跨越
隨著谷歌正式發(fā)布了ProjectTango后,3D機(jī)器視覺變得愈加熱門。“我們認(rèn)為消費(fèi)領(lǐng)域3D處理的主要應(yīng)用會是3D成像、自然用戶界面(NUI)和3D視覺應(yīng)用,比如PC、筆記本電腦、平板電腦、智能手機(jī)和其它消費(fèi)類設(shè)備。”Kingston表示。
業(yè)界追尋3D視覺的最大原因還是為了解決2D機(jī)器視覺的固有局限,若能更好的實現(xiàn)在分割(分離近景和遠(yuǎn)景)、照明(用于人臉識別時)、相對位置(場景中的物體)等方面的功能,許多應(yīng)用可以通過采用3D空間信息簡化并提高視覺系統(tǒng)的精度和可靠性。
但無論是3D傳感器(例如飛行時間法(ToF)相機(jī))、或以2個2D圖像傳感器實現(xiàn)的立體傳感器,他們對處理能力的要求都更高。“立體匹配(使用來自兩個圖像傳感器輸入)要求差異映射來生成3D景深圖。這是一個非常困難的計算機(jī)視覺問題,學(xué)術(shù)界也積極研究來優(yōu)化立體識別算法。”CogniVue公司業(yè)務(wù)開發(fā)副總裁TomWilson指出。每一種實現(xiàn)3D傳感的方法都存在性能上的折衷,CogniVue目前在開發(fā)一種算法,能針對低成本3D傳感器有效計算其視差圖。
處理大量實時數(shù)據(jù)需要密集的計算能力。若是想實現(xiàn)穩(wěn)定的3D傳感地圖是非常困難的,特別是對那些低功耗的設(shè)備來說。“CogniVue的APEX圖像識別處理(ICP)技術(shù)能在電量有限的3D視覺應(yīng)用中發(fā)揮關(guān)鍵作用。”他補(bǔ)充道。
更多資訊請關(guān)注機(jī)器視覺頻道