隨著近年來(lái)自動(dòng)化行業(yè)和機(jī)器人的火速升溫和發(fā)展,機(jī)器視覺(jué)技術(shù)及其相關(guān)應(yīng)用也在馬不停蹄的快速發(fā)展中,并在工業(yè)檢測(cè)與制造領(lǐng)域獲得了廣泛的部署。然而,對(duì)于超越傳統(tǒng)應(yīng)用以外的日常生活與其他領(lǐng)域,機(jī)器視覺(jué)仍然深藏著無(wú)限潛力與商機(jī)。
過(guò)去幾年來(lái),這個(gè)以知識(shí)為導(dǎo)向的產(chǎn)業(yè)經(jīng)歷機(jī)器視覺(jué)系統(tǒng)的元件與模組日益復(fù)雜化;另一方面,與機(jī)器視覺(jué)系統(tǒng)相關(guān)的市場(chǎng)應(yīng)用也持續(xù)擴(kuò)展到超越工業(yè)制造以外的新應(yīng)用領(lǐng)域,特別是如今當(dāng)硬體尺寸縮減以及嵌入式系統(tǒng)持續(xù)展現(xiàn)動(dòng)能之際,即將來(lái)臨的奈米技術(shù)、先進(jìn)感測(cè)器、機(jī)器對(duì)機(jī)器(M2M)通訊系統(tǒng)以及物聯(lián)網(wǎng)(IoT)等新興技術(shù)發(fā)展,將進(jìn)一步推動(dòng)機(jī)器視覺(jué)應(yīng)用擴(kuò)展至消費(fèi)性電子、可穿戴式裝置、汽車先進(jìn)駕駛輔助系統(tǒng)(ADAS)以及智能化監(jiān)控等更貼近大眾生活的領(lǐng)域。
根據(jù)市場(chǎng)調(diào)查機(jī)構(gòu)MarketsandMarkets在去年發(fā)布的調(diào)查報(bào)告指出,2012年機(jī)器視覺(jué)系統(tǒng)與元件的全球市場(chǎng)規(guī)模超過(guò)30億美元,預(yù)計(jì)在2013-2018年間將以8.2%的年復(fù)合成長(zhǎng)率(CAGR)成長(zhǎng),在2018年以前達(dá)到50億美元。全球機(jī)器視覺(jué)市場(chǎng)帶來(lái)的新商機(jī)已經(jīng)成為業(yè)界廠商關(guān)注的焦點(diǎn)。
CEVA公司投資者關(guān)系與企業(yè)傳播副總裁RichardKingston透露,該公司已經(jīng)將電腦視覺(jué)DSP授權(quán)給八家企業(yè),其中包括三家行動(dòng)領(lǐng)域的OEM廠商。而加拿大CogniVue公司業(yè)務(wù)開(kāi)發(fā)副總裁TomWilson也看好“可穿戴式裝置和汽車領(lǐng)域?qū)⒋嬖诜浅?qiáng)烈的成長(zhǎng)商機(jī)。”
全球機(jī)器視覺(jué)市場(chǎng)可望在2018年以前超越50億美元大關(guān)。
視覺(jué)處理向3D跨越
隨著Google正式發(fā)布ProjectTango后,3D機(jī)器視覺(jué)變得更熱門。Kingston表示,“消費(fèi)領(lǐng)域的3D處理主要瞄準(zhǔn)3D成像、自然使用者界面(NUI)和3D視覺(jué)應(yīng)用,如PC、筆記型電腦、平板電腦、智能手機(jī)和其它消費(fèi)性設(shè)備。”
業(yè)界追尋3D視覺(jué)的主要原因在于解決2D機(jī)器視覺(jué)的固有局限,若能更有效地實(shí)現(xiàn)在分割(分離近景和遠(yuǎn)景)、照明(用于人臉辨識(shí))、相對(duì)位置(場(chǎng)景中的物體)等方面的功能,就能讓更多應(yīng)用透過(guò)3D空間資訊來(lái)簡(jiǎn)化并提高視覺(jué)系統(tǒng)的精密度與可靠性。
但無(wú)論是3D感測(cè)器(例如TOF相機(jī))或以2個(gè)2D影像感測(cè)器實(shí)現(xiàn)的立體感測(cè)器,對(duì)于處理能力的要求也更高。Wilson指出,“立體匹配(使用兩個(gè)影像感測(cè)器的輸入)要求差異映射來(lái)產(chǎn)生3D景深圖。這是一個(gè)非常困難的電腦視覺(jué)問(wèn)題,學(xué)術(shù)界也積極研究最佳化立體辨識(shí)演算法。”由于實(shí)現(xiàn)3D感測(cè)的每一種方法都存在性能的折衷,CogniVue目前正開(kāi)發(fā)一種新的演算法,期望針對(duì)低成本3D感測(cè)器計(jì)算其視差圖。
處理大量即時(shí)資料需要密集的運(yùn)算能力。若是想實(shí)現(xiàn)穩(wěn)定的3D感測(cè)映射是非常困難的,特別是對(duì)于低功耗的設(shè)備來(lái)說(shuō)。為此,他強(qiáng)調(diào),“CogniVue的APEX影像辨識(shí)處理(ICP)技術(shù)能在電量有限的3D視覺(jué)應(yīng)用中發(fā)揮關(guān)鍵作用。”
對(duì)于系統(tǒng)設(shè)計(jì)人員來(lái)說(shuō),設(shè)計(jì)一款能有效執(zhí)行不同視覺(jué)演算法的硬體是一項(xiàng)艱巨的挑戰(zhàn)。系統(tǒng)廠商選擇影像/視訊處理解決方案時(shí),可以選擇全部集中在CPU完成,也可以選擇卸載一部份影像處理工作給GPU,或者專為影像處理增加硬體邏輯。在需要3D處理的應(yīng)用中,GPU已經(jīng)讓系統(tǒng)的一部份執(zhí)行多種電腦視覺(jué)演算法,從而有助于為通用CPU分擔(dān)工作負(fù)載。
“i.MX6擁有強(qiáng)大的GPU運(yùn)算能力,其3D引擎GC2000內(nèi)含4個(gè)渲染核心,可提供高達(dá)30GFLOPS的運(yùn)算能力,支援OpenCL1.1EP,”飛思卡爾(Freescale)微控制器事業(yè)部亞太區(qū)市場(chǎng)行銷和業(yè)務(wù)拓展經(jīng)理李星宇介紹,“此外,i.MX6Q還擁有一個(gè)專用的2D引擎(1Gpixel/s)和一個(gè)向量繪圖處理引擎。”
針對(duì)影像擷取領(lǐng)域,經(jīng)常利用2D相機(jī)感測(cè)器或其他光學(xué)感測(cè)技術(shù)來(lái)分析運(yùn)算3D資料。除了飛行時(shí)間法(TOF)3D成像(為目標(biāo)物連續(xù)發(fā)送光線脈沖,根據(jù)光線脈沖與感測(cè)器接收反射光線之間的時(shí)間,計(jì)算出目標(biāo)物距離),在工業(yè)制造檢測(cè)方面較廣泛應(yīng)用的是3D雷射三角法,差別在于3D雷射感測(cè)器采用逐點(diǎn)掃描,而TOF相機(jī)則同時(shí)得到整幅影像的深度資訊。
相較于雷射三角的3D成像方式,美商國(guó)家儀器(NI)技術(shù)行銷工程師黃翔鉎介紹,NILabVIEW可為3D視覺(jué)應(yīng)用提供雙目立體視覺(jué)功能,工程師可將2部相機(jī)安裝在物體的不同角度后,使用校準(zhǔn)技術(shù)調(diào)校兩部相機(jī)之間的畫素資訊以及擷取資料,并透過(guò)LabVIEW的3D工具庫(kù)進(jìn)行數(shù)學(xué)運(yùn)算分析。透過(guò)一個(gè)軟硬體無(wú)縫整合的繪圖開(kāi)發(fā)環(huán)境來(lái)設(shè)計(jì)3D視覺(jué)應(yīng)用,更能簡(jiǎn)化工程師的工作。
IP與處理器的完美結(jié)合
為了在日益精巧的機(jī)臺(tái)或裝置中整合嵌入式視覺(jué)系統(tǒng),需要更先進(jìn)的CPU進(jìn)行密集運(yùn)算來(lái)處理龐大的資料量,黃翔鉎強(qiáng)調(diào),這將持續(xù)對(duì)于CPU效能、功耗與資源是否足以支援強(qiáng)大的視覺(jué)分析運(yùn)算帶來(lái)了挑戰(zhàn)。
CongmiVue在官網(wǎng)上提到,“為了滿足不斷提高的應(yīng)用需求,過(guò)去幾十年來(lái),處理器架構(gòu)持續(xù)因應(yīng)不同階段而進(jìn)展。1980年代的用于桌上型電腦和和伺服器的CPU;1990年代DSP出現(xiàn)加速音訊編解碼和無(wú)線/有線語(yǔ)音/資料編解碼的要求;2000年GPU達(dá)到更先進(jìn)的性能與平行性,從而實(shí)現(xiàn)2D和3D影像;如今,嵌入式視覺(jué)處理需要的是完全不同的處理器架構(gòu):ICP。”
TomWilson也指出,“新一代的視覺(jué)應(yīng)用需要100倍以上的嵌入式視覺(jué)性能/功耗,為了滿足這些應(yīng)用的性能和功率需求,我們必須在相同功耗下提升較傳統(tǒng)處理架構(gòu)更高100-400倍的性能,”因此,CogniVue強(qiáng)調(diào)其APEXICP技術(shù)可實(shí)現(xiàn)這一性能要求。
連同APEXICP核心、APEX程式設(shè)計(jì)工具以及一個(gè)APEX-CV嵌入式視覺(jué)功能庫(kù),可涵蓋多種視覺(jué)應(yīng)用。例如特征檢測(cè)和搭配適用于可穿戴式(增強(qiáng)實(shí)境)和汽車(光流和運(yùn)動(dòng)追蹤)等。他補(bǔ)充道:“除了常見(jiàn)的電腦視覺(jué)功能,CognVue還為特定應(yīng)用提供更先進(jìn)的產(chǎn)品,例如用于人臉辨識(shí)的FaceVue、用于監(jiān)控應(yīng)用中運(yùn)動(dòng)監(jiān)測(cè)的MotionVue、用于汽車車道偏離警示的FrontVue,以及用于汽車盲點(diǎn)監(jiān)測(cè)的SideVue等。”
針對(duì)密集型運(yùn)算需求,CEVA公司包括CEVA-MM3101在內(nèi)的CEVA-MM3000系列使用非常高效且功能強(qiáng)大的向量引擎,從而實(shí)現(xiàn)電腦視覺(jué)所需的大量平行運(yùn)算。此外,整合的功率調(diào)節(jié)單元(PSU)可在處理器內(nèi)實(shí)現(xiàn)動(dòng)態(tài)電壓調(diào)節(jié),協(xié)助實(shí)現(xiàn)‘永不斷線’的應(yīng)用類型。
除了CogniVue和CEVA,致力于機(jī)器視覺(jué)IP的廠商還包括Mobileye、Tensilica(現(xiàn)隸屬于CadenceIP部門)與ImaginationTechnologies等。Imagination基于‘Raptor’的可合成ISPIP核心已于2014年第一季上市,使得IP陣營(yíng)的競(jìng)爭(zhēng)愈發(fā)激烈。
多家半導(dǎo)體廠商則透過(guò)與專業(yè)IP廠商合作/授權(quán)的方式,推出其專用視覺(jué)處理器,包括飛思卡爾(Freescale)、德州儀器(TI)以及意法半導(dǎo)體(ST)等。ST與Mobileye共同開(kāi)發(fā)EyeQ3影像處理器,可實(shí)現(xiàn)行人檢測(cè);飛思卡爾基于CogiVue核心推出影像辨識(shí)處理器家族SCP2200;以色列Inuitive公司開(kāi)發(fā)基于雙CEVA-MM3101引擎的3D視覺(jué)處理器,實(shí)現(xiàn)3D景深圖;賽靈思(Xilinx)利用MVTec公司的HALCON以及SiliconSoftware公司的VisualApplets開(kāi)發(fā)平臺(tái),為Zynq-7000AllProgrammableSoC打造端對(duì)端的SmarterVision開(kāi)發(fā)環(huán)境。
TI旗下種類繁多的處理器產(chǎn)品中,KeyStone系列多核心處理器具備5.6GHz的ARM及9.6GHz的DSP處理能力,且具備比多晶片方案低功耗的優(yōu)勢(shì),適合機(jī)器視覺(jué)領(lǐng)域的攝影機(jī)應(yīng)用;此外該公司的Jacito6系列車用處理器,亦可用于ADAS中的行人辨識(shí)、防碰撞警示等機(jī)器視覺(jué)功能。
更多資訊請(qǐng)關(guān)注機(jī)器視覺(jué)頻道