在實(shí)際的應(yīng)用系統(tǒng)中,嵌入式視覺技術(shù)可望帶來什么樣的潛力呢?BerkeleyDesignTechnologyInc.(BDTi)公司總裁兼嵌入式視覺聯(lián)盟(EmbeddedVisionAlliance;EVA)創(chuàng)辦人JeffBier在接受《EETimes》的專訪中分享了他的看法。在缺乏共通標(biāo)準(zhǔn)而使嵌入式視覺技術(shù)發(fā)展受阻之際,JeffBier強(qiáng)調(diào)唯有一種兼容各層面功能的標(biāo)準(zhǔn),才能真正開啟并普及嵌入式視覺應(yīng)用。
嵌入式視覺系統(tǒng)所用的處理器必須具備什么樣的性能要求?
JeffBier:視覺演算法與應(yīng)用大大地延伸了處理器性能要求的范圍。一般來說,雖然以運(yùn)算能力的觀點(diǎn)而言,處理器的性能至關(guān)重要。但當(dāng)你跨越學(xué)術(shù)研究到實(shí)際系統(tǒng)的鴻溝,采用先進(jìn)演算法以即時(shí)執(zhí)行視頻輸入時(shí),卻不可避免地會(huì)消耗掉許多的處理功率。在許多嵌入式系統(tǒng)中,設(shè)計(jì)人員面臨著尺寸、功耗與成本等嚴(yán)苛的限制條件,因此,能夠以低成本與低功耗提供充份的處理能力是至關(guān)重要的。
而在其它一些要求大量運(yùn)算的嵌入式處理領(lǐng)域──如隨即浮現(xiàn)于我腦海中的消費(fèi)性視頻設(shè)備──在某種程度上而言,演算法是標(biāo)準(zhǔn)化的。這意味著芯片設(shè)計(jì)人員可以使用功能固定的硬件加速器和協(xié)同處理器,以低功耗和低成本提供大量的處理器運(yùn)算性能。
但在視覺應(yīng)用方面,不同的應(yīng)用之間往往采用不同的演算法,甚至是在同一款應(yīng)用中,所用的演算法也可能因設(shè)計(jì)不同或時(shí)間不同而異。因此,除了極其少數(shù)的一些大量應(yīng)用以外,功能固定的硬件往往無法作為解決方案。在嵌入式視覺系統(tǒng)中,我們需要的處理器必須能夠以低成本與低功耗,提供每秒數(shù)十億次即時(shí)運(yùn)算處理性能,并具有彈性化的可編程性能。過去幾年來,已經(jīng)有這樣的處理器問世,并可協(xié)助嵌入式視覺技術(shù)進(jìn)一步導(dǎo)入主流應(yīng)用中。
傳感器在此所扮演的角色為何?
Bier:很明顯地,圖形傳感器是嵌入式視覺技術(shù)的關(guān)鍵。圖形傳感器在近年來已變得比較不那么昂貴了,這主要可歸功于行動(dòng)電話普遍且大量且地采用了圖形傳感器。除了傳統(tǒng)的圖形傳感器以外,許多視覺應(yīng)用都可以利用各式各樣的傳感器。例如,3D傳感器在微軟Kinect的應(yīng)用即其一例,3D傳感器可說是許多應(yīng)用的一大福音,因?yàn)橛辛?D影像后確實(shí)簡化了一些視覺任務(wù)。
在深入探索嵌入式系統(tǒng)以前,必須先具備哪些電腦視覺知識(shí)呢?
Bier:大多數(shù)的嵌入式系統(tǒng)設(shè)計(jì)工程師并不了解嵌入式視覺技術(shù)具有什么樣的能力。這是因?yàn)?,一直到最近以前,在大多?shù)的嵌入式系統(tǒng)中使用視覺技術(shù)仍不切實(shí)際;它畢竟還是太昂貴了。而今,為一系列廣泛的各種系統(tǒng)進(jìn)一步納入視覺性能,在經(jīng)濟(jì)上已經(jīng)變得較為可行了;因此,對(duì)于系統(tǒng)設(shè)計(jì)者而言,熟悉這項(xiàng)技術(shù)、并進(jìn)一步了解這項(xiàng)技術(shù)能做些什么是相當(dāng)重要的。
早期采用視覺技術(shù)的工程師們現(xiàn)在已經(jīng)可以拿出一些令人驚喜的新產(chǎn)品和產(chǎn)品功能了。當(dāng)然,工程師們不僅需要了解視覺技術(shù)能做什么,同時(shí)也要學(xué)會(huì)如何把視覺技術(shù)整合于自己的產(chǎn)品中。在這方面,目前雖然已經(jīng)累積了一些龐大的出版文獻(xiàn)可供參考,但其中絕大多數(shù)都是學(xué)術(shù)研究出版品,以及一些通常不適合協(xié)助工程師用于構(gòu)建解決方案的文獻(xiàn)。工程師們需要的是更實(shí)際的資訊,如指導(dǎo)方針、設(shè)計(jì)實(shí)例、架構(gòu)圖以及樣本程式碼等。
由BDTi、CEVA、賽靈思(Xilinx)、IMSResearch、亞德諾(ADI)、Apical、安富利(Avnet)、Cognivue、飛思卡爾(Freescale)、MathWorks、美商國家儀器(NI)、NVIDIA、德州儀器(TI)、TEL與XMOS等嵌入式系統(tǒng)處理器晶片商、影像處理業(yè)者、量測廠商與EDA廠商等多家公司共同組成的嵌入式視覺聯(lián)盟(EVA),共同致力于提高人們對(duì)于嵌入式視覺技術(shù)的認(rèn)知,并為設(shè)計(jì)工程師提供協(xié)助其使用嵌入式視覺技術(shù)技術(shù)時(shí)必備的實(shí)用資訊。目前,EVA聯(lián)盟的第一項(xiàng)計(jì)劃是打造專為工程師提供實(shí)用資訊的網(wǎng)站。
目前有什么可用的嵌入式視覺系統(tǒng)開發(fā)平臺(tái)呢?
Bier:從頭開始打造一款視覺系統(tǒng)或子系統(tǒng),可說是一項(xiàng)龐大且復(fù)雜的工作。你必須從像影像傳感器與處理器等這一類的基本元素開始,以及從無到有著手建立一種演算法。這對(duì)于資源的利用而言,并不是非常有效率的作法,特別是因?yàn)樵谝曈X應(yīng)用中還存在著不斷周而復(fù)始出現(xiàn)的共同問題。
工程師們最好不要選擇這種卷土重來的做法,他們應(yīng)該能夠針對(duì)特定應(yīng)用的一些共同元素,重新使用業(yè)經(jīng)驗(yàn)證的解決方案,然后再將自己的專才發(fā)揮在其設(shè)計(jì)獨(dú)特之處。我個(gè)人認(rèn)為,這意味著我們需要專門針對(duì)視覺應(yīng)用的先進(jìn)開發(fā)平臺(tái),例如,其中包括開發(fā)板以及合適的處理器、記憶體、I/O和圖形傳感器的視覺開發(fā)平臺(tái)。同時(shí)還伴隨有建置一個(gè)或多個(gè)視覺應(yīng)用案例的應(yīng)用軟件。此外,這一視覺開發(fā)平臺(tái)也提供了源代碼,使工程師們能夠參考這些范例應(yīng)用立即開始工作,并對(duì)其設(shè)計(jì)進(jìn)行修改,或添加所需的獨(dú)特功能。
這種開發(fā)平臺(tái)還將包括強(qiáng)大的開發(fā)工具,讓工程師們在定義所需的功能時(shí),能夠作業(yè)于更高的抽象層,無需犧牲太多性能。同時(shí),完整的開發(fā)平臺(tái)還提供一個(gè)最佳化視覺建構(gòu)功能的豐富工具庫。
先進(jìn)的開發(fā)平臺(tái)將帶來莫大助益,以實(shí)現(xiàn)并加速視覺功能的普及。
嵌入式視覺領(lǐng)域有什么樣的標(biāo)準(zhǔn)需求?
Bier:當(dāng)今的嵌入式視覺技術(shù)正因?yàn)槿狈?biāo)準(zhǔn)使其發(fā)展受阻。對(duì)于系統(tǒng)所能提供的一些基本性能適用什么條款,甚至也沒有什么共識(shí)。這讓工程師們更難以選擇最佳的技術(shù)與建構(gòu)解決方案,也無法因應(yīng)時(shí)間改變需求而調(diào)整其設(shè)計(jì)。
至于嵌入式視覺技術(shù)如何才能發(fā)揮真正的潛力?我認(rèn)為我們將需要一種容納各個(gè)層面的標(biāo)準(zhǔn)。例如,如果基于手勢的用戶介面變得普及,對(duì)于用戶而言,能夠使用一套具有多種不同機(jī)制的通用手勢功能將會(huì)變得十分重要。而如果3D成像成為視覺應(yīng)用的共同工具,那么不管使用什么樣的傳感器,我們都將必須為視覺應(yīng)用找到一個(gè)重現(xiàn)3D圖形數(shù)據(jù)的共同方式。