機(jī)器視覺技術(shù) 捕獲“深度”世界

時(shí)間:2013-07-17

來(lái)源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語(yǔ):機(jī)器視覺最早應(yīng)用于工業(yè)制造領(lǐng)域。通過機(jī)器視覺的自動(dòng)識(shí)別功能,許多流水線上具有高度重復(fù)性的檢測(cè)工作都可以不再依靠人來(lái)完成,大大提高了檢測(cè)效率和精度。黃凱奇介紹,機(jī)器視覺系統(tǒng)最基本的特點(diǎn)就是提高生產(chǎn)的靈活性和自動(dòng)化程度。

想記錄眼前美景?不用再掏出相機(jī)或手機(jī),只需一句語(yǔ)音指令,佩戴的輕巧時(shí)尚的谷歌眼鏡就能立刻拍出眼前的圖景;走在陌生的大街上,不用再查地圖或問路,只需將手機(jī)攝像頭對(duì)準(zhǔn)街道,諾基亞“城市萬(wàn)花筒”就能將眼前的商店、餐館和景點(diǎn)直接標(biāo)注,覆蓋顯示在手機(jī)圖像上……這些以往多是在電影中看到的畫面,已成為普通人可以觸摸到的現(xiàn)實(shí)。機(jī)器視覺——這一“第三只眼”正以巨大的能量,改變著人們的生活和工作方式。

與人眼一決高低

“機(jī)器視覺就是用機(jī)器代替人眼來(lái)進(jìn)行識(shí)別、測(cè)量、判斷等。機(jī)器視覺系統(tǒng)是通過攝像頭將拍攝對(duì)象轉(zhuǎn)換成圖像信號(hào),然后再交由圖像分析系統(tǒng)進(jìn)行分析、測(cè)量等。”中國(guó)科學(xué)院自動(dòng)化研究所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室研究員黃凱奇博士介紹:“機(jī)器視覺是一項(xiàng)典型的跨學(xué)科任務(wù),涉及到光學(xué)、計(jì)算機(jī)視覺、模式識(shí)別、機(jī)器學(xué)習(xí)、人工智能、統(tǒng)計(jì)學(xué)、認(rèn)知心理學(xué)等等。”

機(jī)器視覺最早應(yīng)用于工業(yè)制造領(lǐng)域。通過機(jī)器視覺的自動(dòng)識(shí)別功能,許多流水線上具有高度重復(fù)性的檢測(cè)工作都可以不再依靠人來(lái)完成,大大提高了檢測(cè)效率和精度。黃凱奇介紹,機(jī)器視覺系統(tǒng)最基本的特點(diǎn)就是提高生產(chǎn)的靈活性和自動(dòng)化程度。在一些不適于人工作業(yè)的危險(xiǎn)工作環(huán)境或者人工視覺難以滿足要求的場(chǎng)合,常用機(jī)器視覺來(lái)替代人工視覺。同時(shí),在大批量重復(fù)性工業(yè)生產(chǎn)過程中,用機(jī)器視覺檢測(cè)方法可以大大提高生產(chǎn)的效率和自動(dòng)化程度。

機(jī)器視覺技術(shù)在工業(yè)領(lǐng)域的簡(jiǎn)單應(yīng)用示意圖

一個(gè)典型的機(jī)器視覺系統(tǒng)包括照明、鏡頭、相機(jī)、圖像采集卡和視覺處理器5個(gè)部分。由于采集卡能更加迅速地傳輸圖像到存儲(chǔ)器,且計(jì)算機(jī)速度不斷加快,所以在目前的機(jī)器視覺系統(tǒng)中,視覺處理器的應(yīng)用逐漸減少。圖像采集卡在機(jī)器視覺系統(tǒng)中舉足輕重。比較典型的PCI或AGP兼容的捕獲卡,可以將圖像迅速地傳送到計(jì)算機(jī)存儲(chǔ)器進(jìn)行處理。有些采集卡有內(nèi)置的多路開關(guān),可連接多臺(tái)相機(jī),能控制采集卡采用任意一個(gè)相機(jī)捕獲的信息。

伴隨著技術(shù)的發(fā)展,機(jī)器視覺的功能也在不斷擴(kuò)展。黃凱奇說(shuō):“缺陷檢測(cè)是通過機(jī)器視覺手段來(lái)分析零部件信息,從而判斷其是否存在缺陷;測(cè)量是通過使用機(jī)器視覺來(lái)對(duì)考察對(duì)象的尺寸、形狀等信息進(jìn)行度量;人機(jī)交互是利用機(jī)器視覺工具分析人或者其他機(jī)器發(fā)出的指令,從而實(shí)現(xiàn)對(duì)機(jī)器的操縱;環(huán)境建模是對(duì)機(jī)器周圍環(huán)境進(jìn)行感知建模,比如移動(dòng)機(jī)器人對(duì)路面環(huán)境進(jìn)行感知建模等。”

“目前總的看來(lái),機(jī)器視覺在工業(yè)電子以及半導(dǎo)體行業(yè)應(yīng)用還是最為主要的,如PCB板缺陷檢測(cè)、IC芯片缺陷檢測(cè)等。交通領(lǐng)域的應(yīng)用如電子眼也較為廣泛,其他行業(yè)如制藥中的藥品成分分析、互聯(lián)網(wǎng)中的視覺計(jì)算廣告、物流中的物品分揀等等,都有機(jī)器視覺應(yīng)用的影子。”黃凱奇說(shuō)。

機(jī)器視覺——這“第三只眼”已在多個(gè)領(lǐng)域展現(xiàn)出了比人眼更強(qiáng)大的功能。黃凱奇表示:“機(jī)器視覺利用好了完全可以比人做得更好,因?yàn)椴煌娜嗽谟^看時(shí),信息得不到充分和及時(shí)的交流,主觀性也很強(qiáng)。而機(jī)器視覺不僅計(jì)算功能強(qiáng)大,而且獲取的信息通過協(xié)同分析后得到的知識(shí)會(huì)具有‘極高’的價(jià)值,尤其在其更趨于智能化之后。”

捕獲“深度”世界

在現(xiàn)實(shí)生活中,我們?cè)絹?lái)越需要更多的三維模型來(lái)實(shí)現(xiàn)對(duì)物體或環(huán)境的全面掌握。“獲得三維模型有兩種基本方式,一種是利用激光掃描儀,一種是拍攝照片。但激光掃描儀的成本高,也有可能會(huì)對(duì)樣本帶來(lái)一些損害。第二種方式的成本小,而且在精度上也跟激光掃描儀相差無(wú)幾,因此成為了現(xiàn)在研究的一個(gè)熱點(diǎn)。”中國(guó)科學(xué)院自動(dòng)化研究所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室副研究員高偉博士一邊展示他們的三維重建照片,一邊介紹。

高偉說(shuō),一般的圖像上是沒有長(zhǎng)度、距離等深度信息的,而三維模型則能更加全面、精確地記錄環(huán)境,可以直觀呈現(xiàn)物體的位置、距離、姿態(tài)等。高偉所在的機(jī)器人視覺團(tuán)隊(duì)研究開發(fā)的中國(guó)古代建筑全自動(dòng)三維重建系統(tǒng),能夠?qū)崿F(xiàn)全自動(dòng)三維建模,即從底層圖像處理到生成最終的三維模型,全部自動(dòng)實(shí)現(xiàn),無(wú)需人工交互。它對(duì)圖像的拍攝方式也無(wú)特殊約束和限制,只需手持自由拍攝即可。在精度上,也與激光掃描精度相當(dāng),精度小于3cm/100米,通過配備更高像素?cái)?shù)量的相機(jī)和長(zhǎng)焦鏡頭還可以實(shí)現(xiàn)毫米級(jí)重建。

此外,在實(shí)時(shí)定位與在線三維重建方面,機(jī)器視覺也具有極大的應(yīng)用潛力。高偉介紹了通過機(jī)器視覺在手機(jī)上增強(qiáng)現(xiàn)實(shí)的原理,即將手機(jī)上攝像頭讀取的視頻作為輸入,通過初始化、特征點(diǎn)提取、動(dòng)態(tài)模板特征點(diǎn)匹配、幾何變化計(jì)算階段后得到視頻每一幀中感興趣區(qū)域的位置。諾基亞手機(jī)的“城市萬(wàn)花筒”就是一個(gè)應(yīng)用實(shí)例。

高偉所在團(tuán)隊(duì)在視覺信息處理上的突出創(chuàng)新能力,不斷吸引著國(guó)際大企業(yè)前來(lái)合作。“我們現(xiàn)在就正與諾基亞公司進(jìn)行合作,共同研究實(shí)時(shí)定位和在線三維重建。目前,我國(guó)基于機(jī)器視覺的三維重建技術(shù)在國(guó)際上可以說(shuō)處于領(lǐng)先地位,應(yīng)用也是比較廣泛的。”高偉說(shuō):“除了以上介紹的,還能用在一些不太適合人工作業(yè)的環(huán)境監(jiān)測(cè)方面,像對(duì)露天煤礦的監(jiān)測(cè),就是通過無(wú)人機(jī)對(duì)煤礦進(jìn)行全方位拍攝,生成三維模型來(lái)實(shí)時(shí)監(jiān)測(cè)礦山的變化。此外,也能應(yīng)用于城市規(guī)劃、數(shù)字媒體、三維試衣、牙模制造等多方面。”

由于單純依靠圖像信息很難實(shí)現(xiàn)快速、稠密的三維重建,高偉所在團(tuán)隊(duì)也在深入研究將多種傳感器信息相互融合進(jìn)行三維重建的方法。目前,他們已開發(fā)出了利用單目視覺同步定位與地圖創(chuàng)建技術(shù)以及微軟公司的Kinect設(shè)備(微軟公司開發(fā)的應(yīng)用于Xbox360主機(jī)的周邊外設(shè),集成一個(gè)彩色攝影機(jī)、一個(gè)紅外攝像機(jī)和一個(gè)紅外投影機(jī))的全自動(dòng)場(chǎng)景快速重建系統(tǒng)。這一系統(tǒng)對(duì)單幀視頻圖像的處理時(shí)間小于50毫秒,可重建出稠密的三維點(diǎn)云,能廣泛應(yīng)用于多種室內(nèi)場(chǎng)景,使用者可以隨意自由拍攝。

互動(dòng)“大數(shù)據(jù)”時(shí)代

在備受關(guān)注的美國(guó)政府公布的“大數(shù)據(jù)研發(fā)計(jì)劃”(BigDataResearchandDevelopmentInitiative)中包含一個(gè)旨在為機(jī)器建立視覺智能的Mind'sEye項(xiàng)目。該計(jì)劃稱,傳統(tǒng)的機(jī)器視覺研究的對(duì)象選取廣泛的物體來(lái)描述一個(gè)場(chǎng)景的屬性名詞,而Mind'sEye旨在增加在這些場(chǎng)景的動(dòng)作認(rèn)識(shí)和推理需要的知覺認(rèn)知基礎(chǔ)??傊@些技術(shù)可以建立一個(gè)更完整的視覺智能效果。

由此可見,走在信息科技前沿的美國(guó)已對(duì)機(jī)器視覺與大數(shù)據(jù)時(shí)代的互動(dòng)關(guān)系先知先覺。黃凱奇指出:“大數(shù)據(jù)時(shí)代最樸素也是最深刻的特點(diǎn)就是‘大’。統(tǒng)計(jì)學(xué)中的大數(shù)定律指出,當(dāng)隨機(jī)事件或者試驗(yàn)在大量重復(fù)出現(xiàn)的條件下,往往呈現(xiàn)幾乎必然的統(tǒng)計(jì)特性。確切地說(shuō),大數(shù)定律是以確切的數(shù)學(xué)形式表達(dá)了大量重復(fù)出現(xiàn)的隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。對(duì)于依賴數(shù)據(jù)規(guī)律的機(jī)器視覺算法來(lái)講,大數(shù)據(jù)無(wú)疑為人們進(jìn)一步發(fā)現(xiàn)人類的認(rèn)知機(jī)理,實(shí)現(xiàn)更加魯棒[魯棒是Robust的音譯,也就是健壯、強(qiáng)壯、堅(jiān)定、粗野的意思。魯棒性(robustness)就是系統(tǒng)的健壯性]的機(jī)器視覺算法提供了可能。另一方面,隨著機(jī)器視覺系統(tǒng)更加魯棒穩(wěn)定,更加智能,它在收集、分析、處理海量信息方面也將發(fā)揮更加重要的作用。簡(jiǎn)言之,機(jī)器視覺一邊借大數(shù)據(jù)之利不斷發(fā)展,一邊又靠技術(shù)的完善而反哺大數(shù)據(jù)時(shí)代,形成一個(gè)良性的互動(dòng)。”

然而,這種互動(dòng)要想真正建立,還需要加強(qiáng)技術(shù)和產(chǎn)業(yè)的雙輪驅(qū)動(dòng)。“國(guó)外在上世紀(jì)80年代就已出現(xiàn)大量的機(jī)器視覺產(chǎn)品,而我國(guó)機(jī)器視覺技術(shù)的應(yīng)用始于90年代末。雖然在過去10年有了長(zhǎng)足的發(fā)展,但目前絕大部分還處于追趕狀態(tài),一個(gè)是技術(shù)上的積累與創(chuàng)新跟國(guó)外相比還存在較大差距。另外一個(gè)是國(guó)內(nèi)在應(yīng)用創(chuàng)新上也存在不足,很多都是跟隨國(guó)外的應(yīng)用案例或者通過代理相關(guān)產(chǎn)品來(lái)實(shí)現(xiàn)模仿應(yīng)用等。”黃凱奇表示。

目前,機(jī)器視覺在交通等多個(gè)領(lǐng)域的應(yīng)用仍相對(duì)單一,存在著多層面阻礙其進(jìn)一步產(chǎn)業(yè)化發(fā)展的因素。黃凱奇分析說(shuō),首先在魯棒穩(wěn)定的機(jī)器視覺系統(tǒng)方面,因?yàn)闄C(jī)器視覺技術(shù)涉及眾多學(xué)科,需要不同學(xué)科協(xié)同創(chuàng)新才能突破目前發(fā)展的技術(shù)瓶頸。再一個(gè)就是標(biāo)準(zhǔn)方面,目前大部分廠家為了自身的短期局部利益都各自開發(fā)封閉的設(shè)備、協(xié)議、系統(tǒng),這對(duì)整個(gè)行業(yè)的發(fā)展極為不利。“如何破除這種封閉狀態(tài)的弊端,制定行業(yè)統(tǒng)一開放標(biāo)準(zhǔn)是促進(jìn)機(jī)器視覺行業(yè)形成大格局、大產(chǎn)業(yè)的必經(jīng)之路。”黃凱奇說(shuō)。

“還有一點(diǎn)原因,就是關(guān)于機(jī)器視覺剛需的創(chuàng)造。我國(guó)是一個(gè)典型的勞動(dòng)力密集國(guó)家,大部分行業(yè)依靠的是低廉的大量富余勞動(dòng)力。而機(jī)器視覺與自動(dòng)化息息相關(guān),因此如何一方面有效解決就業(yè)問題,另一方面又高效推進(jìn)機(jī)器視覺相關(guān)自動(dòng)化產(chǎn)品設(shè)備的推廣使用,是政府部門、企業(yè)需要面對(duì)的問題。”黃凱奇表示。

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(m.u63ivq3.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽(yáng)科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0