機(jī)器視覺(jué)是人工智能正在快速發(fā)展的一個(gè)分支,在智能制造領(lǐng)域,機(jī)器視覺(jué)可謂是“大功臣”。不論是工業(yè)機(jī)器人、無(wú)人機(jī)、自動(dòng)駕駛應(yīng)用,還是智能醫(yī)療、安防智能監(jiān)管領(lǐng)域,機(jī)器視覺(jué)都有著獨(dú)一無(wú)二、舉足輕重的地位。
機(jī)器視覺(jué)“青出于藍(lán)而勝于藍(lán)”
機(jī)器視覺(jué)系統(tǒng)是通過(guò)機(jī)器視覺(jué)產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專(zhuān)用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來(lái)抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來(lái)控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。人的肉眼只能進(jìn)行一些簡(jiǎn)單的識(shí)別,機(jī)器視覺(jué)卻能在細(xì)微處體現(xiàn)出“大”智慧。
視覺(jué),就是擁有人眼一般,可以清楚地分辨。但機(jī)器視覺(jué)所具備的決不僅止于肉眼的單一功能,它的“神通廣大”可是肉眼所無(wú)法比擬的。
相比于人眼觀測(cè),機(jī)器視覺(jué)具有靈活性、自動(dòng)化、客觀、非接觸和高精度等特點(diǎn)。尤其是在工業(yè)生產(chǎn)領(lǐng)域,機(jī)器視覺(jué)強(qiáng)調(diào)生產(chǎn)的精度和速度,以及工業(yè)現(xiàn)場(chǎng)環(huán)境下的可靠性。在一些不適于人工作業(yè)的危險(xiǎn)工作環(huán)境或者人工視覺(jué)難以滿(mǎn)足要求的場(chǎng)合,常用機(jī)器視覺(jué)來(lái)替代人工視覺(jué)進(jìn)行工作。
人們希望機(jī)器擁有視覺(jué),甚至在某些應(yīng)用中能夠超越人類(lèi)能力的極限完成人不能完成的工作。在商業(yè)應(yīng)用中,機(jī)器視覺(jué)技術(shù)可以幫助機(jī)器人廠(chǎng)商打造高端交互性強(qiáng)的智能機(jī)器人,隨著人工智能深入發(fā)展,以及云計(jì)算、大數(shù)據(jù)應(yīng)用深化,智能機(jī)器人將擁有人工智能“大腦”,能夠在非結(jié)構(gòu)化的環(huán)境中自主完成識(shí)別、思考和決策。
加拿大傳播學(xué)者麥克盧漢在《理解媒介:論人的延伸》中提出:媒介即人的延伸。廣播是人的聽(tīng)覺(jué)能力的延伸,而機(jī)器視覺(jué),毫無(wú)疑問(wèn),則是人的視覺(jué)能力的延伸??茖W(xué)技術(shù)催生了機(jī)器視覺(jué)的誕生,但機(jī)器視覺(jué)卻“青出于藍(lán)而勝于藍(lán)”,實(shí)力不容小覷??!
市場(chǎng)利好,行業(yè)加速布局
人工智能領(lǐng)域的融資總額一直在逐年穩(wěn)步增長(zhǎng),從2010年時(shí)的2億美元到2013年時(shí)的6億美元,再到2015年時(shí)的12億美元。在2016年的第一季度,人工智能領(lǐng)域已經(jīng)融到逾4億美元的資金,這個(gè)水平跟2015年同期旗鼓相當(dāng),而全年甚至有望更上一層樓。
據(jù)美國(guó)媒體報(bào)道,蘋(píng)果在大肆收購(gòu)機(jī)器學(xué)習(xí)公司。繼去年底收購(gòu)Perceptio和數(shù)月前收購(gòu)Turi后,蘋(píng)果近期又收購(gòu)了印度機(jī)器學(xué)習(xí)公司Tuplejump。蘋(píng)果代表未證實(shí)也未否認(rèn)此消息,這是該公司事實(shí)上收購(gòu)了的標(biāo)準(zhǔn)做法。
據(jù)悉蘋(píng)果對(duì)Tuplejump開(kāi)發(fā)的開(kāi)源項(xiàng)目FiloDB特別感興趣,該技術(shù)可將應(yīng)用機(jī)器學(xué)習(xí)概念和分析有效應(yīng)用到大量復(fù)雜數(shù)據(jù)中。FiloDB主要由伊凡·陳(EvanChan)負(fù)責(zé),他的LinkedIn資料頁(yè)面顯示,他是在2015年8月加入Tuplejump。
不僅是智能機(jī)巨頭蘋(píng)果,各大企業(yè)也在竭盡所能進(jìn)軍機(jī)器視覺(jué)。今年5月,美國(guó)亞馬遜公司收購(gòu)了一支歐洲頂級(jí)機(jī)器視覺(jué)團(tuán)隊(duì)用于無(wú)人機(jī)領(lǐng)域研究;同樣在5月,英特爾集成電路公司收購(gòu)了俄羅斯計(jì)算機(jī)視覺(jué)公司Itseez,用于無(wú)人駕駛領(lǐng)域;6月初,俄羅斯計(jì)算機(jī)視覺(jué)公司VisionLabs開(kāi)發(fā)了一個(gè)通用的開(kāi)源計(jì)算機(jī)視覺(jué)開(kāi)發(fā)平臺(tái),F(xiàn)acebook與谷歌為其提供資金并測(cè)試開(kāi)發(fā)成果······行業(yè)加速布局機(jī)器視覺(jué)無(wú)疑是看中了該行業(yè)廣闊的應(yīng)用前景,想要在未來(lái)機(jī)器視覺(jué)市場(chǎng)上分一杯羹。
機(jī)器視覺(jué)的“阿喀琉斯之踵”
據(jù)麻省理工《技術(shù)評(píng)論》報(bào)道,來(lái)自谷歌和OpenAI研究所的研究人員發(fā)現(xiàn)了機(jī)器視覺(jué)算法的一個(gè)弱點(diǎn):機(jī)器視覺(jué)會(huì)被一些經(jīng)過(guò)修改的圖像干擾,而人類(lèi)可以很容易地發(fā)現(xiàn)這些圖像的修改之處。
研究人員指出:“一例子是對(duì)人臉圖像打上非常細(xì)微的標(biāo)記,人類(lèi)依然可以正確地識(shí)別出圖像中人物的身份,但機(jī)器學(xué)習(xí)系統(tǒng)會(huì)把他們識(shí)別成其他人”。研究人員對(duì)此進(jìn)行了系統(tǒng)的研究,揭示了機(jī)器視覺(jué)系統(tǒng)的弱點(diǎn)。
這項(xiàng)研究揭示了機(jī)器視覺(jué)的阿喀琉斯之踵,未來(lái)還有很多值得研究的內(nèi)容。研究人員希望為其他類(lèi)型的視覺(jué)系統(tǒng)開(kāi)發(fā)比較圖像,從而使這些系統(tǒng)更有效率。
金無(wú)足赤,人無(wú)完人,機(jī)器視覺(jué)也不例外。隨著工業(yè)自動(dòng)化及機(jī)器視覺(jué)應(yīng)用領(lǐng)域的多元化發(fā)展,識(shí)別率、成本和速度將成為機(jī)器視覺(jué)系統(tǒng)的核心競(jìng)爭(zhēng)力。在注重實(shí)效的工業(yè)應(yīng)用中,復(fù)雜多樣的應(yīng)用場(chǎng)景將對(duì)機(jī)器視覺(jué)的識(shí)別率、處理速度、計(jì)算機(jī)硬件提出更多的需求。
就目前來(lái)看,機(jī)器視覺(jué)“利大于弊”得到廣泛認(rèn)可,雖有“短板”,但這正揭示了其還有進(jìn)步之處,需要研究人員不斷地去探索。
更多資訊請(qǐng)關(guān)注機(jī)器視覺(jué)頻道
(本文由中國(guó)傳動(dòng)網(wǎng)整理發(fā)布,部分資料來(lái)源于騰訊財(cái)經(jīng)、賽迪網(wǎng)、網(wǎng)易科技、經(jīng)濟(jì)學(xué)人、中國(guó)報(bào)告大廳、上海證券報(bào))