人工智能強(qiáng)勁發(fā)展 機(jī)器視覺(jué)瓶頸亟待突破

時(shí)間:2016-04-06

來(lái)源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語(yǔ):機(jī)器視覺(jué)是人工智能正在快速發(fā)展的一個(gè)分支,旨在賦予機(jī)器可媲美人類(lèi)的視覺(jué)。隨著研究人員應(yīng)用專(zhuān)門(mén)的神經(jīng)網(wǎng)絡(luò)來(lái)幫助機(jī)器識(shí)別和理解現(xiàn)實(shí)世界的圖像,機(jī)器視覺(jué)在過(guò)去幾年取得了巨大的進(jìn)步。

2015年12月,谷歌發(fā)布了其云視覺(jué)API,來(lái)執(zhí)行這些任務(wù),如:識(shí)別人臉、標(biāo)志和文字,探測(cè)物體并了解其環(huán)境的應(yīng)用。一些客戶(hù)都對(duì)這些功能感到非常興奮,在市場(chǎng)上其它企業(yè)也正在尋找類(lèi)似的一種服務(wù),為使其適應(yīng)其業(yè)務(wù)模式。

機(jī)器為什么需要視覺(jué)呢?視覺(jué)是主要的感官。機(jī)器要能夠理解人類(lèi),提供他們所需的支持,那么它們必須能夠在視覺(jué)范疇進(jìn)行觀(guān)察和表現(xiàn)。這可能是一個(gè)小攝像頭的形式,可以幫助盲人去“看”和感受環(huán)繞他們周?chē)氖澜?。或者是一個(gè)家庭監(jiān)控系統(tǒng),該系統(tǒng)能夠正確識(shí)別一群流浪貓之間的差異,或者移動(dòng)樹(shù)枝,和一個(gè)防盜的形式。

在過(guò)去的一年中,圍繞著人工智能的嗡嗡聲,一直在非常強(qiáng)勁的增長(zhǎng)。我們還從來(lái)沒(méi)有如此接近的觀(guān)察到這個(gè)技術(shù)的好處。2016年,將會(huì)看到新式的人工智能的供電設(shè)備,因?yàn)槲覀儗?duì)于人工智能,所面臨的最困難的挑戰(zhàn)之一,已經(jīng)取得了進(jìn)展:讓我們的設(shè)備,能夠了解它們所看到的。

在我們的日常生活中,由于設(shè)備逐漸成為我們不可分割的一部分,我們已經(jīng)看到如果沒(méi)有足夠的視覺(jué)能力,越來(lái)越多的應(yīng)用程序?qū)⒆呦蚴?,其中包括空中無(wú)人機(jī)碰撞和機(jī)器人吸塵器“吃”了它們本不應(yīng)該吃的東西。

機(jī)器視覺(jué)是人工智能正在快速發(fā)展的一個(gè)分支,旨在賦予機(jī)器可媲美人類(lèi)的視覺(jué)。隨著研究人員應(yīng)用專(zhuān)門(mén)的神經(jīng)網(wǎng)絡(luò)來(lái)幫助機(jī)器識(shí)別和理解現(xiàn)實(shí)世界的圖像,機(jī)器視覺(jué)在過(guò)去幾年取得了巨大的進(jìn)步。如今的計(jì)算機(jī)在視覺(jué)識(shí)別上能夠做到各種各樣的事情,從識(shí)別網(wǎng)絡(luò)上的貓到在諸多的照片中識(shí)別特定的面孔。不過(guò),該類(lèi)技術(shù)還有很長(zhǎng)的路要走。今天,我們看到機(jī)器視覺(jué)能夠離開(kāi)數(shù)據(jù)中心,并適用于一切從自主無(wú)人機(jī)到機(jī)器人身上,可以整理我們的食物。

為了更好的了解機(jī)器人視覺(jué),一個(gè)常見(jiàn)的類(lèi)比,機(jī)器人視覺(jué)與人類(lèi)自己的視覺(jué),就好比天空中飛行的鳥(niǎo)類(lèi)與飛機(jī)。兩者最終都將依賴(lài)于基礎(chǔ)物理學(xué)(如伯努利原理),來(lái)幫助它們飛入到高空中,但是,這并不意味著飛機(jī)將要扇動(dòng)它的翅膀進(jìn)行飛翔。只是因?yàn)槿伺c機(jī)器可能會(huì)看到同樣的東西,并且對(duì)這些圖像進(jìn)行解釋的方式,甚至可能有一定的共性,最后的結(jié)果仍然可能是具有很大的不同。

雖然基本的圖像分類(lèi)已經(jīng)變得更加容易,但是,當(dāng)它涉及到從抽象的場(chǎng)景中提取意義和信息時(shí),機(jī)器人就面臨著一系列新的問(wèn)題。錯(cuò)覺(jué)就是一個(gè)很好的例子,機(jī)器人視覺(jué)仍然還有很長(zhǎng)的路要走。

舉例來(lái)說(shuō),當(dāng)人看到兩張面對(duì)面的臉的輪廓圖像時(shí),他們看到的不僅僅是抽象的形狀。他們的大腦會(huì)進(jìn)行進(jìn)一步的解讀,讓他們能夠識(shí)別圖像的多個(gè)部分,看到兩張臉,又或者看到一個(gè)花瓶。但對(duì)于機(jī)器來(lái)說(shuō),這樣的圖像是非常難以理解的。基本的分類(lèi)器分辨不了兩張臉和花瓶,它看到的會(huì)是諸如短柄斧、吊鉤、避彈衣甚至吉他的物體。該系統(tǒng)并不能確定那些物體是在該圖像當(dāng)中,這說(shuō)明這類(lèi)圖像的識(shí)別對(duì)于機(jī)器而言極具挑戰(zhàn)性。

如果我們看到一些更復(fù)雜的東西,這個(gè)問(wèn)題甚至?xí)兊酶永щy,比如BeverlyDoolittle(富康杜利特爾)的一幅畫(huà),雖然看到這個(gè)圖的每個(gè)人,可能不能夠發(fā)現(xiàn),其實(shí)每個(gè)人的臉都在這塊畫(huà)布上,他們幾乎立即看到,比映入他們眼簾更多的圖片。另外,正如復(fù)雜的圖像,現(xiàn)實(shí)世界也十分凌亂。在當(dāng)中正常航行可不是光開(kāi)發(fā)算法分析數(shù)據(jù)就能夠?qū)崿F(xiàn)的,它需要對(duì)真實(shí)場(chǎng)景有清楚的了解,進(jìn)而能夠相應(yīng)作出行動(dòng)。

更多資訊請(qǐng)關(guān)注機(jī)器視覺(jué)頻道

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(m.u63ivq3.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽(yáng)科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺(jué)
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0