在近日于意大利羅馬召開的“機(jī)器人學(xué):科學(xué)與系統(tǒng)大會(huì)”上,美國麻省理工學(xué)院(MIT)的科研團(tuán)隊(duì)展示了如何用“同步定位與繪圖”(SLAM)技術(shù)來提高目標(biāo)識(shí)別系統(tǒng)的性能。
SLAM技術(shù)能讓移動(dòng)機(jī)器人自我定位、繪制出自身所在位置的地圖;目標(biāo)認(rèn)知系統(tǒng)是未來機(jī)器人的關(guān)鍵組成部分,幫助它們操縱身邊的物體。新的目標(biāo)識(shí)別系統(tǒng)由MIT機(jī)械工程系教授約翰·萊奧納德的團(tuán)隊(duì)設(shè)計(jì),他們將目前的SLAM技術(shù)和目標(biāo)認(rèn)知算法結(jié)合,只用普通的視頻攝像機(jī)作外部輸入,把不同角度獲取的信息融合在一起,使系統(tǒng)性能可媲美特種機(jī)器人目標(biāo)認(rèn)知系統(tǒng),而后者需要深度測量和視覺信息。
論文第一作者、MIT計(jì)算機(jī)科學(xué)與工程系研究生蘇迪普·皮爾萊說,在猜測圖像中包含了哪些物體之前,新系統(tǒng)會(huì)首先識(shí)別兩個(gè)物體之間的邊界,初步分析顏色轉(zhuǎn)變,在此基礎(chǔ)上把圖像分成多個(gè)各自包含某種物體的矩形區(qū)域,然后對每個(gè)區(qū)域內(nèi)的像素作識(shí)別計(jì)算。
研究人員指出,傳統(tǒng)目標(biāo)識(shí)別系統(tǒng)可能需要對這些矩形區(qū)域重畫幾千次。因?yàn)閺哪硞€(gè)角度來看,兩個(gè)并排的物體看起來好像是一個(gè),特別是當(dāng)它們顏色相似的時(shí)候。因此系統(tǒng)必須對一些假設(shè)進(jìn)行測試,比如假設(shè)它們是一個(gè),或假設(shè)它們是分開的。
而SLAM技術(shù)生成的圖像是三維的,所以在區(qū)分近距離物體方面比單一角度分析系統(tǒng)好得多。用SLAM技術(shù)來指導(dǎo)圖像分割并分區(qū)計(jì)算,在處理假設(shè)時(shí)效率更高。更重要的是,SLAM技術(shù)能把不同角度圖像的分區(qū)與目標(biāo)識(shí)別系統(tǒng)關(guān)聯(lián)起來,對各圖區(qū)作分析,就可能繪出同一物體的不同角度,提高系統(tǒng)識(shí)別能力。
目前,該團(tuán)隊(duì)正在探索SLAM技術(shù)的核心難題“環(huán)路閉合”,即在機(jī)器人繪制它所在地地圖時(shí),可能發(fā)現(xiàn)它以前來過這里——比如從不同的門進(jìn)入同一個(gè)房間它要能認(rèn)出以前到過哪些地方,才能把來自不同角度的地圖數(shù)據(jù)更好地結(jié)合在一起。
更多資訊請關(guān)注工業(yè)機(jī)器人頻道