每個(gè)機(jī)器人的形態(tài)、大小、樣貌都不一樣,這需要根據(jù)具體的應(yīng)用場(chǎng)景進(jìn)行分析和設(shè)計(jì)。但是無(wú)論是哪種形態(tài)的機(jī)器人,基本上都會(huì)嵌入視覺(jué)系統(tǒng),用于感知周圍的環(huán)境,然后通過(guò)反饋的信息規(guī)劃?rùn)C(jī)器人的動(dòng)作。
香港中文大學(xué)天石機(jī)器人研究所所長(zhǎng)劉云輝教授自本科起就從事機(jī)器人研究,至今已經(jīng)有數(shù)十年的研發(fā)經(jīng)驗(yàn)。在ACTLab和深圳灣聯(lián)合舉辦的“機(jī)器人控制系統(tǒng)和視覺(jué)的融合”活動(dòng)中,劉云輝教授向慕名而來(lái)的創(chuàng)業(yè)者們分享了自己在機(jī)器人領(lǐng)域的所思所得。
我灣梳理了本次演講的重點(diǎn)和要點(diǎn),帶領(lǐng)讀者了解機(jī)器視覺(jué)領(lǐng)域最前沿的研究課題。
三維視覺(jué)技術(shù)大有可為
實(shí)時(shí)三維視覺(jué)技術(shù)應(yīng)用廣泛,在機(jī)器控制、物件抓取和人機(jī)交互等技術(shù)領(lǐng)域,都不能脫離實(shí)時(shí)三維視覺(jué)技術(shù)。正因如此,該技術(shù)有著巨大的商業(yè)潛力。據(jù)報(bào)道,預(yù)計(jì)2020年,全球3D成像系統(tǒng)市場(chǎng)預(yù)計(jì)能達(dá)到536億人民幣,年度復(fù)合增長(zhǎng)率39.4%,尤其是在體育醫(yī)學(xué)、矯形外科學(xué)、人體測(cè)量等醫(yī)學(xué)領(lǐng)域,對(duì)3D成像技術(shù)的需求更為強(qiáng)烈。
劉云輝教授研究實(shí)時(shí)三維視覺(jué)技術(shù)多年,他認(rèn)為:“研究三維視覺(jué)技術(shù),歸根結(jié)底,就是要理解什么是視覺(jué)信息,然后將這些視覺(jué)信息在實(shí)際的場(chǎng)景中應(yīng)用起來(lái)?!彼邪l(fā)的基于結(jié)構(gòu)光的雙目視覺(jué)技術(shù)具有精度高、測(cè)量速度快、動(dòng)態(tài)拍攝等特點(diǎn),并且已經(jīng)應(yīng)用在商業(yè)化的3D成像系統(tǒng)中。
工廠叉車也要自動(dòng)駕駛
目前,大型工廠的室內(nèi)物件搬運(yùn)70%靠的是人工駕駛叉車進(jìn)行操作,但從事重體力勞動(dòng)工人的人工成本上升和人力資源的短缺,對(duì)很多行業(yè)造成重大影響,移動(dòng)機(jī)械的自動(dòng)化改造需求迫切。
經(jīng)研究發(fā)現(xiàn),室內(nèi)移動(dòng)器械自動(dòng)駕駛的挑戰(zhàn)主要有兩點(diǎn):一是無(wú)GPS的定位和制圖,二是精確的運(yùn)動(dòng)控制。憑借多年的圖像傳感器研發(fā)經(jīng)驗(yàn),劉云輝教授將VisualSLAM算法和RGB-D傳感器集成到移動(dòng)機(jī)器人的視覺(jué)導(dǎo)航模塊上,應(yīng)用于移動(dòng)機(jī)械平臺(tái),實(shí)現(xiàn)了低速且高精度的自動(dòng)駕駛功能。
劉教授表示,目前為了保證安全性,移動(dòng)器械的速度并沒(méi)有做得太快。不過(guò),制造業(yè)、建筑業(yè)、采礦業(yè)、物流業(yè)等領(lǐng)域?qū)κ覂?nèi)移動(dòng)器械自動(dòng)駕駛有強(qiáng)烈的需求,所以,該項(xiàng)技術(shù)在未來(lái)會(huì)有很大的發(fā)展空間。
“軟”“硬”兩手抓
機(jī)器人或者機(jī)械臂所抓取的物件基本上都是剛體,很少能對(duì)變形體進(jìn)行抓取。不過(guò),在日常生活中,很多物件并不是棱角分明并且內(nèi)部結(jié)構(gòu)堅(jiān)硬的剛體,而是以柔性體的形式存在,比如日常所穿的衣服、吃的食物、線材、柔性PCB以及人體組織。
劉云輝教授認(rèn)為,在需要操作形變體的領(lǐng)域中,醫(yī)療健康對(duì)該技術(shù)的需求最強(qiáng)烈并且對(duì)操作的精準(zhǔn)度也更高。劉教授結(jié)合自身的研發(fā)經(jīng)驗(yàn)補(bǔ)充說(shuō):“醫(yī)療手術(shù)機(jī)器人的研發(fā)主要有三個(gè)挑戰(zhàn):首先是安全性,醫(yī)療手術(shù)中不能容許半點(diǎn)差錯(cuò),所以如何保證手術(shù)機(jī)器人的安全性,以及與操作醫(yī)師的有效配合是重中之重;保證安全性后,機(jī)器人如何在柔軟的體內(nèi)進(jìn)行解剖和組織切除,機(jī)械結(jié)構(gòu)如何設(shè)計(jì),視覺(jué)系統(tǒng)如何設(shè)計(jì),就是研究人員面臨的第二大挑戰(zhàn);第三,如何讓不懂機(jī)器人技術(shù)的醫(yī)生快速上手操作,人機(jī)交互如何設(shè)計(jì),則是第三個(gè)挑戰(zhàn)?!?/p>
為了應(yīng)對(duì)這三大挑戰(zhàn),劉教授針對(duì)性地提出了三個(gè)解決方案:首先,手術(shù)機(jī)器人可采用小尺寸的、彈性的、或者柔性的機(jī)械結(jié)構(gòu),在保證操作精度的同時(shí)防止人體組織被機(jī)械所傷;第二,在機(jī)器人內(nèi)部嵌入多種傳感器,比如IMU、聲音傳感器、體感設(shè)備、眼球跟蹤設(shè)備等,增強(qiáng)機(jī)器人的功能,并簡(jiǎn)化操作方式;第三,通過(guò)在機(jī)器人中內(nèi)嵌攝像頭,以圖像引導(dǎo)的方式實(shí)時(shí)獲取手術(shù)反饋。
人形才是最適的人機(jī)交互方式
我們周圍的生活環(huán)境是以人類的行為方式為基準(zhǔn)而建立的,人類可以相當(dāng)輕松地上樓梯、開(kāi)門、適應(yīng)各種地形,所以說(shuō)最好的機(jī)器人形態(tài)就是人形機(jī)器人。同理,人和人的溝通是我們最習(xí)慣的交互方式,所以最好的人機(jī)交互就是機(jī)器人以“人”的方式進(jìn)行交互。
人類的語(yǔ)言以及表情能夠傳遞大量的情感信息,所以目前仿人形機(jī)器人的研究主要集中在機(jī)器人的語(yǔ)言以及表情模擬這兩個(gè)領(lǐng)域。但是,除了語(yǔ)言和表情,肢體動(dòng)作也能夠傳遞人的情感信息。
劉云輝教授認(rèn)為,相對(duì)于語(yǔ)言和表情,讓機(jī)器人模擬人的動(dòng)作在技術(shù)上更容易實(shí)現(xiàn),通過(guò)用體感設(shè)備讓機(jī)器人模仿人類的肢體動(dòng)作,學(xué)習(xí)人類的行為模式,增強(qiáng)機(jī)器人的智能,并最終實(shí)現(xiàn)自然的人機(jī)交互。
更多資訊請(qǐng)關(guān)注機(jī)器視覺(jué)頻道