但近日,日本豐田研究所(TRI)推出了一種全新的機(jī)器人Punyo,并表示希望通過Punyo將人形機(jī)器人向前推進(jìn)一步。
Punyo在機(jī)器人的設(shè)計(jì)理念和操作方式上都有創(chuàng)新。它沒有腿,并且截至目前為止,TRI團(tuán)隊(duì)制研究機(jī)器人的軀干,并開發(fā)操縱技能。
設(shè)計(jì)理念:服務(wù)人類日常生活
傳統(tǒng)的工業(yè)機(jī)器人多應(yīng)用于車間作業(yè)、組裝等任務(wù),目的是提高生產(chǎn)效率、減輕勞動(dòng)強(qiáng)度。而在未來,服務(wù)型機(jī)器人或許會(huì)進(jìn)入更多家庭,直接面向和服務(wù)于普通人的日常需求。
TRI研究人員表示,Punyo的目標(biāo)就是成為一個(gè)“幫助人們在家中和其他地方完成日常任務(wù)”的機(jī)器人。
這一設(shè)計(jì)理念決定了Punyo需要具備靈活、柔軟、安全的特征。因?yàn)橐M(jìn)入復(fù)雜多變的家庭環(huán)境,就不能出現(xiàn)傳統(tǒng)工業(yè)機(jī)器人那樣堅(jiān)硬、僵硬的機(jī)械手臂,否則會(huì)給人帶來危險(xiǎn)感,也無法完成各種日常物品操作任務(wù)。這與SoftBank機(jī)器人Pepper的設(shè)計(jì)思路有些類似,都著眼于如何讓機(jī)器人更融入人類生活。
面向服務(wù)應(yīng)用也要求Punyo能夠?qū)W習(xí)各種日常技能,而不僅是進(jìn)行工廠流水線上的單一操作。這需要賦予機(jī)器人強(qiáng)大的學(xué)習(xí)能力,通過觀察、模仿人類示范來掌握各種日常任務(wù)的操作方法。
對(duì)于人形機(jī)器人來說,使用整個(gè)身體的操作是棘手的,因?yàn)槠胶馐且粋€(gè)難題。然而,TRI的研究人員設(shè)計(jì)了它的機(jī)器人來做到這一點(diǎn)。
“Punyo 做事的方式不同。利用它的整個(gè)身體,它可以承載比簡單地用伸出的手按壓更多的東西,“TRI全身操縱技術(shù)負(fù)責(zé)人之一Andrew Beaulieu補(bǔ)充道?!叭彳浂取⒂|覺感應(yīng)以及進(jìn)行大量接觸的能力有利于更好地操縱物體?!?/p>
軟硬結(jié)合機(jī)體
要實(shí)現(xiàn)靈活柔軟的機(jī)器人設(shè)計(jì),TRI采用了硬軟結(jié)合的機(jī)械手臂設(shè)計(jì)。Punyo 的手、手臂和胸部覆蓋著順從的材料和觸覺傳感器,這樣既可以感受外界接觸,柔軟的材料也能使機(jī)器人的身體能夠與它所操縱的物體保持一致。
這是目前許多軟體機(jī)器人的典型設(shè)計(jì)思路。
與此同時(shí),在柔軟外殼下面,Punyo內(nèi)部還保留了兩個(gè)“硬”的機(jī)械手臂作為骨骼支撐,以及一個(gè)軀干框架和腰部執(zhí)行器,來提供力學(xué)支持和精確控制。這種硬軟結(jié)合設(shè)計(jì)集傳統(tǒng)機(jī)器人的力學(xué)優(yōu)勢與軟體機(jī)器人的柔軟特性于一身。
具體來看,Punyo手臂上的氣囊可根據(jù)需要調(diào)節(jié)內(nèi)部壓力變硬變軟,在保證一定力學(xué)剛性的同時(shí),也提供了約5厘米的順應(yīng)性。“爪”也采用高摩擦的乳膠氣囊設(shè)計(jì),手掌心的攝像頭可以通過觀察氣囊表面變形來感知外力大小。整個(gè)手臂都可彎曲轉(zhuǎn)動(dòng),而且氣囊互相連接,這使得力量可以順暢傳導(dǎo),避免機(jī)器人“斷臂”。
強(qiáng)大的學(xué)習(xí)能力
要適應(yīng)家庭環(huán)境中的多變?nèi)蝿?wù),Punyo必須具有強(qiáng)大的學(xué)習(xí)能力。
根據(jù)TRI團(tuán)隊(duì)介紹,Punyo 使用兩種方法學(xué)習(xí)了接觸豐富的策略:擴(kuò)散策略和示例引導(dǎo)的強(qiáng)化學(xué)習(xí)。TRI去年宣布了其擴(kuò)散政策方法。通過這種方法,機(jī)器人使用人類演示來學(xué)習(xí)難以建模的任務(wù)的穩(wěn)健感覺運(yùn)動(dòng)策略。
示例引導(dǎo)的強(qiáng)化學(xué)習(xí)是一種需要在模擬中對(duì)任務(wù)進(jìn)行建模的方法,并通過一小組演示來指導(dǎo)機(jī)器人的探索。TRI表示,它使用這種學(xué)習(xí)來實(shí)現(xiàn)可以在模擬中建模的任務(wù)的魯棒操作策略。
當(dāng)機(jī)器人可以看到這些任務(wù)的演示時(shí),它可以更有效地學(xué)習(xí)它們。它還為 TRI 團(tuán)隊(duì)提供了更多空間來影響機(jī)器人用于完成任務(wù)的運(yùn)動(dòng)風(fēng)格。
該團(tuán)隊(duì)使用對(duì)抗性運(yùn)動(dòng)先驗(yàn)(AMP),傳統(tǒng)上用于將計(jì)算機(jī)動(dòng)畫角色風(fēng)格化,將人類運(yùn)動(dòng)模仿納入其強(qiáng)化管道。
強(qiáng)化學(xué)習(xí)確實(shí)需要團(tuán)隊(duì)在模擬中對(duì)任務(wù)進(jìn)行建模以進(jìn)行訓(xùn)練。為此,TRI使用基于模型的規(guī)劃器進(jìn)行演示,而不是遠(yuǎn)程操作。它稱這個(gè)過程為“計(jì)劃指導(dǎo)的強(qiáng)化學(xué)習(xí)”。
TRI聲稱,使用計(jì)劃器可以使難以遠(yuǎn)程操作的長距離任務(wù)成為可能。該團(tuán)隊(duì)還可以自動(dòng)生成任意數(shù)量的演示,從而減少其管道對(duì)人工輸入的依賴,這使 TRI 更接近于 增加 Punyo 可以處理的任務(wù)數(shù)量。
雖然目前Punyo軟體服務(wù)機(jī)器人還處于初級(jí)階段,各方面性能有待提高,但其應(yīng)用前景廣闊,并且Punyo的設(shè)計(jì)理念和技術(shù)路線也為業(yè)內(nèi)提供了新思路。