技術(shù)頻道

娓娓工業(yè)
您現(xiàn)在的位置: 中國(guó)傳動(dòng)網(wǎng) > 技術(shù)頻道 > 技術(shù)百科 > 基于極限學(xué)習(xí)機(jī)的機(jī)器人示教學(xué)習(xí)研究

基于極限學(xué)習(xí)機(jī)的機(jī)器人示教學(xué)習(xí)研究

時(shí)間:2016-11-22 14:08:29來(lái)源:歐勇盛

導(dǎo)語(yǔ):?機(jī)器人的智能化經(jīng)過(guò)多年的發(fā)展,已越來(lái)越貼近人類,使其成為具有人類的學(xué)習(xí)能力、運(yùn)動(dòng)能力、執(zhí)行能力、感知能力、 認(rèn)知能力等的新型智能機(jī)器人是人類追求的目標(biāo)。

機(jī)器人的智能化經(jīng)過(guò)多年的發(fā)展,已越來(lái)越貼近人類,使其成為具有人類的學(xué)習(xí)能力、運(yùn)動(dòng)能力、執(zhí)行能力、感知能力、認(rèn)知能力等的新型智能機(jī)器人是人類追求的目標(biāo),其中示教學(xué)習(xí)是研究機(jī)器人學(xué)習(xí)能力的重要分支之一,是智能型仿人機(jī)器人發(fā)展和應(yīng)用的關(guān)鍵。因此,對(duì)于示教學(xué)習(xí)的研究一直是學(xué)術(shù)界研究的熱點(diǎn)。

近年來(lái),為達(dá)到機(jī)器人能準(zhǔn)確、快速的完成人類導(dǎo)師對(duì)其示教的動(dòng)作,出現(xiàn)了許多示教方法,如日本Kondo公司生產(chǎn)的KHR系列機(jī)器人,采用直接輸入機(jī)器人各個(gè)關(guān)節(jié)角度的方式進(jìn)行示教;美國(guó)戴沃爾提出利用伺服技術(shù)對(duì)機(jī)器人的關(guān)節(jié)進(jìn)行控制,人手對(duì)機(jī)器人進(jìn)行動(dòng)作示教,機(jī)器人記錄示教過(guò)程中的示教數(shù)據(jù)并進(jìn)行再現(xiàn);曹其新等人則提出了利用激光深度傳感器在獲得人體各關(guān)節(jié)轉(zhuǎn)角的三維坐標(biāo)后,將其輸入到控制器中進(jìn)行示教,并采用基于速度的有選擇均值濾波法對(duì)控制數(shù)據(jù)進(jìn)行處理,以上示教方法在人類對(duì)機(jī)器人進(jìn)行示教研究的進(jìn)程中,做出了重要的貢獻(xiàn),起到了很大的推動(dòng)作用,但機(jī)器人完成示教動(dòng)作的準(zhǔn)確性、重現(xiàn)的速度及傳感器數(shù)據(jù)抖動(dòng)方面扔有待提高。

在系統(tǒng)控制策略方面,有許多算法被相繼應(yīng)用于機(jī)器人示教領(lǐng)域,如高斯混合模型、強(qiáng)化學(xué)習(xí)、試錯(cuò)學(xué)習(xí)等。以上方法在用于系統(tǒng)控制時(shí),雖然表現(xiàn)出了良好的系統(tǒng)穩(wěn)定性及有效性,但也存在各自的缺點(diǎn),如訓(xùn)練時(shí)間長(zhǎng)、生成的軌跡連續(xù)性不好等。極限學(xué)習(xí)機(jī)ELM(ExtremeLearningMachine)是針對(duì)上述算法的缺陷設(shè)計(jì)的一種新型算法,其具有泛化學(xué)習(xí)能力強(qiáng)、訓(xùn)練速度快等方面的優(yōu)點(diǎn)。

綜上所述,為了使機(jī)器人示教系統(tǒng)具有很好的自適應(yīng)性及魯棒性,即機(jī)器人能按照示教動(dòng)作,在不同起始點(diǎn)上仍按照示教的軌跡回到終點(diǎn)位置,使得機(jī)器人具有一定的智能性及自學(xué)習(xí)能力,并針對(duì)上述算法的缺點(diǎn),本文選用教學(xué)研究型機(jī)器人NAO為實(shí)驗(yàn)平臺(tái),采用扳動(dòng)其手臂關(guān)節(jié)的方式進(jìn)行示教,同時(shí)構(gòu)建了以極限學(xué)習(xí)機(jī)為核心算法的機(jī)器人示教系統(tǒng),并通過(guò)實(shí)驗(yàn)驗(yàn)證了該算法能使系統(tǒng)具有一定的泛化能力。

控制過(guò)程概述

機(jī)器人完成點(diǎn)到點(diǎn)的示教動(dòng)作是研究仿人機(jī)器人動(dòng)作編輯的重要組成部分。故本文將以機(jī)器人完成從起始點(diǎn)到目標(biāo)點(diǎn)的動(dòng)作為基礎(chǔ)動(dòng)作,以極短的時(shí)間間隔作為采樣的頻率,每次采集時(shí),將NAO右手臂上的四個(gè)關(guān)節(jié)角的值采集到,然后對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,之后進(jìn)行回歸訓(xùn)練,利用訓(xùn)練好的模型對(duì)機(jī)器人的控制器進(jìn)行控制,使得機(jī)器人重現(xiàn)示教動(dòng)作更加準(zhǔn)確。(如圖1)

實(shí)驗(yàn)平臺(tái)簡(jiǎn)介

法國(guó)AldebaranRobotics公司研制的小型仿人機(jī)器人NAO,高度為58厘米,全身共有25個(gè)自由度,具有動(dòng)覺、視覺、觸覺、感知、認(rèn)知等能力,其擁有完善的數(shù)字處理器及電機(jī)制動(dòng)器、豐富的傳感器系統(tǒng)、多種交流設(shè)備、特有的操作系統(tǒng)NAOqi、完備的配套編程平臺(tái),具備Wi-Fi連接及以太網(wǎng)兩種通信方式,因其具備良好的二次開發(fā)的優(yōu)勢(shì),被廣泛作為教學(xué)、科研等方面的研究工具。

示教學(xué)習(xí)算法

由于傳感器測(cè)量時(shí)存在累積誤差、噪聲、穩(wěn)定性等問(wèn)題,會(huì)使測(cè)量到的數(shù)據(jù)不夠準(zhǔn)確,故使用離散時(shí)間的卡爾曼濾波KF(KalmanFilter)來(lái)對(duì)NAO手臂關(guān)節(jié)上的傳感器輸出數(shù)據(jù)進(jìn)行融合,使得機(jī)器人手臂姿態(tài)的準(zhǔn)確性最優(yōu),有利于提高機(jī)器人示教學(xué)習(xí)的準(zhǔn)確性。根據(jù)上一時(shí)刻關(guān)節(jié)傳感器采集到的測(cè)量值對(duì)下一時(shí)刻的測(cè)量值進(jìn)行估計(jì),然后與下一時(shí)刻傳感器的測(cè)量值進(jìn)行數(shù)據(jù)融合,即更正下一時(shí)刻的測(cè)量值,以便使數(shù)據(jù)更準(zhǔn)確。

根據(jù)機(jī)器人實(shí)際運(yùn)動(dòng)狀態(tài),將運(yùn)動(dòng)系統(tǒng)定義為一階常微分方程:

實(shí)驗(yàn)

HCS(LearningHumanbyDemonstration)是由Y.OuandY.Xu[12]提出的用于在非線性動(dòng)態(tài)系統(tǒng)中,利用支持向量基為模型學(xué)習(xí)動(dòng)態(tài)系統(tǒng)的參數(shù),以保證動(dòng)作能夠按照示教動(dòng)作達(dá)到并停止到目標(biāo)點(diǎn)的一種統(tǒng)計(jì)學(xué)優(yōu)化算法。為驗(yàn)證ELM算法具有在上述約束條件下收斂、訓(xùn)練速度快、準(zhǔn)確率高等特點(diǎn),首先將ELM與SEDS在采用相同的樣本數(shù)據(jù)為前提下,將兩者的仿真實(shí)驗(yàn)結(jié)果進(jìn)行比較。樣本數(shù)據(jù)來(lái)源為采集的多種人類實(shí)際手寫體數(shù)據(jù)庫(kù)。以數(shù)據(jù)庫(kù)中的Cshape、Spoon、Line、Trapezoid等數(shù)據(jù)為例,實(shí)驗(yàn)對(duì)比圖如圖3所示。

在實(shí)驗(yàn)平臺(tái)上做實(shí)際的示教實(shí)驗(yàn),首先由操作者扳動(dòng)機(jī)器人NAO的手臂末端執(zhí)行器,使其做出要求的避障取物動(dòng)作,在示教的同時(shí),NAO中的遠(yuǎn)程控制器,記錄下每間隔100ms傳感器、關(guān)節(jié)角等的值,當(dāng)需要機(jī)器人重現(xiàn)示教動(dòng)作時(shí),動(dòng)態(tài)系統(tǒng)從存儲(chǔ)器中取出經(jīng)ELM算法訓(xùn)練出的控制信息,將指令信號(hào)傳給驅(qū)動(dòng)機(jī)構(gòu),使驅(qū)動(dòng)機(jī)構(gòu)準(zhǔn)確、快速的完成要求的動(dòng)作。ELM中,隱藏層節(jié)點(diǎn)個(gè)數(shù)為50,輸入層與隱藏層權(quán)值均為隨機(jī)向量,以處理后機(jī)器人手臂末端執(zhí)行器的空間位置數(shù)據(jù)作為極限學(xué)習(xí)機(jī)的輸入,以手臂末端的速度作為其輸出。

人類導(dǎo)師示教過(guò)程及示教曲線圖如圖4所示。

圖5為機(jī)器人從不同的起始點(diǎn)進(jìn)行避障示教及重現(xiàn)的軌跡圖,黑色點(diǎn)集代表動(dòng)作起始點(diǎn),藍(lán)色點(diǎn)集代表動(dòng)作的終止點(diǎn),紅色曲線為樣本數(shù)據(jù)組成的示教曲線,藍(lán)色曲線為機(jī)器人重現(xiàn)示教動(dòng)作的曲線圖。

結(jié)論

本文結(jié)合ELM學(xué)習(xí)算法的訓(xùn)練速度快、所需調(diào)節(jié)的參數(shù)少等優(yōu)點(diǎn),對(duì)機(jī)器人進(jìn)行示教學(xué)習(xí),彌補(bǔ)了以往仿人機(jī)器人示教學(xué)習(xí)時(shí)學(xué)習(xí)速度慢,重現(xiàn)示教動(dòng)作精確度不高等方面的不足,實(shí)踐效果表明,采用該方法有很好的抗干擾能力、很好的泛化能力,同時(shí)也避免了維度災(zāi)難。采用常微分方程將基于ELM的動(dòng)態(tài)系統(tǒng)描述為非線性動(dòng)態(tài)系統(tǒng),并給出了該系統(tǒng)在目標(biāo)點(diǎn)達(dá)到局部穩(wěn)定的約束條件,利用李雅普諾夫穩(wěn)定性定理對(duì)其穩(wěn)定性給予了理論支撐,為今后仿人機(jī)器人學(xué)習(xí)更多復(fù)雜的示教動(dòng)作奠定基礎(chǔ)。

更多資訊請(qǐng)關(guān)注傳感器頻道

標(biāo)簽:

點(diǎn)贊

分享到:

上一篇:四方電氣牙簽全自動(dòng)包裝機(jī)控...

下一篇:脊柱手術(shù)機(jī)器人系統(tǒng)開發(fā)及其研究

中國(guó)傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(m.u63ivq3.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

網(wǎng)站簡(jiǎn)介|會(huì)員服務(wù)|聯(lián)系方式|幫助信息|版權(quán)信息|網(wǎng)站地圖|友情鏈接|法律支持|意見反饋|sitemap

傳動(dòng)網(wǎng)-工業(yè)自動(dòng)化與智能制造的全媒體“互聯(lián)網(wǎng)+”創(chuàng)新服務(wù)平臺(tái)

網(wǎng)站客服服務(wù)咨詢采購(gòu)咨詢媒體合作

Chuandong.com Copyright ?2005 - 2024 ,All Rights Reserved 深圳市奧美大唐廣告有限公司 版權(quán)所有
粵ICP備 14004826號(hào) | 營(yíng)業(yè)執(zhí)照證書 | 不良信息舉報(bào)中心 | 粵公網(wǎng)安備 44030402000946號(hào)