前幾天,微軟在其官網(wǎng)發(fā)布了一篇技術(shù)文章,介紹微軟在嘗試讓ChatGPT突破計(jì)算機(jī)限制去控制機(jī)器人,從而在現(xiàn)實(shí)世界中自由發(fā)揮作用。
根據(jù)文章內(nèi)容,微軟會(huì)將ChatGPT 的能力擴(kuò)展到機(jī)器人領(lǐng)域,并使用語言直觀地控制了多個(gè)平臺(tái),如機(jī)械臂、無人機(jī)和家庭助手機(jī)器人等。
例如,你對(duì)家庭機(jī)器人說“請(qǐng)幫我熱一下午餐”,然后家庭機(jī)器人就會(huì)自己找到微波爐熱好飯菜,這顯然就是我們理想中的機(jī)器人,能用自己的話告訴機(jī)器人該做什么,就好像我們跟其他人交流一樣簡(jiǎn)單。
語言是我們表達(dá)意圖最簡(jiǎn)單直觀的方式,但現(xiàn)在卻只能依賴寫入代碼來控制機(jī)器人,這無疑讓操作復(fù)雜了許多,而目前微軟的團(tuán)隊(duì)正在我們的團(tuán)隊(duì)一直在探索如何改變這一現(xiàn)實(shí),嘗試使用OpenAI的新 AI 語言模型ChatGPT使自然的人機(jī)交互成為可能。
ChatGPT在機(jī)器人上的應(yīng)用
ChatGPT是一種在大量文本和人類交互語料庫上訓(xùn)練的語言模型,才能夠?qū)Ψ秶鷱V泛的提示和問題生成連貫且語法正確的響應(yīng),要想用ChatGPT控制機(jī)器人完成任務(wù),就要使其超越文本思考,對(duì)物理世界進(jìn)行推演。
微軟研究人員表示:“研究的目標(biāo)是看ChatGPT是否能超越生成文本的范疇,對(duì)現(xiàn)實(shí)世界狀況進(jìn)行推理,從而幫助機(jī)器人完成任務(wù)?!蔽④浵M麕椭藗兏p松地與機(jī)器人互動(dòng),而無需學(xué)習(xí)復(fù)雜的編程語言或有關(guān)機(jī)器人系統(tǒng)的詳細(xì)信息。
當(dāng)前的機(jī)器人使用基礎(chǔ),是能將任務(wù)要求轉(zhuǎn)化為系統(tǒng)代碼的工程師或技術(shù)用戶,工程師需要經(jīng)常編寫新的代碼和規(guī)范來糾正機(jī)器人的行為,這個(gè)過程緩慢(用戶需要編寫低級(jí)代碼)、昂貴(需要對(duì)機(jī)器人技術(shù)有深入了解的高技能用戶)而低效(需要多次交互才能使事情正常工作)。
ChatGPT則解鎖了一種新的機(jī)器人范例,它可以快速將自然語言轉(zhuǎn)換為代碼,于是一個(gè)非技術(shù)人員也可以為大型語言模型 (LLM) 提供高級(jí)反饋,同時(shí)監(jiān)控機(jī)器人的性能,基于此微軟在沒有任何微調(diào)的情況下,利用LLM的知識(shí)來控制不同形狀的機(jī)器人來完成各種任務(wù)。
據(jù)了解,目前實(shí)驗(yàn)已經(jīng)能夠通過給ChatGPT的對(duì)話框輸入指令,讓其控制機(jī)器人在房間中找到“健康飲料”、“有糖和紅色標(biāo)志的東西”(在這種情況下,是一罐可樂),以及一面供無人機(jī)自拍的鏡子。
事實(shí)證明,ChatGPT 本身確實(shí)可以做很多事情,但在技術(shù)上還需要一些改進(jìn),包括但不限于特殊提示結(jié)構(gòu)、高級(jí) API 和通過文本的人工反饋,微軟相信他們現(xiàn)在的努力只是開發(fā)機(jī)器人系統(tǒng)方式轉(zhuǎn)變的開始,并希望更多研究人員進(jìn)入這個(gè)令人興奮的領(lǐng)域。
ChatGPT帶來機(jī)器人應(yīng)用拐點(diǎn)
使用機(jī)器人幫助我們處理生活中的各種瑣事,聽起來似乎科幻中的設(shè)想,但事實(shí)上離我們并沒有如此遙遠(yuǎn),或者說它已經(jīng)開始進(jìn)入我們的生活中了,比如掃地機(jī)器人,已經(jīng)成為全球銷售和使用最廣泛的機(jī)器人。
前幾天一篇發(fā)表在PLOS ONE期刊上的研究引起了熱議,該研究邀請(qǐng)了來自英國(guó)的29位人工智能(AI)專家以及來自日本的36位人工智能專家,就人工智能在未來家庭領(lǐng)域的作用進(jìn)行了預(yù)測(cè)和分析。
而專家們普遍認(rèn)為,10年后,約39%的家務(wù)或?qū)⒂勺詣?dòng)化程序完成,當(dāng)然,不同的家務(wù),機(jī)器人所能介入的程度也會(huì)不同,如去雜貨店購物(主要指生活用品)這項(xiàng)任務(wù)可能受影響最大,人們花在這方面的時(shí)間將減少約60%;而照顧小孩這項(xiàng)任務(wù)受影響可能最小,人們花在這方面的時(shí)間將只減少約20%。
機(jī)器人的核心技術(shù)模塊可以簡(jiǎn)單的分為三個(gè)方面,即感知系統(tǒng)、智能AI系統(tǒng)、運(yùn)動(dòng)控制系統(tǒng)。如若ChatGPT可以成功應(yīng)用于機(jī)器人上,智能AI系統(tǒng)將因此獲得突破,那意味著我們可以和機(jī)器人順暢的交流,用語言去控制機(jī)器人完成各種任務(wù)。
事實(shí)上早有機(jī)構(gòu)指出,ChatGPT或?qū)砣诵螜C(jī)器人下一個(gè)拐點(diǎn),人形機(jī)器人作為一個(gè)多任務(wù)、通用型機(jī)器人平臺(tái),類似ChatGPT的人工智能有望進(jìn)一步打開它在工業(yè)生產(chǎn)、社會(huì)服務(wù)等更多領(lǐng)域的應(yīng)用場(chǎng)景。