訓(xùn)練機(jī)器人與人類進(jìn)行談判,打造個(gè)性化數(shù)字助理

時(shí)間:2017-06-16

來(lái)源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語(yǔ):6月15日,據(jù)科技博客Techcrunch報(bào)道,F(xiàn)acebook人工智能研究所(FacebookArtificialIntelligenceResearch,簡(jiǎn)稱FAIR)的研究人員已經(jīng)創(chuàng)建了人工智能模型,它們被賦予了與人類談判的能力,可以與人討價(jià)還價(jià)。

隨著亞馬遜Echo和谷歌Home的走紅,智能語(yǔ)音機(jī)器人越來(lái)越受到歡迎。但眼下,F(xiàn)acebook已經(jīng)不滿足于研發(fā)一款可以聊天的智能語(yǔ)音助手,而是要訓(xùn)練機(jī)器人與人類進(jìn)行談判。

6月15日,據(jù)科技博客Techcrunch報(bào)道,F(xiàn)acebook人工智能研究所(FacebookArtificialIntelligenceResearch,簡(jiǎn)稱FAIR)的研究人員已經(jīng)創(chuàng)建了人工智能模型,它們被賦予了與人類談判的能力,可以與人討價(jià)還價(jià)。

目前FAIR的研究人員已經(jīng)開(kāi)放了該模型的源代碼,并發(fā)表論文,介紹了該機(jī)器人所具有的談判能力。在論文中,研究人員表示,通過(guò)大量的訓(xùn)練,對(duì)于具有不同目標(biāo)的對(duì)話機(jī)器人,已經(jīng)可以與其他機(jī)器人或人類進(jìn)行從開(kāi)始到結(jié)束的談判,并最終達(dá)成一致結(jié)果和目標(biāo)。

Facebook研究人員指出,現(xiàn)實(shí)生活中人們經(jīng)常需要面對(duì)的“討價(jià)還價(jià)”就是最常見(jiàn)的一種談判行為。他們從這一行為模式入手,開(kāi)始教機(jī)器人如何分配物品,譬如五本書(shū)、三頂帽子、兩個(gè)球等等。每一場(chǎng)談判被限定在10次對(duì)話之內(nèi),如果10次對(duì)話結(jié)束后,沒(méi)有達(dá)成共識(shí),那么雙方都不能得到物品。

為了達(dá)到訓(xùn)練效果和進(jìn)行大規(guī)模的定量評(píng)估,F(xiàn)AIR團(tuán)隊(duì)收集了一系列人與人之間討價(jià)還價(jià)的記錄供機(jī)器學(xué)習(xí)。這些案例詳細(xì)記錄了人們給一組物品定價(jià)并進(jìn)行分配的過(guò)程。然后研究人員建立了一個(gè)遞歸的神經(jīng)網(wǎng)絡(luò),通過(guò)教它模仿人們的行為來(lái)學(xué)會(huì)談判。

工程師們還利用機(jī)器人與機(jī)器人的對(duì)話來(lái)改善學(xué)習(xí)結(jié)果,方法是讓一個(gè)機(jī)器人生成數(shù)據(jù)去“愚弄”另一個(gè)機(jī)器人。這個(gè)場(chǎng)景需要機(jī)器人與另一方建立對(duì)話模型,雙方間就交易展開(kāi)談判,從而預(yù)判出對(duì)方對(duì)特定報(bào)價(jià)的反應(yīng),而采取具體應(yīng)對(duì)措施,而非簡(jiǎn)單的模仿。在訓(xùn)練過(guò)程中,研究人員很快發(fā)現(xiàn),機(jī)器人學(xué)會(huì)了一些談判策略,比如故意強(qiáng)調(diào)一些低價(jià)的物品,假裝讓對(duì)方認(rèn)為該物品擁有更高的價(jià)值。

FAIR團(tuán)隊(duì)的工作人員向Techcrunch表示,他們訓(xùn)練機(jī)器人的目的是教會(huì)他們防止做出不好的決策,而不是每次都作出最優(yōu)的選擇?!熬拖衲阌萌諝v提醒自己開(kāi)會(huì),是為了保證會(huì)議能如期參加,而不是為了選在最好的時(shí)間開(kāi)會(huì)?!惫ぷ魅藛T稱。

在2016年的開(kāi)發(fā)者大會(huì)上,F(xiàn)acebook的創(chuàng)始人兼首席執(zhí)行官馬克·扎克伯格(MarkZuckerberg)就像外界介紹過(guò)類似的應(yīng)用場(chǎng)景,在這個(gè)場(chǎng)景中,人們通過(guò)機(jī)器人與企業(yè)互動(dòng),例如,訂購(gòu)產(chǎn)品或獲得客戶服務(wù)幫助。

不過(guò)目前,F(xiàn)AIR還沒(méi)有深入研究什么這種機(jī)器人的討價(jià)還價(jià)能力可能適用于哪些應(yīng)用軟件,也沒(méi)有表示這種能力是否會(huì)在Facebook的產(chǎn)品中出現(xiàn)。FAIR在論文中指出,辯論、對(duì)話和談判的能力對(duì)進(jìn)一步開(kāi)發(fā)并提升聊天機(jī)器人是非常重要的,訓(xùn)練機(jī)器人學(xué)會(huì)談判過(guò)程中的所有重要步驟都是打造個(gè)性化數(shù)字助理的關(guān)鍵。

更多資訊請(qǐng)關(guān)注工業(yè)機(jī)器人頻道

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(m.u63ivq3.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽(yáng)科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺(jué)
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0