牛津大學計算機科學系主任、DeepMind-OxfordPartnership監(jiān)事,著名智能體理論研究學者MichaelWooldridge博士等在討論智能體時,則提出“弱定義”和“強定義”二種定義方法:弱定義智能體是指具有自主性、社會性、反應性和能動性等基本特性的智能體;強定義智能體是指不僅具有弱定義中的基本特性,而且具有移動性、通信能力、理性或其它特性的智能體;作為現(xiàn)今著名的智能體理論研究學者,其著作有《多Agent系統(tǒng)引論》,被稱為當今關(guān)于多Agent系統(tǒng)這個重要論題的第一本教材。
在其二十年的Agent研究生涯里,他幾乎獲得了人工智能領(lǐng)域的所有榮譽:ACM(國際計算機學會)、AAAI(美國人工智能學會)、EURAI(歐洲人工智能學會)成員,AcademiaEuropaea(歐洲科學院)成員、ERC(歐洲研究學會)委員,堪稱人工智能領(lǐng)域的達人。
作為雷鋒網(wǎng)8月份的CCF—GAIR大會的學術(shù)大牛嘉賓之一,近日我們對其進行了專門采訪。
Michael Wooldridge
問:首先為我們闡述下當下多智能體系統(tǒng)的重要性?
MichaelWooldridge:對我來說,智能體最重要的一點是其“社會性”。我們知道人和動物區(qū)別開來的一個重要特征就是我們作為智能的,社會性的動物,我們有語言,可以相互合作,協(xié)調(diào),談判來實現(xiàn)一些遠超月個人能力范圍內(nèi)可以實現(xiàn)的事情。
所以AI如果忽視了“社會性”這個屬性,它在接近或者超越我們的路上將會缺失許多東西。
問:AlphaGo屬于單智能體還是多智能體?
MichaelWooldridge:當然是個單智能體。雖然我不知道其它智能體研究者是否會稱它為“智能體”,但我很樂意把它定義為單智能體,因為之前它沒有駐留在其它環(huán)境中(事實上也不曾以任何方式駐留在這個世界中)。
而通常我們都認為智能體是存在于某種環(huán)境中的(注:智能體是指駐留在某一環(huán)境下,能持續(xù)自主地發(fā)揮作用,具備駐留性、反應性、社會性、主動性等特征的計算實體。)
另外,關(guān)于這個智能體,現(xiàn)在深度學習研究者們遇到了一個有意思的挑戰(zhàn)——如何讓學習系統(tǒng)可以分享他們的經(jīng)驗——分享他們學習到的經(jīng)驗,就像人類在學習完英語后,又把他們的經(jīng)驗用去學韓語,西班牙語等其它語言。
問:除了AlphaGo,還有其它的虛擬智能體代表嗎?
MichaelWooldridge:貿(mào)易機器人就是個很典型的例子,這個程序可以買東西和賣東西,現(xiàn)在國際貿(mào)易中正大量用到這個程序,以后AI的應用會更廣,我希望來年這個數(shù)據(jù)有更大的增長。
問:智能體系統(tǒng)在接下來的2-3年,如果要列個Top5領(lǐng)域的話,會在哪幾個領(lǐng)域爆發(fā)?
MichaelWooldridge:我覺得是這個幾個領(lǐng)域
健康—智能手機和其它的設備里的各種傳感器,都在監(jiān)視我們的健康狀態(tài)。
娛樂—看看口袋妖怪里的AI技術(shù)就知道了。
醫(yī)療—人工智能正在為我們尋找新的藥物(和藥物形式)。
自動駕駛—美國有359萬卡車司機,我相信20年后,這些都會被自動駕駛代替,這對社會是個巨大的改變。
物流/規(guī)劃—AI在這塊領(lǐng)域會找到更有效的處理方式。
問:智能體和人工智能的區(qū)別是什么?
MichaelWooldridge:本質(zhì)上區(qū)別還是我上面提的“社會屬性”,雖然之前的(人工智能)AI一開始沒有對這點花太多注意力,但智能體(系統(tǒng))一直在聚焦這件事。
問:Mobileye的CTOAmnonShashua在演講中說道:他認為深度學習的研究繞了遠路。因為真正的AI應該能幫人類解決人類解決不了的問題,而目前的AI的表現(xiàn)卻僅限于人類已經(jīng)能非常明確的理解和解釋的領(lǐng)域。你如何看這個說法?
MichaelWooldridge:確實,在一些我們有特定任務要完成的領(lǐng)域AI非常成功,有時我們甚至能評估這項任務的完成情況;但遷移到有些我們都不太好定義的地方應用,目前沒有太多成功的例子可以拿來佐證。
問:怎么看待AlphaGo在網(wǎng)站上排名超過柯潔的事情?
MichaelWooldridge:關(guān)于這點,我敢說,誰要是覺得除了AlphaGo會贏后還會有其它的結(jié)果,那是很荒謬的事情。剩下的,是參賽者在實際對決的時候會發(fā)現(xiàn)比他想象地驚喜多了,我相信柯潔也會經(jīng)歷這個過程的。當然,我更感興趣的是AlphaGo能不能教人類下得更好,但現(xiàn)在我們不知道它是如何做到的,這是個問題。
問:說一下加強學習和深度學習的關(guān)系?
MichaelWooldridge:它們不是完全不同的兩種東西,因為強化學習的基本思想是,傾向于加強過去已經(jīng)成功的執(zhí)行操作的概率。
而深度學習是在神經(jīng)網(wǎng)絡的背景下,關(guān)心一個類似的想法。它們都有著類似的想法,以及需要重復訓練這個過程。另外在我眼里,這兩個技術(shù)是互補關(guān)系,而不是競爭關(guān)系。
問:實現(xiàn)AGI的最有效方式是?
MichaelWooldridge:至少目前,我們不知道如何通往AGI,也沒人敢說他知道這個,機器學習近幾年雖然有重大進展,但是我們不知道意識或者自我意識是如何組織的,如何進步的,以及它和大腦的微觀結(jié)構(gòu)有什么關(guān)系,所以AGI還有很長一段時間要走。
問:在多智能體系統(tǒng)做決定的時候,通常子系統(tǒng)要把處理過的數(shù)據(jù)傳輸給母系統(tǒng)再讓其做決定,這中間按理是有個延遲過程的,怎么處理這個延遲問題?
MichaelWooldridge:在我的經(jīng)驗中,多智能體系統(tǒng)里,有不同的方式組織活動,避免系統(tǒng)延遲一直是個問題。一種解決方法是任務共享——這時任務被分解成更小的任務,分享給更小的代理。甚至有時需要重新組裝這些任務。
另一種方法就是“結(jié)果分享”——代理所做的就是分享信息,如果我認為這個信息對你有用的,我跟你一起分享。
最后,這些方法都有優(yōu)點和缺點,在多智能體系統(tǒng)研究的關(guān)鍵中,懂得在一個特定問題中哪個才是最適合的解決方法很關(guān)鍵。
小結(jié):
智能體是人工智能領(lǐng)域中一個很重要的概念。通常我們認為任何獨立的能夠思想并可以同環(huán)境交互的實體都可以抽象為智能體。邁克爾·伍爾德里奇過去花了20多年時間專注人工智能的這個前沿領(lǐng)域———智能體(Agent)的研究。
正好這個Agent(S)系統(tǒng)在博弈,調(diào)度優(yōu)化,金融,游戲,多機器人控制方面都非常適合,所以AlphaGo這種博弈類高手機器系統(tǒng)誕生在牛津大學也說的上“順利成章“,而未來,在人工智能這個“超級網(wǎng)絡”中,我們有理由在各個場景中都會充斥著multi-agent的概念。
更多資訊請關(guān)注工業(yè)機器人頻道