AI風暴再次來襲。6日開始,卡內基梅隆大學知名撲克機器人Libratus將化身"冷撲大師",與中國"龍之隊"在海南展開為期5天、長達45小時的撲克人機大戰(zhàn)。主辦方在5日的賽前發(fā)布會上宣布,獲勝一方將獲得200萬元表演賽獎勵。
"冷撲大師"是卡內基梅隆大學開發(fā)的無限德州撲克人工智能系統(tǒng)。今年1月,它擊敗了人類頂尖玩家。在這次比賽中,每當這些玩家發(fā)出一個動作,它就會被傳送到卡內基梅隆大學的計算機服務器上。
中國"龍之隊"華人頂尖牌手由2016年世界撲克大賽金手鏈冠軍得主杜悅領軍。杜悅估計,雖然"冷撲大師"是目前撲克界最強的人工智能,但人類頂尖牌手仍有10%的勝率。
創(chuàng)新工場CEO暨人工智能工程院院長李開復之所以發(fā)起這場撲克人機對戰(zhàn),和他1988年在母??▋然仿〈髮W開發(fā)"奧賽羅"的經歷息息相關,后者成為第一個擊敗黑白棋世界冠軍的人機對弈系統(tǒng)。
"德州撲克是創(chuàng)投圈人士愛玩的一項活動,AI更是創(chuàng)投圈近年來關注的重點,這次活動對AI的宣傳和推動將起到重要作用。"賽事協(xié)辦方春光里運營總監(jiān)董冬則告訴科技日報記者。"我當然希望人類能贏,但'冷撲大師'畢竟曾打敗過美國頂尖的德?lián)溥x手。"董冬說。
人工智能專家一直將這些游戲作為開發(fā)和測試的工具,在此之前,計算機已經在國際象棋、西洋雙陸棋中擊敗了人類,去年的AlphaGo更是名聲大噪。"撲克則有些不同,因為你不知道你的對手拿的是什么牌。"作為德州撲克愛好者,董冬分析。
談到與圍棋比賽、AlphaGo的不同,李開復表示,德州撲克更接近人性,因為信息是有隱藏的,牌手可以誠實或欺騙地表達。這些種種的推敲,更像是人與人之間的商業(yè)、外交博弈,"冷撲大師"的技術都與這些因素相關。
通過對手的動作表情判斷對手牌的強弱,是德州撲克相當重要的一種游戲技巧,而"冷撲大師"作為一個冷冰冰的人工智能系統(tǒng),如何應對人類棋手復雜的心理戰(zhàn)呢?
對此,李開復表示,對于"冷撲大師"來說,心理戰(zhàn)其實是基于一個優(yōu)化結果最大化的一個計算,它計算該怎樣去做才能得到最多的積分牌。他說,撲克機器人的研發(fā)基于博弈論,并且結合了大量的數學和概率理論,撲克程序在賽前不曾研擬歷史牌譜,直接在比賽同時動態(tài)優(yōu)化勝率最高的數學模型,利用戰(zhàn)略推理揭露玩家底牌的隱藏信息,從而建構出智能化的AI談判策略套路。在技術研發(fā)的背后,其實電腦并不對人類玩家的心理戰(zhàn)術進行任何模擬或分析,反倒以博弈論加上大量數學打敗了頂尖牌手。
卡內基梅隆大學計算機學院院長安得烈·穆爾教授則認為,"冷撲大師"表面呈現的是撲克,背后實際是一個大型的談判算法。撲克AI并沒有用到神經網絡和機器學習這兩種技術,而是用了比較古典的線性規(guī)劃。
李開復認為,現今這套人工智能撲克程序背后的模型,將適用于需要用到戰(zhàn)略推理和多方談判的場景。從企業(yè)談判、商務談判、外交談判、甚至到生活方面的房屋買賣談判,10年內都將會部分或全面被人工智能所取代。
1月20日小年夜,江蘇衛(wèi)視《最強大腦》第四季人機大戰(zhàn)迎來決勝局,由從未失算的"水哥"王昱珩,在圖像識別方面與搭載百度大腦的小度機器人進行實力交鋒。"小度"在前兩期比賽中領先性優(yōu)勢,讓本場較量成為人類腦力和人工智能對決的決勝局。
1月5日下午,第四季《最強大腦》全國首場觀戰(zhàn)會在東城區(qū)當代MOMA舉辦,活動現場,百度深度學習實驗室主任林元慶及人工智能團隊的工程師悉數參加。觀戰(zhàn)結束后,百度深度學習實驗室主任林元慶現身說法,與在座的媒體朋友一道探討人機對戰(zhàn)。
由中央電視臺綜合頻道和中國科學院科學傳播局聯(lián)合主辦的大型科學挑戰(zhàn)類節(jié)目《人機大戰(zhàn)》全國項目征集會今天在武漢上演。《人機大戰(zhàn)》是國內首檔聚焦人工智能的科學挑戰(zhàn)節(jié)目。其中最重要的工作是收集項目資源,尋求人工智能項目與人類的可比性。
更多資訊請關注工業(yè)機器人頻道