5月23日下午,上午10點(diǎn)半開始的人機(jī)大戰(zhàn)2.0,在持續(xù)四個(gè)多小時(shí)后終于落幕,柯潔0:1敗于AlphaGO。
這一版本的AlphaGo進(jìn)行了大量的“自我對(duì)弈棋局”,這一過(guò)程循環(huán)往復(fù),積累了大量的數(shù)據(jù)。
柯潔苦笑著搖了搖頭,不時(shí)和坐其對(duì)面、代AlphaGO執(zhí)子的黃士杰博士談兩句。隨后,他將眼前的黑棋子全部收攏,裝進(jìn)棋盒后,起身離開了座位。
這原本是一場(chǎng)五至六個(gè)小時(shí)的圍棋對(duì)決,但由于AlphaGO異于人類的落子速度,時(shí)間得以大大縮短。
柯潔賽后坦承,輸給AlphaGO在意料之中,但其意料之外的是,新版本的AlphaGO和去年戰(zhàn)勝韓國(guó)頂級(jí)棋手李世石的版本,幾乎是兩個(gè)完全不同的“人”。
AI再下一城
柯潔的“悲情”在比賽前一天晚上已有顯露,22日晚上,柯潔通過(guò)個(gè)人微博發(fā)文稱,“AI進(jìn)步之快遠(yuǎn)超我們的想象”,其相信“未來(lái)是屬于人工智能”的。
今年年初,柯潔已同AlphaGO扮演的馬甲“Master”有過(guò)交手,柯潔均以落敗而告終?!暗谝槐P不知對(duì)手是誰(shuí),心態(tài)還好,后面因?yàn)橹缹?duì)手不是人,心態(tài)就壞了。當(dāng)時(shí)也吃不下飯,后來(lái)就住院了。”柯潔在采訪中稱,人機(jī)對(duì)決給了他更大壓力。
多位業(yè)內(nèi)人士認(rèn)為,柯潔在當(dāng)天的比賽中發(fā)揮出了正常水平。圍棋專業(yè)人士潘達(dá)告訴記者,當(dāng)天“柯潔發(fā)揮還可以,布局有備而來(lái),前半盤基本達(dá)成先撈實(shí)地的預(yù)定目標(biāo)”。但是AlphaGo整盤棋表現(xiàn)得相當(dāng)穩(wěn)定。
最終,柯潔以約四分之一子的劣勢(shì)輸給了AlphaGo。盡管AlphaGo是以微弱優(yōu)勢(shì)取勝,但柯潔在陷入逆境之后,即知道對(duì)于不會(huì)犯錯(cuò)的AlphaGo而言,拿下勝利只是時(shí)間的問(wèn)題。
賽后,柯潔在接受媒體采訪時(shí)也表示,此前其總結(jié)AlphaGo的弱點(diǎn)在于,“非常貪戀實(shí)地”,因此其制定的策略是“貫穿先撈后起”,但開局后在有些地方反而被阿爾法狗先撈實(shí)地,導(dǎo)致一下陷入了被動(dòng)??聺嵎Q,通過(guò)第一局比賽,未能找出AlphaGo的破綻。
潘達(dá)告訴記者,目前版本的AlphaGo穩(wěn)定性明顯好于對(duì)戰(zhàn)李世石的版本,但“具體實(shí)力進(jìn)步了多少,一盤棋不能說(shuō)明問(wèn)題”。
柯潔坦承,輸?shù)舯荣愒谄湟饬现?。賽前,包括聶衛(wèi)平在內(nèi)的重量級(jí)棋手均預(yù)測(cè),柯潔取勝AlphaGo的概率在10%左右,此外大家認(rèn)為,若柯潔能夠贏下一場(chǎng)比賽,則可作為載入圍棋歷史的事件。
兩天之后,柯潔將再度迎戰(zhàn)AlphaGo??聺崉t早已在賽前宣布,同AlphaGO的三場(chǎng)對(duì)決,也將是其最后三場(chǎng)人機(jī)大戰(zhàn)。
人機(jī)對(duì)決無(wú)懸念?
盡管輸棋在意料之中,但柯潔仍驚異于一年以后AlphaGo發(fā)生的變化。
恰如DeepMind創(chuàng)始人兼CEO哈薩比斯在當(dāng)天所說(shuō),AlphaGo不是一個(gè)預(yù)編程的圍棋程序,而是采用人類相似的方式進(jìn)行學(xué)習(xí)。據(jù)悉,AlphaGo所采用的機(jī)器學(xué)習(xí),結(jié)合了監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。首先,AlphaGo搭建了一個(gè)策略網(wǎng)絡(luò)(policynetwork),對(duì)所有可落子區(qū)域進(jìn)行概率分布,并且訓(xùn)練出一個(gè)價(jià)值網(wǎng)絡(luò)(valuenetwork)對(duì)自我對(duì)弈進(jìn)行預(yù)測(cè)。
早期AlphaGo仍通過(guò)學(xué)習(xí)六段以上的圍棋選手下法來(lái)進(jìn)行學(xué)習(xí),但如今版本的AlphaGo可怕之處在于,強(qiáng)大的自我迭代和更新能力。
上述基礎(chǔ)上,這一版本的AlphaGo進(jìn)行了大量的“自我對(duì)弈棋局”,這一過(guò)程循環(huán)往復(fù),積累了大量的數(shù)據(jù)。當(dāng)天比賽的解說(shuō)嘉賓華以剛,在白棋的一個(gè)落子后,也忍不出感嘆“AlphaGo對(duì)于落子效率的高度重視”。
如果說(shuō)在AlphaGo、李世石的對(duì)決中,外界仍以支持人類和支持機(jī)器形成兩大派別,那么在AlphaGo和柯潔的對(duì)決中,這幾乎已經(jīng)是一個(gè)失去了懸念的答案?!昂軜s幸和AlphaGo對(duì)決,接下來(lái)我仍將全力以赴。”柯潔在賽后說(shuō)。
他在賽后再度表示,當(dāng)天比賽讓他發(fā)現(xiàn)了圍棋下法的更多可能性。數(shù)千年以來(lái),歷史留下了關(guān)于圍棋的無(wú)數(shù)玩法和總結(jié),但AlphaGo的出現(xiàn)使得不少固有的觀念被打破。不少棋手在當(dāng)天觀棋時(shí)感嘆,AlphaGo的下法突破了個(gè)人對(duì)于圍棋的理解。
此次圍棋峰會(huì)上,還將開展多位棋手對(duì)決AlphaGo的“群戰(zhàn)”,以及“棋手+AlphaGo”的混搭對(duì)決。施密特將這場(chǎng)峰會(huì)定義為“人機(jī)合作時(shí)代的開啟”?!叭ツ晡以陧n國(guó)就說(shuō),不管勝負(fù)如何,人性終將獲勝。電腦有自己擅長(zhǎng)的事情,人類有自己的專長(zhǎng)。”谷歌母公司Alphabet執(zhí)行董事長(zhǎng)施密特在當(dāng)天賽前的致辭上稱。
早在AlphaGo對(duì)決韓國(guó)棋手李世石時(shí),即有不少業(yè)內(nèi)人士向記者評(píng)述:谷歌通過(guò)AlphaGo完成了一起全球性的AI普及,并且樹立了谷歌之于AI在普羅大眾心目中的地位。而通過(guò)AlphaGo和柯潔的對(duì)決,谷歌再度深化了這一過(guò)程。
更多資訊請(qǐng)關(guān)注工業(yè)機(jī)器人頻道