10月19日,《自然》雜志刊登了谷歌DeepMind團隊新成果,一個名為AlphaZero(阿爾法元)的機器人完全靠增強型自我學(xué)習(xí),只訓(xùn)練了3天就戰(zhàn)勝了AlphaGo(阿爾法狗),比分是100:0。
阿爾法元無師自通、零基礎(chǔ)“自學(xué)成才”,許多人聞訊瞠目結(jié)舌。有人說:“過去我們相信‘知識就是力量’,現(xiàn)在看來,數(shù)據(jù)和機器學(xué)習(xí)比知識和人類經(jīng)驗更有力量?!鄙踔帘^地認為:人工智能以后可能就不需要“人類師父”了。
果真如此嗎?答案顯然是否定的。阿爾法元雖然確實通過機器學(xué)習(xí)超越了人類經(jīng)驗,發(fā)現(xiàn)了人類專家還未探索過的博弈路徑,但并未否定人工智能機器人仍需要人類經(jīng)驗和知識。
阿爾法元的突破之處在于,第一次讓機器在不“學(xué)習(xí)”任何棋譜、只設(shè)定規(guī)則的情況下,從“一張白紙”的狀態(tài)開始,迅速成為“圍棋大師”。與阿爾法狗不同,阿爾法元完全摒棄了阿爾法狗學(xué)習(xí)人類經(jīng)驗、變身許多圍棋高手的集大成者的那一套做法,而是無監(jiān)督的自我博弈、學(xué)習(xí),在這個過程中,自己是自己的老師。
這也只表明,在某些特定領(lǐng)域——例如有明確規(guī)則的圍棋——人工智能或許不再需要人類知識。但這并不表明,人工智能完全不需要人類知識的指引。在日前曙光公司舉辦的智能峰會上,中國工程院院士李國杰就此發(fā)表了看法,他認為,一方面,我們絕不能低估機器學(xué)習(xí)的強大威力——對于結(jié)構(gòu)性的問題,比如蛋白質(zhì)折疊、尋找新材料等,無需人類知識的機器學(xué)習(xí)可能會取得令人驚嘆的新突破;另一方面,對于規(guī)則不明確的探索未知的研究工作,領(lǐng)域知識仍然十分重要,不能無限夸大機器的能力。
人工智能發(fā)展至今,已進入2.0時代的軌道。但在人工智能基礎(chǔ)理論領(lǐng)域,仍存在許多未知等待人類去探索。美國“曼哈頓工程”的負責(zé)人奧本海默在二戰(zhàn)勝利以后曾說過這樣一段話:“(在二戰(zhàn)期間)我們得到了一棵碩果累累的大樹,并拼命地搖晃,結(jié)果得到了雷達和原子彈……其全部精神實質(zhì)在于對已知的瘋狂而粗暴掠奪,而毫無對未知的認真而謙恭的探索。”
這段話之于當(dāng)下人工智能的發(fā)展仍有啟發(fā)。經(jīng)過60年的培育,人工智能已經(jīng)長成碩果累累的大樹。我們是拼命地搖晃這棵大樹,在地上撿一些零星的果實,還是懷抱著對未知的認真和謙恭,自己新種幾棵樹苗?答案不言自明。
事實上,在人工智能領(lǐng)域,非常需要更多的“領(lǐng)域知識”。比如,深度學(xué)習(xí)為何如此有效?現(xiàn)在還沒人能講得清楚。以色列學(xué)者提出,深度學(xué)習(xí)和量子力學(xué)中的“物理重整化”幾乎是完全相同的過程。像這類非?;A(chǔ)的根本性的問題,還需要“人類師父”繼續(xù)探路。
更多資訊請關(guān)注工業(yè)機器人頻道