美國國防高級研究計劃局(DARPA)網(wǎng)站3月16日報道,DARPA計劃啟動“終身學(xué)習(xí)機器”(LifelongLearningMachines,L2M)項目,旨在發(fā)展下一代機器學(xué)習(xí)技術(shù),并以其為基礎(chǔ)推動未來人工智能(AI)發(fā)展。
項目背景
當(dāng)前,人工智能在無人駕駛、機器人等民用和商業(yè)領(lǐng)域的應(yīng)用日益廣泛,在國防領(lǐng)域亦是如此,例如人工智能在網(wǎng)絡(luò)安全和動態(tài)后勤規(guī)劃等方面的應(yīng)用。人工智能以機器學(xué)習(xí)技術(shù)為核心,并依賴于精巧的編程和龐大的數(shù)據(jù)支撐。但真實世界充滿了偶然性,編程者無法預(yù)知所有可能出現(xiàn)的元素或面對的情景,而當(dāng)這些機器學(xué)習(xí)系統(tǒng)遇到程序和數(shù)據(jù)庫中并未包含的特殊情形時就會不知所措。如果想擴展機器學(xué)習(xí)系統(tǒng)在該新環(huán)境下的能力,必須停止其服務(wù)并利用額外的數(shù)據(jù)對其進行再訓(xùn)練,但這種做法依賴于人類的介入且效率較低。與此不同,生物系統(tǒng)能夠?qū)崿F(xiàn)自主訓(xùn)練,從過往經(jīng)歷中不斷汲取經(jīng)驗,即使面對全新的環(huán)境也能根據(jù)積累的知識做出適應(yīng)性調(diào)整。正因為如此,即使現(xiàn)階段最先進的人工智能系統(tǒng)與具備自適應(yīng)能力的生物智能相比依舊相差甚遠,這也是DARPA開展L2M項目的初衷。
項目概況
L2M項目旨在發(fā)展類似于生物智能的具備自主持續(xù)學(xué)習(xí)能力的機器學(xué)習(xí)技術(shù)。L2M項目為期四年,重點關(guān)注兩個技術(shù)領(lǐng)域。第一個技術(shù)領(lǐng)域:開發(fā)可以持續(xù)從過往經(jīng)驗中學(xué)習(xí),并將所學(xué)知識應(yīng)用于新情況的機器學(xué)習(xí)機制,不斷擴展自身能力并提高可靠性。以無人駕駛應(yīng)用為例,這種新技術(shù)可使無人駕駛汽車能夠從行駛過程中遇到的交通事故、視覺盲點等情形中學(xué)習(xí)相關(guān)經(jīng)驗,從而在遇到從未面對的新路況時能夠應(yīng)用學(xué)習(xí)到的經(jīng)驗有效應(yīng)對,使無人駕駛車輛更加安全可靠。與此同時,DARPA還計劃發(fā)展可監(jiān)控機器學(xué)習(xí)系統(tǒng)行為的技術(shù),對其可自適應(yīng)調(diào)整的范圍進行限制,并在必要時對其實施干預(yù)。這一領(lǐng)域的研究涵蓋了網(wǎng)絡(luò)理論、算法、軟件以及計算機體系結(jié)構(gòu)。另一個領(lǐng)域是關(guān)于生物智能的學(xué)習(xí)機制,重點關(guān)注生物如何學(xué)習(xí)并獲得自適應(yīng)能力,同時研究這種生物學(xué)習(xí)的原理及技術(shù)是否能夠應(yīng)用于機器學(xué)習(xí)系統(tǒng)以及如何應(yīng)用的問題。
兩點認(rèn)識
DARPA將以L2M項目為基礎(chǔ)推動第三次AI技術(shù)浪潮。DARPA認(rèn)為AI技術(shù)的發(fā)展已歷經(jīng)第一次和第二次浪潮,即將迎來第三次浪潮。第一次AI技術(shù)浪潮以“手工知識”為特征,典型范例如Windows操作系統(tǒng)、智能手機應(yīng)用程序、交通信號燈使用的程序等。第二次AI技術(shù)浪潮以“統(tǒng)計學(xué)習(xí)”為特征,典型范例如人工神經(jīng)網(wǎng)絡(luò)系統(tǒng),并在無人駕駛汽車等領(lǐng)域取得進展。雖然上述AI技術(shù)對明確的問題有較強的推理和判斷能力,但不具備學(xué)習(xí)能力,處理不確定問題的能力也較弱。第三次AI技術(shù)浪潮將以“適應(yīng)環(huán)境”為特征,AI能夠理解環(huán)境并發(fā)現(xiàn)邏輯規(guī)則,從而進行自我訓(xùn)練并建立自身的決策流程。由此可知,AI的持續(xù)自主學(xué)習(xí)能力將是第三次AI技術(shù)浪潮的核心動力,L2M項目的目標(biāo)恰與第三次AI浪潮“適應(yīng)環(huán)境”的特征相契合。通過研發(fā)新一代機器學(xué)習(xí)技術(shù),使其具備能夠從環(huán)境中不斷學(xué)習(xí)并總結(jié)出一般性知識的能力,L2M項目將為第三次AI技術(shù)浪潮打下堅實的技術(shù)基礎(chǔ)。
DARPA在推動AI技術(shù)發(fā)展的同時,強調(diào)對于AI技術(shù)的規(guī)范和限制。人類對于人工智能技術(shù)安全性的思考由來已久,早在1950年出版的美國著名科幻小說家艾薩克·阿西莫夫撰寫的《我,機器人》小說中就提出了著名的“機器人三大定律”:第一定律,機器人不得傷害人類個體,或者目睹人類個體將遭受危險而袖手旁觀;第二定律,機器人必須服從人給予它的命令,當(dāng)該命令與第一定律沖突時例外;第三定律,機器人在不違反第一、第二定律的情況下要盡可能保護自己的生存。此后,“三定律”在科幻題材的小說、電影中大放光彩,并不斷激發(fā)出對于人工智能安全性的新思考。按照DARPA關(guān)于AI技術(shù)的發(fā)展思考,在第三次AI浪潮中,AI將具備自主學(xué)習(xí)能力,其終極形式必將會是具備自主意識的AI系統(tǒng),到那時人類與人工智能之間的關(guān)系必須由普適、可靠的準(zhǔn)則所定義,特別是在國防領(lǐng)域,否則極有可能出現(xiàn)科幻電影中描述的人機大戰(zhàn)。DARPA在L2M項目中明確強調(diào),在提升AI技術(shù)水平的同時,確保其在預(yù)先制定的相關(guān)準(zhǔn)則下進行工作,防止其出現(xiàn)越界行為。無論是否受到上述觀點的影響,DARPA此時強調(diào)對于AI技術(shù)安全性的管控可能都將是AI技術(shù)發(fā)展過程中的必然選擇和重要課題,也許在不久的將來科幻小說中的“機器人三定律”就可能成為未來人工智能的安全準(zhǔn)則。
更多資訊請關(guān)注工業(yè)機器人頻道