機器學習之父、著名的計算機科學和統(tǒng)計學家MichaelI.Jordan近日在《哈佛數(shù)據(jù)科學評論》上發(fā)表文章,評論當前的人工智能炒作,認為現(xiàn)在被稱為AI的許多領域,實際上是機器學習,而真正的AI革命尚未到來。
人工智能(AI)已經(jīng)成為當今時代的口號
技術專家、學者、記者、風險投資家都在說這個詞。跟其他許多從技術或?qū)W術領域流入普通大眾的詞語一樣,“AI”這個詞的使用也存在嚴重的誤解。
然而,跟其他領域中公眾不理解科學家在做的事情不一樣,對于“AI”,科學家們經(jīng)常和公眾一樣困惑。
某種程度上,我們這個時代正在看到一種與我們?nèi)祟惖闹悄芟嗥车墓杌悄艿某霈F(xiàn),這既讓所有人感到興奮,讓我們著迷,同時也讓我們感到恐懼。不幸的是,它分散了我們的注意力。
我們急需發(fā)展構建推理和決策系統(tǒng)的原則
我們可以從另一個角度來講述這個時代。有這樣一個故事,其中涉及人類、計算機、數(shù)據(jù)和生死抉擇,但重點不僅僅是硅基智能這類的幻想。
14年前,我的妻子懷孕時,我們做了超聲波檢查。醫(yī)生是一位遺傳學家,她指出胎兒心臟周圍有一些白點?!斑@些都是唐氏綜合癥的標志,”她說,“現(xiàn)在你的風險已經(jīng)上升到20分之一了。”她告訴我們,可以通過羊膜穿刺術了解胎兒是否真的有唐氏綜合癥基因畸變,但羊膜穿刺術存在風險——在穿刺術過程中胎兒死亡的幾率大約是300分之一。
作為一名統(tǒng)計學家,我決定找出這些數(shù)字的來源。在我的研究中,我發(fā)現(xiàn)十年前英國有人做過一項統(tǒng)計分析,這些反映鈣沉積的白點確實被認為是唐氏綜合癥的預測因子。我還注意到,我們做檢查時使用的成像機每平方英寸的像素比英國研究中使用的成像機多幾百個像素。我回去告訴遺傳學家,我相信那些白點很可能是假陽性,也就是字面上的白噪音。
她說:“啊,這就解釋了為什么我們幾年前開始發(fā)現(xiàn)唐氏綜合癥的診斷有上升趨勢。那恰好是新機器運來的時候?!?/p>
我們沒有做羊膜穿刺術,幾個月后妻子生下一個健康的女孩。但這件事一直讓我放不下,尤其是我知道由于一次粗略的計算,那天可能有成千上萬的人得到同樣診斷,然后許多人選擇做羊膜穿刺術,造成許多嬰兒不必要的死亡。
這件事揭示的問題不是我個人的醫(yī)療問題;它關乎一個醫(yī)療系統(tǒng),在不同的地點和時間測量變量和結果,進行統(tǒng)計分析,并在其他情況下使用結果。
這個問題不僅與數(shù)據(jù)分析本身有關,而且與數(shù)據(jù)庫研究人員所稱的“溯源”(provenance)有關——數(shù)據(jù)來自哪里,從數(shù)據(jù)中得出了什么推論,這些推論與當前的情況有多大關系?雖然專業(yè)人士可能在遇到個案時能逐步解決這些問題,但問題是設計一個行星級規(guī)模的醫(yī)療系統(tǒng),該系統(tǒng)要能在不需要如此詳細的人類監(jiān)督的情況下做到這一點。
我也是一名計算機科學家,我突然想到,在我所受的教育中,根本找不到構建這種行星級規(guī)模的推理和決策系統(tǒng)所需要的原則,這些原則融合了計算機科學和統(tǒng)計學,并考慮到人類的效用。在我看來,發(fā)展這些原則至少與構建玩游戲之類眼花繚亂的AI系統(tǒng)同樣重要,這些原則不僅在醫(yī)學領域,而且在商業(yè)、交通和教育等領域都需要。
一個新的工程學分支:將人類和計算機結合起來
無論我們是否很快就能理解“智能”,我們都面臨著一項重大挑戰(zhàn),那就是如何將計算機和人類結合起來,從而增強人類的生活。
盡管一些人認為這一挑戰(zhàn)只是AI創(chuàng)造的一種輔助,但另一種觀點認為,這是一個新的工程學分支。就像過去幾十年的土木工程和化學工程一樣,這門新學科的目標是圍繞一些關鍵思想,為人們帶來新的資源和能力,并確保安全。土木工程和化學工程建立在物理和化學的基礎上,而這門新的工程學科將建立在上個世紀賦予了實質(zhì)的思想之上,如信息、算法、數(shù)據(jù)、不確定性、計算、推理和優(yōu)化。此外,由于新學科的大部分重點將放在來自人類和關于人類的數(shù)據(jù)上,因此,它的發(fā)展將需要社會科學和人文學科的觀點。
雖然各種構建塊已經(jīng)就位,但是將它們組合在一起的原則還沒有到位,因此目前將這些塊組合在一起的方式是臨時的。因此,就像人類在土木工程出現(xiàn)之前建造建筑物和橋梁一樣,人類也在繼續(xù)建造涉及機器、人類和環(huán)境的社會規(guī)模的推理和決策系統(tǒng)。正如早期的建筑和橋梁有時會以無法預見的方式倒塌,并帶來悲劇性的后果一樣,我們早期的許多社會規(guī)模的推理和決策系統(tǒng)已經(jīng)暴露出嚴重的概念缺陷。
不幸的是,我們并不擅長預測下一個可能出現(xiàn)的嚴重缺陷是什么。我們?nèi)鄙俚氖且粋€分析和設計原則的工程學科。
目前大多數(shù)AI,實際上是機器學習
目前關于這些問題的公開討論中,經(jīng)常使用“AI”這個術語作為一個智能的通用詞,這使得人們很難推斷出新興技術的范圍和后果。因此,我們有必要深入了解AI在最近和曾經(jīng)被用來指代什么。
如今大多數(shù)被稱為AI的東西,尤其是在公共領域,實際上是機器學習(ML),這個術語在過去幾十年里一直在使用。ML是一個算法領域,融合了統(tǒng)計學、計算機科學和許多其他學科的思想(見下文),設計處理數(shù)據(jù)、做出預測和幫助做出決策的算法。
就對現(xiàn)實世界的影響而言,ML是真實存在的,而不僅是最近才火起來的。事實上,在20世紀90年代初期,ML就已展現(xiàn)出將為產(chǎn)業(yè)界帶來巨大改變的苗頭。到了世紀之交,亞馬遜等具有前瞻性的公司就已經(jīng)在他們的業(yè)務中使用機器學習、解決關鍵任務、后端欺詐檢測和供應鏈預測中存在的問題,以及建立面向消費者的創(chuàng)新服務,如推薦系統(tǒng)。
在隨后的20年里,隨著數(shù)據(jù)集和計算資源的迅速增長,很明顯,ML很快將不僅為亞馬遜提供動力,而且將為任何一家可以將決策與大規(guī)模數(shù)據(jù)關聯(lián)在一起的公司提供動力。新的商業(yè)模式將會出現(xiàn)。
“數(shù)據(jù)科學”一詞用來指代這種現(xiàn)象,反映了ML算法專家與數(shù)據(jù)庫和分布式系統(tǒng)專家合作構建可擴展、強大的ML系統(tǒng)的需要,也反映了這樣的系統(tǒng)將產(chǎn)生更大范圍的社會影響。過去幾年,這種思想和技術趨勢的融合被重新命名為“人工智能”。這種品牌重塑的做法值得仔細審查。
模仿人類的AI和智能增強
從歷史上看,“人工智能”一詞是在20世紀50年代末創(chuàng)造的,指的是在軟件和硬件上實現(xiàn)具有人類智能水平的實體這樣一個令人興奮的愿望。我將用“模仿人類的AI”(human-imitativeAI)來指代這一愿望,強調(diào)人工智能實體似乎應該成為我們?nèi)祟惖囊粏T,即使不是在身體上成為,那么至少在精神上要這樣(無論這可能意味著什么)。
這在很大程度上是一項學術事業(yè)。雖然相關的學術領域,如運籌學、統(tǒng)計學、模式識別、信息論和控制理論已經(jīng)存在,并且經(jīng)常從人類或動物的行為中獲得靈感,但這些領域可以說是專注于低水平的信號和決策。
比如,松鼠能夠感知它所居住的森林的三維結構,并能在樹枝間跳躍,這種能力對這些領域具有啟發(fā)意義。AI旨在關注一些不同的東西:人類進行推理和思考的高級或認知能力。然而,60年后,高層次的推理和思想仍然難以捉摸?,F(xiàn)在被稱為AI的發(fā)展主要出現(xiàn)在與低水平模式識別和運動控制相關的工程領域,以及統(tǒng)計學領域,該學科的重點是在數(shù)據(jù)中發(fā)現(xiàn)模式,并做出有充分根據(jù)的預測、測試假設,以及決策。
事實上,現(xiàn)在被認為是所謂“AI革命”核心的著名的反向傳播算法,是DavidRumelhart在20世紀80年代初重新發(fā)現(xiàn)的,而它早在20世紀60年代和60年代的控制理論領域就已出現(xiàn)。其早期應用之一是優(yōu)化阿波羅飛船飛向月球時的推力。
自上世紀60年代以來,AI已經(jīng)取得了很大的進步,但可以說,這種進步并非源于對模仿人類的AI的追求。相反,就像阿波羅飛船的例子一樣,這些想法往往隱藏在幕后,研究人員的工作專注于特定的工程挑戰(zhàn)。雖然普通大眾看不到,但在文檔檢索、文本分類、欺詐檢測、推薦系統(tǒng)、個性化搜索、社會網(wǎng)絡分析、規(guī)劃、診斷和A/B測試等領域的研究和系統(tǒng)構建取得了重大進展,這些進步推動了谷歌、Netflix、Facebook和亞馬遜等公司的成功。
人們可以簡單地把這一切稱為AI,事實上,這似乎已經(jīng)發(fā)生。對于那些發(fā)現(xiàn)自己突然被稱為AI研究人員的優(yōu)化或統(tǒng)計學研究人員來說,這樣的標簽可能會讓他們感到意外。但撇開標簽不談,更大的問題是,使用這個單一的、定義不清的首字母縮略詞,阻礙了他們對正在發(fā)揮作用的智能和商業(yè)問題范圍的清晰理解。
在過去的20年里,工業(yè)和學術領域都取得了重大進展——作為模仿人類的AI的補充,通常被稱為“智能增強”(IntelligenceAugmentation,IA)。在這里,計算和數(shù)據(jù)被用來創(chuàng)建增強人類智力和創(chuàng)造力的服務。搜索引擎可以被視為IA的一個例子,因為它可以增強人類的記憶和事實知識;自然語言翻譯也是IA的一個例子,它可以增強人類的溝通能力?;谟嬎銠C的聲音和圖像生成為藝術家提供了增強調(diào)色和創(chuàng)造的能力。雖然這類服務將來可能包含高層次的推理和思考,但目前還沒有;它們主要執(zhí)行各種字符串匹配和數(shù)值操作,以捕獲人類可以使用的模式。
讓我們廣泛構思一個“智能基礎設施”的學科,構建基于計算,數(shù)據(jù)和物理實體的網(wǎng)絡,使人類環(huán)境更加有趣和安全。目前這種基礎設施已經(jīng)開始在運輸,醫(yī)藥,商業(yè)和金融等領域出現(xiàn),對個人和社會的影響正越來越深。
可以想象,我們生活在一個覆蓋全社會的醫(yī)療系統(tǒng)中,這個系統(tǒng)能夠建立人與醫(yī)生、醫(yī)療設備之間的數(shù)據(jù)流和分析,幫助醫(yī)生做出更準確地診斷,并提供護理服務。系統(tǒng)可以整合來自體細胞、DNA、血液測試,環(huán)境,群體遺傳學以及關于藥物和治療的大量科學文獻的信息。它不僅關注單個患者和醫(yī)生,而且關注所有人類之間的關系,有助于維持關于醫(yī)療信息的相關性、來源和可靠性的概念,就像今天的銀行系統(tǒng)關注金融和支付領域的挑戰(zhàn)一樣。盡管人們可以預見這樣的系統(tǒng)中會出現(xiàn)許多問題,比如隱私問題、責任問題,安全問題等等。但我們應該將這些問題視作勇于面對的挑戰(zhàn),而不是前進的阻礙。
目前的AI成果解決不了核心問題
現(xiàn)在我們面臨一個關鍵問題:目前在傳統(tǒng)的、基于人類模仿的AI真的是解決這些挑戰(zhàn)的最佳方式(甚至是唯一方式)嗎?
事實上,機器學習近年來取得成功的一些成功案例都是在模仿人類的AI領域,如計算機視覺、語音識別、游戲和機器人技術。也許我們應該繼續(xù)等待,等待這些領域的更多技術進步。這里有兩件事情需要注意。
首先,目前模仿人類的AI取得的成功還很有限,我們的最終愿望還遠未實現(xiàn)。同時,在這個領域已經(jīng)取得的有限進展,產(chǎn)生了巨大的快感,也滋生了不少恐懼,導致AI的過度繁榮和媒體的過度關注,這一點在其他工程領域是不存在的。
更重要的是第二點,在這些領域取得的成功并不足以解決重要的IA和II問題。比如自動駕駛汽車。要實現(xiàn)自動駕駛,需要解決一系列工程上的問題,這些問題可能與人的能力(或人力資源缺乏)關系不大。整體交通運輸系統(tǒng)(II系統(tǒng))可能更接近當前的空中交通管制系統(tǒng),而不是目前普遍關注的人類駕駛員。這種系統(tǒng)比現(xiàn)有的空中交通管制系統(tǒng)復雜得多,特別是可以使用大量數(shù)據(jù)和自適應統(tǒng)計建模,為精細化決策提供信息。應對這些挑戰(zhàn)需要關注最前沿,僅僅關注模仿人類的AI是不夠的。
至于必要性,有人說模仿人類的AI愿景涵蓋了IA和II的目標,因為它不僅能夠解決AI的經(jīng)典問題(比如圖靈測試),同時也是解決IA和II問題的最佳選擇。不過這種說法幾乎在歷史上找不到先例。以前聽說過要用AI木匠或AI瓦工來搞土木工程嗎?化學工程是否應該建一個AI化學家的框架?更有爭議的是:如果我們的目標是建立化工廠,是否應該首先打造一群AI化學家,然后讓TA們?nèi)パ芯吭趺唇?
有一種說法是,人類智能是我們所了解的唯一一種智能,因此我們應該將模仿人類智能作為第一步。但是,人類實際上并不擅長某種推理,人類有自己的失誤、偏見和局限。而且,至關重要的是,人類并沒能進化足以執(zhí)行現(xiàn)代II系統(tǒng)必須面對的大規(guī)模決策,也沒有應對II環(huán)境中出現(xiàn)的各種不確定性的能力。
有人可能會說,人工智能系統(tǒng)不僅會模仿人類智能,還會糾正人工智能,而且這種能力可以擴展到任意規(guī)模的問題。當然,現(xiàn)在說的處于科幻小說的范疇,這種推測性的論點,雖然放在科幻小說中會很吸引人,但不應該成為我們面對關鍵的IA和II問題時采取的主要戰(zhàn)略,這類問題已經(jīng)開始出現(xiàn)了。我們需要根據(jù)自身的優(yōu)勢解決IA和II問題,而不僅僅靠模仿人類的AI。
當然,經(jīng)典的人工模擬AI問題仍然很有意義。然而,目前的重點是通過收集數(shù)據(jù)進行AI研究,部署深度學習基礎設施,以及模仿某些特定人類技能的系統(tǒng)的演示。這些研究中幾乎沒有涉及新的解釋性原則,往往會將研究的注意力偏離經(jīng)典AI領域的幾個主要開放問題。
這些問題包括需要將意義和推理引入自然語言處理的系統(tǒng),以應對推斷和表示因果關系的需要。開發(fā)計算易處理的不確定性表示,以及開發(fā)制定和追求長期目標的系統(tǒng)。這些都是模仿人類的AI的經(jīng)典目標,但在當前人工智能革命的熱潮中,人們很容易忘記這些尚未解決的問題。
IA同樣是非常重要的問題,因為在可預見的未來,計算機仍無法與人類在抽象推理真實情況的能力相比。我們需要經(jīng)過深思熟慮的人機的交互來解決最緊迫的問題。我們希望計算機能夠催生出人類創(chuàng)造力的新水平,而不是取代人類的創(chuàng)造力。
目前的AI視野過于狹隘,談AI革命為時尚早
最早提出“人工智能”這個名詞的是約翰·麥卡錫(時任達特茅斯大學教授,后來去了麻省理工學院),當時他提出這個名詞,應該是為了區(qū)分他剛剛起步的研究項目和諾伯特·維納的項目(當時是MIT的老教授)。維納提出了“控制論”一詞來指代他自己對智能系統(tǒng)的展望,這一概念與運營研究、統(tǒng)計學、模式識別、信息理論和控制理論密切相關。而麥卡錫則強調(diào)了與邏輯的聯(lián)系。有趣的是,今天占據(jù)主導地位的更多是維納的關于“智能”的內(nèi)容體系,但外表卻用的是麥卡錫提出來的“人工智能”一詞。
除了歷史上的觀點差異之外,我們還要認識到,目前關于人工智能的公共對話,多數(shù)僅限于產(chǎn)業(yè)界和學術界的很小一部分,這種狹隘視野會影響我們面對人工智能所帶來的全部挑戰(zhàn)和機遇。
這里說的廣闊視野,和實現(xiàn)科幻小說中的場景關系不大,更多與人類對技術的必要性的理解和塑造有關,因為它在日常生活中變得越來越有影響力。在這種理解和塑造中,需要來自各行各業(yè)的各種各樣的聲音,而不僅僅是技術上對話。僅僅關注模仿人類的AI,可能會讓我們無法獲知,或不愿去獲知更廣泛的信息。
學術界也要發(fā)揮重要作用,不僅僅是提供一些最具創(chuàng)新性的技術理念,而且會與計算、統(tǒng)計學等學科的研究人員共同作出貢獻,這些貢獻和觀點非常重要,尤其需要社會科學、認知科學和人文科學的觀點。
另一方面,雖然科學對人類的前進必不可少,但我們也不應該夸大我們的努力和成果。社會的目標是建立新的成果。應該構建這些工件以按照聲明的方式工作。我們不希望造出一提供醫(yī)療、交通選擇和商業(yè)機會的系統(tǒng),然后發(fā)現(xiàn)這些系統(tǒng)無法真正發(fā)揮作用,發(fā)現(xiàn)它們會產(chǎn)生錯誤,影響到我們的快樂和生活。所以,正如我所強調(diào)的那樣,目前在數(shù)據(jù)和學習為關注重點的領域還沒能出現(xiàn)一個“工程學科”。盡管這些領域的發(fā)展前景令人興奮,但目前還不能被視為“工程學科”。
我們應該接受這樣一個事實,即我們正在見證一個新的工程學科的誕生?!肮こ獭边@個詞具有獨特的內(nèi)涵,容易讓人想到冷漠、情感的機器,以及失去對人類的控制,但我們可以打造自己想要的工程學科。在當今時代,我們迎來了一個真正的機會,來構思歷史上前所未有的新東西:以人為本的新興工程學科。我在這里不打算這個新興學科取名,但如果縮略詞“AI”繼續(xù)作為學科名字使用,那么我們需要意識到這個詞的真正意義和局限性。我們需要拓寬視野,平息炒作,并對未來的嚴峻挑戰(zhàn)有一個清醒的認識。