人工智能作為新一輪產(chǎn)業(yè)變革的核心驅(qū)動力,將進一步釋放歷次科技革命和產(chǎn)業(yè)變革積蓄的巨大能量,并創(chuàng)造新的強大引擎,推動智能經(jīng)濟和智能社會的發(fā)展。本文嘗試從根技術(shù)、核心共性技術(shù)、智能應(yīng)用技術(shù)、典型應(yīng)用場景四個層面勾勒人工智能技術(shù)的整體技術(shù)體系和國內(nèi)外發(fā)展情況。
近年來,人工智能已經(jīng)成為國際科技競爭的新焦點。作為多學(xué)科交叉結(jié)果和通用型技術(shù),人工智能技術(shù)同上下游的相關(guān)技術(shù)和應(yīng)用一起形成了錯綜復(fù)雜的技術(shù)體系網(wǎng)絡(luò)。這一網(wǎng)絡(luò)目前初見雛形,但仍處于快速更新、劇烈變化的動態(tài)發(fā)展?fàn)顟B(tài)。經(jīng)過多方資料的匯總和梳理,本文嘗試從根技術(shù)、核心共性技術(shù)、智能應(yīng)用技術(shù)、典型應(yīng)用場景四個層面勾勒人工智能技術(shù)的整體技術(shù)體系和國內(nèi)外發(fā)展情況。初步研判,目前人工智能產(chǎn)業(yè)的發(fā)展存在著兩個主要趨勢:一是不斷拓展、深挖核心技術(shù);二是積極尋求在傳統(tǒng)產(chǎn)業(yè)的應(yīng)用空間。
一、根技術(shù):廣泛融合,不斷擴展
數(shù)學(xué)與工程學(xué)始終是人工智能發(fā)展過程中的重要基石。例如1956年達特茅斯會議以來,控制論曾長期處于人工智能研究的主導(dǎo)理論地位;機器學(xué)習(xí)算法的發(fā)展過程則可視為數(shù)學(xué)方法不斷演進的過程。
80年代人工智能的主流理論逐漸演化為信息論,同期也誕生了深度學(xué)習(xí)算法。深度學(xué)習(xí)算法能夠在近年獲得成功除了得益于自身算法的不斷完善,還應(yīng)歸因于三十年來信息學(xué)與計算機科學(xué)的快速發(fā)展。尤其是大數(shù)據(jù)技術(shù)的發(fā)展提供了前所未有的豐富數(shù)據(jù),使得各類機器學(xué)習(xí)算法獲得了充足的學(xué)習(xí)資源;而計算性能的提升也保證了其潛力的充分發(fā)揮。
出于對人類智能的追求,腦科學(xué)與認(rèn)知科學(xué)在人工智能的各個發(fā)展階段都是主要參與學(xué)科之一。例如人工神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)理論雛形就是在心理學(xué)家WarrenMcculloch的參與下產(chǎn)生的。當(dāng)前類腦智能更被認(rèn)為是人工智能的未來發(fā)展方向之一,因此對腦科學(xué)與認(rèn)知科學(xué)的研究仍將受到廣泛關(guān)注。相關(guān)研究可以分為關(guān)注基因、蛋白質(zhì)、神經(jīng)元、化學(xué)信號、電信號的“硬件研究”和關(guān)注認(rèn)知、行為、心理的“軟件研究”兩大類。目前普遍認(rèn)為后者對于類腦智能的研發(fā)更具指導(dǎo)意義。
多項不同根技術(shù)的廣泛融合成就了當(dāng)前人工智能技術(shù)的高速發(fā)展。同時這一融合范圍還在不斷擴大。例如隨著智能芯片的發(fā)展,集成電路相關(guān)技術(shù)已經(jīng)成為了人工智能技術(shù)體系的一部分;量子計算也被納入人工智能的技術(shù)網(wǎng)絡(luò)中。人工智能的多學(xué)科交叉特色將會越來越顯著。
二、核心共性技術(shù)
核心共性技術(shù)大致可以分為人工智能芯片、基礎(chǔ)算法和系統(tǒng)平臺三類。在具體應(yīng)用中,各種不同算法是系統(tǒng)平臺的基礎(chǔ);人工智能芯片作為硬件是算法的基礎(chǔ)。但在實際的創(chuàng)新鏈中,人工智能芯片也是基于基礎(chǔ)算法的特點、需求和指導(dǎo)而開發(fā)的?;A(chǔ)算法是人工智能技術(shù)發(fā)展的根本核心。
1.基礎(chǔ)算法:創(chuàng)新活躍,任重道遠
早期計算智能算法主要模仿了人類智能的“知識表示與推理”功能。雖然出現(xiàn)了專家系統(tǒng)、幾何證明機、“深藍”等案例,但整體上仍存在效率低下、維護性差、性價比低等難以克服的問題,未能取得商業(yè)成功。
機器學(xué)習(xí)算法則更進一步,在形式上模擬了人腦的學(xué)習(xí)功能,即重復(fù)訓(xùn)練次數(shù)多的“思考”過程會被強化。這一突破性進步能夠大大提升人工智能系統(tǒng)的運行效率,并降低編碼成本。人工神經(jīng)網(wǎng)絡(luò)算法是機器學(xué)習(xí)算法的重要分支,初步借鑒了人腦神經(jīng)元的某些運算機制。深度學(xué)習(xí)算法是人工神經(jīng)網(wǎng)絡(luò)算法的一個拓展,通過多層神經(jīng)網(wǎng)絡(luò),形成比淺層結(jié)構(gòu)簡單學(xué)習(xí)更強大的從少數(shù)樣本集中歸納數(shù)據(jù)集本質(zhì)特征的能力。近年來,算法方面的研究始終處于頻繁更新、快速迭代的狀態(tài)。目前單純的深度學(xué)習(xí)算法已經(jīng)略顯“過時”。在其基礎(chǔ)上開發(fā)的卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、遞歸深度神經(jīng)網(wǎng)絡(luò)等成為最新前沿。此外現(xiàn)有算法的交叉組合,例如深度學(xué)習(xí)算法同強化學(xué)習(xí)算法綜合形成的深度強化學(xué)習(xí)方法等也逐步成為新的熱點。在計算智能算法和機器學(xué)習(xí)算法的研發(fā)方面,歐美大學(xué)占據(jù)絕對的領(lǐng)跑地位。全球排名前30的高校中,美國高校占比最高,達到22家;我國高校無一上榜。
盡管在目前獲得了一定的成功,但機器學(xué)習(xí)算法的機理仍然是統(tǒng)計擬合、暴力計算,并不具備真正的基于理解的學(xué)習(xí)、推理和決策能力,因此在應(yīng)用中仍具有極大的局限性。部分專家甚至認(rèn)為機器學(xué)習(xí)算法無法真正解決自然語言翻譯、全自主自動駕駛等熱點問題。當(dāng)前比較明確的面向未來的前沿算法基礎(chǔ)理論中,高級機器學(xué)習(xí)仍然無法突破機器學(xué)習(xí)的框架;量子計算主要是配合高級機器學(xué)習(xí)的發(fā)展;類腦智能計算則被許多專家視為新一代人工智能技術(shù)的突破口。近期美、日、德、法、歐盟和以色列等主要國家和地區(qū)都開展了腦科學(xué)與人工智能的聯(lián)合研究,但眾多現(xiàn)有類腦智能研究都主要以利用人工智能工具研究腦科學(xué)為主,對人工智能研究的推動不足。將兩方面研究緊密結(jié)合的機構(gòu)僅有麻省理工學(xué)院、卡內(nèi)基·梅隆大學(xué)和加州大學(xué)伯克利分校等少數(shù)高校。整體而言,新一代人工智能的基礎(chǔ)算法研究仍然任重道遠。
2.人工智能芯片:多路線競爭,分領(lǐng)域發(fā)展
目前的人工智能芯片根據(jù)技術(shù)路線可分類三類。首先是通用型的CPU及GPU芯片。CPU的架構(gòu)和指令集對神經(jīng)網(wǎng)絡(luò)計算的兼容度不夠,性價比和運算效率偏低。但英特爾、ARM在新的CPU產(chǎn)品XeonPhi和DynamIQ中強化了對神經(jīng)網(wǎng)絡(luò)計算的支持。GPU的架構(gòu)比CPU更有利于相關(guān)算法的運行。傳統(tǒng)的GPU廠商英偉達和AMD分別推出了TeslaV100和RadeonInstinctMI25來開拓人工智能芯片的市場空間。英特爾也通過收購的方式推出了Nervana以進入GPU領(lǐng)域。
第二類是FPGA芯片。FPGA具有可定制的特點,使用者可以對芯片進行二次開發(fā)使其更加適宜特定的運算環(huán)境。由于犧牲了通用性,F(xiàn)PGA芯片的價格相對CPU和GPU而言較為便宜。目前Xilinx、Altera、Microsemi、Lattice等少數(shù)廠商基本壟斷了FPGA的生產(chǎn)。英特爾通過收購Altera也進入了FPGA芯片的生產(chǎn)環(huán)節(jié)?;谕赓徯酒?,微軟、百度等領(lǐng)先企業(yè)均具有較強的二次開發(fā)能力。百度已經(jīng)推出了基于FPGA的百度大腦芯片。
第三類是ASIC芯片。此類芯片是徹底的專用芯片,也不具備編輯功能。設(shè)計新ASIC芯片的前期投入較高,但大規(guī)模生產(chǎn)后能夠?qū)崿F(xiàn)極低廉的成本。ASIC芯片對特定計算的運行效率極高,但也僅能應(yīng)用于特定計算。目前ASIC芯片分兩個技術(shù)方向。(1)脈沖神經(jīng)網(wǎng)絡(luò)芯片,以IBM的TureNorth為代表,以脈沖長短模擬大腦神經(jīng)元間的交流活動。(2)機器學(xué)習(xí)芯片,以谷歌TPU和我國寒武紀(jì)為代表,以概率變化模擬大腦神經(jīng)元間的交流活動。比較而言,后者直接針對機器學(xué)習(xí)算法的需要,目前在商業(yè)化應(yīng)用競爭中占據(jù)優(yōu)勢,高通的Zeroth即是從早期的脈沖神經(jīng)網(wǎng)絡(luò)芯片轉(zhuǎn)為現(xiàn)今的機器學(xué)習(xí)芯片方向。前者仍需憶阻器等基本原件的進一步發(fā)展,但對于類腦算法研究而言有著長遠的意義。
整體而言,三類人工智能芯片各有特點,都具有對應(yīng)的潛在細(xì)分市場空間。不同場合下對通用性、成本、性能的不同要求會產(chǎn)生不同的解決方案。蘋果A11、華為麒麟970中的人工智能模塊以及谷歌TPU都只是用于配合CPU完成特定運算。
3系統(tǒng)平臺:多方混戰(zhàn),搶占地盤
實際應(yīng)用中,可能被用到的大量不同基礎(chǔ)算法需要整合成為集成化、高度兼容的軟件工具來發(fā)揮作用。較完備的工具軟件包形成了穩(wěn)定的系統(tǒng)環(huán)境。圍繞一些開源系統(tǒng)往往還會形成全球共享的研究成果交流平臺。在系統(tǒng)平臺領(lǐng)域搶占話語權(quán),就能在人工智能時代形成類似PC時代Windows系統(tǒng)或手機時代安卓系統(tǒng)的優(yōu)勢市場地位。當(dāng)前人工智能系統(tǒng)平臺處于活躍發(fā)展、普遍競爭的狀態(tài),尚未產(chǎn)生穩(wěn)定格局。Facebook、IBM等大公司和許多創(chuàng)業(yè)型小公司都推出了自己的開源項目。蘋果通過收購Turi公司涉足了這一領(lǐng)域。我國的百度也在近期推出了自己的開源平臺PaddlePaddle。谷歌則完全基于其TensorFlow平臺設(shè)計出了TPU芯片,在戰(zhàn)略層面打通了軟硬件市場的布局。
三、智能應(yīng)用技術(shù):感知、決策、執(zhí)行集成化
智能應(yīng)用技術(shù)是核心共性技術(shù)基礎(chǔ)上的具體應(yīng)用研究,主要是解決了某種特定類型問題的解決方案。某項專項技術(shù)可能用于許多不同的應(yīng)用場景;特定應(yīng)用場景也往往包含了多項專項技術(shù)。
智能傳感器方面,目前國際一流傳感器的市場基本被外國公司所壟斷,我國的產(chǎn)業(yè)和研發(fā)實力明顯處于劣勢。模式識別在廣義上既包括一些共性理論,也包括在語音、圖像、自然語言分析等方面的具體識別技術(shù),在此分別表述為模式識別理論和感知與理解技術(shù)。智能決策分析則主要側(cè)重數(shù)據(jù)挖掘方向的專項應(yīng)用。機器人、無人機、自動駕駛汽車也開始大量應(yīng)用基于機器學(xué)習(xí)的智能控制技術(shù)。此外,人機交互也是當(dāng)前的重點之一。
以往在機器人及自動化領(lǐng)域的研究中,經(jīng)常依照感知、決策、執(zhí)行三個環(huán)節(jié)來分析其技術(shù)體系,人工智能的發(fā)展則逐步模糊了三者的邊界。例如機器視覺既包含基于視覺傳感器的感知環(huán)節(jié),也是對視覺信號進行分析處理和判斷的決策環(huán)節(jié)。人機交互則同時涉及了以人為對象的感知和執(zhí)行兩個環(huán)節(jié)。未來人工智能技術(shù)將進一步推動感知、決策、執(zhí)行的集成化水平。
四、典型應(yīng)用場景:熱點集中,各顯神通
以新增企業(yè)的業(yè)務(wù)方向為標(biāo)準(zhǔn),近年人工智能產(chǎn)業(yè)關(guān)注度最集中的細(xì)分領(lǐng)域為機器視覺、自然語言處理和自動駕駛。這三類專項智能技術(shù)所派生的應(yīng)用場景也是當(dāng)前人工智能市場的主要熱點。例如機器視覺技術(shù)發(fā)展出的網(wǎng)絡(luò)圖像審核、人臉識別、虹膜識別、設(shè)備登錄驗證、金融身份驗證、安防監(jiān)控等應(yīng)用;自然語言處理技術(shù)發(fā)展出的語音輸入、機器翻譯、擬人交流、智能客服等應(yīng)用。
這些焦點應(yīng)用中,比較成熟的自然語言處理、機器視覺及圖像識別、語音識別等基本都局限在信息產(chǎn)業(yè)之內(nèi)。能夠同實體經(jīng)濟掛鉤的自動駕駛雖然獲得廣泛關(guān)注但短期內(nèi)尚難以突破。目前尋找能夠?qū)觽鹘y(tǒng)制造和服務(wù)業(yè)的應(yīng)用點是人工智能產(chǎn)業(yè)發(fā)展的重要任務(wù),也是人工智能“通用型”應(yīng)用的必然需要。
目前對新應(yīng)用領(lǐng)域的探索主要分為三種情況。(1)龍頭引領(lǐng),即領(lǐng)先企業(yè)的戰(zhàn)略意志推動新應(yīng)用市場的開辟,并利用技術(shù)、資金、影響力等方面的優(yōu)勢而暫時處于無人競爭的狀態(tài)。例如IBM基于沃森所提供的醫(yī)療診斷、法律咨詢等服務(wù),以及阿里巴巴所提出的城市大腦。(2)主動吸收,即一些專業(yè)性較強的行業(yè)主動吸收人工智能方法改善自身產(chǎn)品水平,主導(dǎo)者是業(yè)內(nèi)原有的成熟主體而非新興的人工智能企業(yè)。這也是最能體現(xiàn)人工智能“通用型”的應(yīng)用類型。例如財務(wù)分析、科研輔助、交融交易分析等。(3)有待開拓,即相關(guān)領(lǐng)域理論上存在應(yīng)用人工智能的可能,但尚缺乏實用性強、市場空間大的成熟產(chǎn)品。例如防災(zāi)減災(zāi)、基礎(chǔ)設(shè)施維護、智能制造、智能教育等。