新一代人工智能發(fā)展方向及技術(shù)框架

時(shí)間:2018-03-09

來源:中國傳動網(wǎng)

導(dǎo)語:隨著信息時(shí)代的來臨,人類生產(chǎn)生活的數(shù)據(jù)基礎(chǔ)和信息環(huán)境有了大幅提升,人工智能正從學(xué)術(shù)驅(qū)動轉(zhuǎn)變?yōu)閼?yīng)用驅(qū)動

隨著信息時(shí)代的來臨,人類生產(chǎn)生活的數(shù)據(jù)基礎(chǔ)和信息環(huán)境有了大幅提升,人工智能正從學(xué)術(shù)驅(qū)動轉(zhuǎn)變?yōu)閼?yīng)用驅(qū)動,從專用智能邁向通用智能,比歷史上任何一個時(shí)期都要更加接近于人類智能水平,進(jìn)入了新的發(fā)展階段。全球各國均圍繞新一代人工智能技術(shù)及產(chǎn)業(yè)發(fā)展進(jìn)行前瞻布局,我國也已將其提升到了國家戰(zhàn)略層面。基于此,本白皮書重點(diǎn)圍繞新一代人工智能面臨的新形勢、驅(qū)動的新因素、呈現(xiàn)的新特征,對架構(gòu)、算法、系統(tǒng)等技術(shù)演進(jìn)方向作出研判,詳細(xì)梳理了包括云計(jì)算、大數(shù)據(jù)兩大基礎(chǔ)平臺和機(jī)器學(xué)習(xí)、模式識別、人機(jī)交互三大通用技術(shù)的技術(shù)體系,深入論證了新一代人工智能產(chǎn)業(yè)邊界和范圍,劃分了基礎(chǔ)層、技術(shù)層、應(yīng)用層三大產(chǎn)業(yè)化領(lǐng)域,研究了智能傳感器、智能芯片、算法模型、語音識別、圖像視頻識別、文本識別、智能機(jī)器人、智能制造系統(tǒng)、智能安防、智能駕駛等具體產(chǎn)業(yè)化方向的產(chǎn)業(yè)規(guī)模、核心技術(shù)、主要產(chǎn)品、典型企業(yè),歸納了近年來全球和我國在人工智能領(lǐng)域的投融資特征趨勢,并對國內(nèi)外人工智能的技術(shù)及產(chǎn)業(yè)發(fā)展?fàn)顩r進(jìn)行了系統(tǒng)對比和趨勢展望,最后提出了發(fā)展理念、治理體系、創(chuàng)新能力、發(fā)展基礎(chǔ)、資本環(huán)境、行業(yè)組織、全球統(tǒng)籌共七項(xiàng)措施建議,進(jìn)一步推動我國人工智能相關(guān)的前沿新興產(chǎn)業(yè)持續(xù)健康快速發(fā)展,有力支撐信息化與工業(yè)化深度融合邁上新臺階。

新一代人工智能發(fā)展方向

人工智能發(fā)軔于1956年在美國達(dá)特茅斯(Dartmouth)學(xué)院舉行的“人工智能(ArtificialIntelligent,簡稱AI)夏季研討會”,在20世紀(jì)50年代末和80年代初先后步入兩次發(fā)展高峰,但因?yàn)榧夹g(shù)瓶頸、應(yīng)用成本等局限性而均落入低谷。當(dāng)前,在新一代信息技術(shù)的引領(lǐng)下,數(shù)據(jù)快速積累,運(yùn)算能力大幅提升,算法模型持續(xù)演進(jìn),行業(yè)應(yīng)用快速興起,人工智能發(fā)展環(huán)境發(fā)生了深刻變化,跨媒體智能、群體智能、自主智能系統(tǒng)、混合型智能成為新的發(fā)展方向,人工智能第三次站在了科技發(fā)展的浪潮之巔。

(一)人工智能簡要發(fā)展歷程

從誕生至今,人工智能已有60年的發(fā)展歷史,大致經(jīng)歷了三次浪潮。第一次浪潮為20世紀(jì)50年代末至20世紀(jì)80年代初;第二次浪潮為20世紀(jì)80年代初至20世紀(jì)末;第三次浪潮為21世紀(jì)初至今。在人工智能的前兩次浪潮當(dāng)中,由于技術(shù)未能實(shí)現(xiàn)突破性進(jìn)展,相關(guān)應(yīng)用始終難以達(dá)到預(yù)期效果,無法支撐起大規(guī)模商業(yè)化應(yīng)用,最終在經(jīng)歷過兩次高潮與低谷之后,人工智能歸于沉寂。隨著信息技術(shù)快速發(fā)展和互聯(lián)網(wǎng)快速普及,以2006年深度學(xué)習(xí)模型的提出為標(biāo)志,人工智能迎來第三次高速成長,如圖1所示。

1、第一次浪潮:人工智能誕生并快速發(fā)展,但技術(shù)瓶頸難以突破。

符號主義盛行,人工智能快速發(fā)展。1956年到1974年是人工智能發(fā)展的第一個黃金時(shí)期??茖W(xué)家將符號方法引入統(tǒng)計(jì)方法中進(jìn)行語義處理,出現(xiàn)了基于知識的方法,人機(jī)交互開始成為可能。科學(xué)家發(fā)明了多種具有重大影響的算法,如深度學(xué)習(xí)模型的雛形貝爾曼公式。除在算法和方法論方面取得了新進(jìn)展,科學(xué)家們還制作出具有初步智能的機(jī)器。如能證明應(yīng)用題的機(jī)器STUDENT(1964),可以實(shí)現(xiàn)簡單人機(jī)對話的機(jī)器ELIZA(1966)。人工智能發(fā)展速度迅猛,以至于研究者普遍認(rèn)為人工智能代替人類只是時(shí)間問題。

模型存在局限,人工智能步入低谷。1974年到1980年。人工智能的瓶頸逐漸顯現(xiàn),邏輯證明器、感知器、增強(qiáng)學(xué)習(xí)只能完成指定的工作,對于超出范圍的任務(wù)則無法應(yīng)對,智能水平較為低級,局限性較為突出。造成這種局限的原因主要體現(xiàn)在兩個方面:一是人工智能所基于的數(shù)學(xué)模型和數(shù)學(xué)手段被發(fā)現(xiàn)具有一定的缺陷;二是很多計(jì)算的復(fù)雜度呈指數(shù)級增長,依據(jù)現(xiàn)有算法無法完成計(jì)算任務(wù)。先天的缺陷是人工智能在早期發(fā)展過程中遇到的瓶頸,研發(fā)機(jī)構(gòu)對人工智能的熱情逐漸冷卻,對人工智能的資助也相應(yīng)被縮減或取消,人工智能第一次步入低谷。

2、第二次浪潮:模型突破帶動初步產(chǎn)業(yè)化,但推廣應(yīng)用存在成本障礙。

數(shù)學(xué)模型實(shí)現(xiàn)重大突破,專家系統(tǒng)得以應(yīng)用。進(jìn)入20世紀(jì)80年代,人工智能再次回到了公眾的視野當(dāng)中。人工智能相關(guān)的數(shù)學(xué)模型取得了一系列重大發(fā)明成果,其中包括著名的多層神經(jīng)網(wǎng)絡(luò)(1986)和BP反向傳播算法(1986)等,這進(jìn)一步催生了能與人類下象棋的高度智能機(jī)器(1989)。其它成果包括通過人工智能網(wǎng)絡(luò)來實(shí)現(xiàn)能自動識別信封上郵政編碼的機(jī)器,精度可達(dá)99%以上,已經(jīng)超過普通人的水平。與此同時(shí),卡耐基·梅隆大學(xué)為DEC公司制造出了專家系統(tǒng)(1980),這個專家系統(tǒng)可幫助DEC公司每年節(jié)約4000萬美元左右的費(fèi)用,特別是在決策方面能提供有價(jià)值的內(nèi)容。受此鼓勵,很多國家包括日本、美國都再次投入巨資開發(fā)所謂第5代計(jì)算機(jī)(1982),當(dāng)時(shí)叫做人工智能計(jì)算機(jī)。

成本高且難維護(hù),人工智能再次步入低谷。為推動人工智能的發(fā)展,研究者設(shè)計(jì)了LISP語言,并針對該語言研制了Lisp計(jì)算機(jī)。該機(jī)型指令執(zhí)行效率比通用型計(jì)算機(jī)更高,但價(jià)格昂貴且難以維護(hù),始終難以大范圍推廣普及。與此同時(shí),在1987年到1993年間,蘋果和IBM公司開始推廣第一代臺式機(jī),隨著性能不斷提升和銷售價(jià)格的不斷降低,這些個人電腦逐漸在消費(fèi)市場上占據(jù)了優(yōu)勢,越來越多的計(jì)算機(jī)走入個人家庭,價(jià)格昂貴的Lisp計(jì)算機(jī)由于古老陳舊且難以維護(hù)逐漸被市場淘汰,專家系統(tǒng)也逐漸淡出人們的視野,人工智能硬件市場出現(xiàn)明顯萎縮。同時(shí),政府經(jīng)費(fèi)開始下降,人工智能又一次步入低谷。

3、第三次浪潮:信息時(shí)代催生新一代人工智能,但未來發(fā)展存在諸多隱憂。

新興技術(shù)快速涌現(xiàn),人工智能發(fā)展進(jìn)入新階段。隨著互聯(lián)網(wǎng)的普及、傳感器的泛在、大數(shù)據(jù)的涌現(xiàn)、電子商務(wù)的發(fā)展、信息社區(qū)的興起,數(shù)據(jù)和知識在人類社會、物理空間和信息空間之間交叉融合、相互作用,人工智能發(fā)展所處信息環(huán)境和數(shù)據(jù)基礎(chǔ)發(fā)生了巨大而深刻的變化,這些變化構(gòu)成了驅(qū)動人工智能走向新階段的外在動力。與此同時(shí),人工智能的目標(biāo)和理念出現(xiàn)重要調(diào)整,科學(xué)基礎(chǔ)和實(shí)現(xiàn)載體取得新的突破,類腦計(jì)算、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等一系列的技術(shù)萌芽也預(yù)示著內(nèi)在動力的成長,人工智能的發(fā)展已經(jīng)進(jìn)入一個新的階段。

人工智能水平快速提升,人類面臨潛在隱患。得益于數(shù)據(jù)量的快速增長、計(jì)算能力的大幅提升以及機(jī)器學(xué)習(xí)算法的持續(xù)優(yōu)化,新一代人工智能在某些給定任務(wù)中已經(jīng)展現(xiàn)出達(dá)到或超越人類的工作能力,并逐漸從專用型智能向通用型智能過渡,有望發(fā)展為抽象型智能。隨著應(yīng)用范圍的不斷拓展,人工智能與人類生產(chǎn)生活聯(lián)系的愈發(fā)緊密,一方面給人們帶來諸多便利,另一方面也產(chǎn)生了一些潛在問題:一是加速機(jī)器換人,結(jié)構(gòu)性失業(yè)可能更為嚴(yán)重;二是隱私保護(hù)成為難點(diǎn),數(shù)據(jù)擁有權(quán)、隱私權(quán)、許可權(quán)等界定存在困難。

(二)新一代人工智能的主要驅(qū)動因素

當(dāng)前,隨著移動互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等新一代信息技術(shù)的加速迭代演進(jìn),人類社會與物理世界的二元結(jié)構(gòu)正在進(jìn)階到人類社會、信息空間和物理世界的三元結(jié)構(gòu),人與人、機(jī)器與機(jī)器、人與機(jī)器的交流互動愈加頻繁。人工智能發(fā)展所處的信息環(huán)境和數(shù)據(jù)基礎(chǔ)發(fā)生了深刻變化,愈加海量化的數(shù)據(jù)、持續(xù)提升的運(yùn)算力、不斷優(yōu)化的算法模型、結(jié)合多種場景的新應(yīng)用已構(gòu)成相對完整的閉環(huán),成為推動新一代人工智能發(fā)展的四大要素,如圖2所示。

1、人機(jī)物互聯(lián)互通成趨勢,數(shù)據(jù)量呈現(xiàn)爆炸性增長

近年來,得益于互聯(lián)網(wǎng)、社交媒體、移動設(shè)備和傳感器的大量普及,全球產(chǎn)生并存儲的數(shù)據(jù)量急劇增加,為通過深度學(xué)習(xí)的方法來訓(xùn)練人工智能提供了良好的土壤。目前,全球數(shù)據(jù)總量每年都以倍增的速度增長,預(yù)計(jì)到2020年將達(dá)到44萬億GB,中國產(chǎn)生的數(shù)據(jù)量將占全球數(shù)據(jù)總量的近20%。海量的數(shù)據(jù)將為人工智能算法模型提供源源不斷的素材,人工智能正從監(jiān)督式學(xué)習(xí)向無監(jiān)督學(xué)習(xí)演進(jìn)升級,從各行業(yè)、各領(lǐng)域的海量數(shù)據(jù)中積累經(jīng)驗(yàn)、發(fā)現(xiàn)規(guī)律、持續(xù)提升。

2、數(shù)據(jù)處理技術(shù)加速演進(jìn),運(yùn)算能力實(shí)現(xiàn)大幅提升

人工智能領(lǐng)域富集了海量數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)處理技術(shù)難以滿足高強(qiáng)度、高頻次的處理需求。人工智能芯片的出現(xiàn)加速了深層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練迭代速度,讓大規(guī)模的數(shù)據(jù)處理效率顯著提升,極大地促進(jìn)了人工智能行業(yè)的發(fā)展。目前,出現(xiàn)了GPU、NPU、FPGA和各種各樣的AI-PU專用芯片。相比傳統(tǒng)的CPU只能同時(shí)做一兩個加減法運(yùn)算,NPU等專用芯片多采用“數(shù)據(jù)驅(qū)動并行計(jì)算”的架構(gòu),特別擅長處理視頻、圖像類的海量多媒體數(shù)據(jù)。在具有更高線性代數(shù)運(yùn)算效率的同時(shí),只產(chǎn)生比CPU更低的功耗。

3、深度學(xué)習(xí)研究成果卓著,帶動算法模型持續(xù)優(yōu)化

2006年,加拿大多倫多大學(xué)教授杰弗里·辛頓提出了深度學(xué)習(xí)的概念,極大地發(fā)展了人工神經(jīng)網(wǎng)絡(luò)算法,提高了機(jī)器自學(xué)習(xí)的能力,例如谷歌大腦團(tuán)隊(duì)在2012年通過使用深度學(xué)習(xí)技術(shù),成功讓電腦從視頻中“認(rèn)出”了貓。隨著算法模型的重要性進(jìn)一步凸顯,全球科技巨頭紛紛加大了這方面的布局力度和投入,通過成立實(shí)驗(yàn)室,開源算法框架,打造生態(tài)體系等方式推動算法模型的優(yōu)化和創(chuàng)新。目前,深度學(xué)習(xí)等算法已經(jīng)廣泛應(yīng)用在自然語言處理、語音處理以及計(jì)算機(jī)視覺等領(lǐng)域,并在某些特定領(lǐng)域取得了突破性進(jìn)展,從有監(jiān)督式學(xué)習(xí)演化為半監(jiān)督式、無監(jiān)督式學(xué)習(xí)。

4、資本與技術(shù)深度耦合,助推行業(yè)應(yīng)用快速興起

當(dāng)前,在技術(shù)突破和應(yīng)用需求的雙重驅(qū)動下,人工智能技術(shù)已走出實(shí)驗(yàn)室,加速向產(chǎn)業(yè)各個領(lǐng)域滲透,產(chǎn)業(yè)化水平大幅提升。在此過程中,資本作為產(chǎn)業(yè)發(fā)展的加速器發(fā)揮了重要的作用,一方面,跨國科技巨頭以資本為杠桿,展開投資并購活動,得以不斷完善產(chǎn)業(yè)鏈布局,另一方面,各類資本對初創(chuàng)型企業(yè)的支持,使得優(yōu)秀的技術(shù)型公司迅速脫穎而出。據(jù)美國技術(shù)研究公司VentureScanner的調(diào)查報(bào)告顯示,截至到2017年12月,全球范圍內(nèi)總計(jì)2075家與人工智能技術(shù)有關(guān)公司的融資總額達(dá)到65億美元。同時(shí),美國行業(yè)研究公司CBInsight公布了對美國人工智能初創(chuàng)企業(yè)的調(diào)查結(jié)果,這類企業(yè)的融資金額約是2012年的10倍。目前,人工智能已在智能機(jī)器人、無人機(jī)、金融、醫(yī)療、安防、駕駛、搜索、教育等領(lǐng)域得到了較為廣泛的應(yīng)用。

(三)新一代人工智能主要發(fā)展特征

在數(shù)據(jù)、運(yùn)算能力、算法模型、多元應(yīng)用的共同驅(qū)動下,人工智能的定義正從用計(jì)算機(jī)模擬人類智能演進(jìn)到協(xié)助引導(dǎo)提升人類智能,通過推動機(jī)器、人與網(wǎng)絡(luò)相互連接融合,更為密切地融入人類生產(chǎn)生活,從輔助性設(shè)備和工具進(jìn)化為協(xié)同互動的助手和伙伴,如圖3所示。主要特征如下:

1、大數(shù)據(jù)成為人工智能持續(xù)快速發(fā)展的基石

隨著新一代信息技術(shù)的快速發(fā)展,計(jì)算能力、數(shù)據(jù)處理能力和處理速度實(shí)現(xiàn)了大幅提升,機(jī)器學(xué)習(xí)算法快速演進(jìn),大數(shù)據(jù)的價(jià)值得以展現(xiàn)。與早期基于推理的人工智能不同,新一代人工智能是由大數(shù)據(jù)驅(qū)動的,通過給定的學(xué)習(xí)框架,不斷根據(jù)當(dāng)前設(shè)置及環(huán)境信息修改、更新參數(shù),具有高度的自主性。例如,在輸入30萬張人類對弈棋譜并經(jīng)過3千萬次的自我對弈后,人工智能AlphaGo具備了媲美頂尖棋手的棋力。隨著智能終端和傳感器的快速普及,海量數(shù)據(jù)快速累積,基于大數(shù)據(jù)的人工智能也因此獲得了持續(xù)快速發(fā)展的動力來源。

2、文本、圖像、語音等信息實(shí)現(xiàn)跨媒體交互

當(dāng)前,計(jì)算機(jī)圖像識別、語音識別和自然語言處理等技術(shù)在準(zhǔn)確率及效率方面取得了明顯進(jìn)步,并成功應(yīng)用在無人駕駛、智能搜索等垂直行業(yè)。與此同時(shí),隨著互聯(lián)網(wǎng)、智能終端的不斷發(fā)展,多媒體數(shù)據(jù)呈現(xiàn)爆炸式增長,并以網(wǎng)絡(luò)為載體在用戶之間實(shí)時(shí)、動態(tài)傳播,文本、圖像、語音、視頻等信息突破了各自屬性的局限,實(shí)現(xiàn)跨媒體交互,智能化搜索、個性化推薦的需求進(jìn)一步釋放。未來人工智能將逐步向人類智能靠近,模仿人類綜合利用視覺、語言、聽覺等感知信息,實(shí)現(xiàn)識別、推理、設(shè)計(jì)、創(chuàng)作、預(yù)測等功能。

3、基于網(wǎng)絡(luò)的群體智能技術(shù)開始萌芽

隨著互聯(lián)網(wǎng)、云計(jì)算等新一代信息技術(shù)的快速應(yīng)用及普及,大數(shù)據(jù)不斷累積,深度學(xué)習(xí)及強(qiáng)化學(xué)習(xí)等算法不斷優(yōu)化,人工智能研究的焦點(diǎn),已從單純用計(jì)算機(jī)模擬人類智能,打造具有感知智能及認(rèn)知智能的單個智能體,向打造多智能體協(xié)同的群體智能轉(zhuǎn)變。群體智能充分體現(xiàn)了“通盤考慮、統(tǒng)籌優(yōu)化”思想,具有去中心化、自愈性強(qiáng)和信息共享高效等優(yōu)點(diǎn),相關(guān)的群體智能技術(shù)已經(jīng)開始萌芽并成為研究熱點(diǎn)。例如,我國研究開發(fā)了固定翼無人機(jī)智能集群系統(tǒng),并于2017年6月實(shí)現(xiàn)了119架無人機(jī)的集群飛行。

4、自主智能系統(tǒng)成為新興發(fā)展方向

在長期以來的人工智能發(fā)展歷程中,對仿生學(xué)的結(jié)合和關(guān)注始終是其研究的重要方向,如美國軍方曾經(jīng)研制的機(jī)器騾以及各國科研機(jī)構(gòu)研制的一系列人形機(jī)器人等。但均受技術(shù)水平的制約和應(yīng)用場景的局限,沒有在大規(guī)模應(yīng)用推廣方面獲得顯著突破。當(dāng)前,隨著生產(chǎn)制造智能化改造升級的需求日益凸顯,通過嵌入智能系統(tǒng)對現(xiàn)有的機(jī)械設(shè)備進(jìn)行改造升級成為更加務(wù)實(shí)的選擇,也是“中國制造2025”、德國工業(yè)4.0、美國工業(yè)互聯(lián)網(wǎng)等國家戰(zhàn)略的核心舉措。在此引導(dǎo)下,自主智能系統(tǒng)正成為人工智能的重要發(fā)展及應(yīng)用方向。例如,沈陽機(jī)床以i5智能機(jī)床為核心,打造了若干智能工廠,實(shí)現(xiàn)了“設(shè)備互聯(lián)、數(shù)據(jù)互換、過程互動、產(chǎn)業(yè)互融”的智能制造模式。

5、人機(jī)協(xié)同正在催生新型混合智能形態(tài)

人類智能在感知、推理、歸納和學(xué)習(xí)等方面具有機(jī)器智能無法比擬的優(yōu)勢,機(jī)器智能則在搜索、計(jì)算、存儲、優(yōu)化等方面領(lǐng)先于人類智能,兩種智能具有很強(qiáng)的互補(bǔ)性。人與計(jì)算機(jī)協(xié)同,互相取長補(bǔ)短將形成一種新的“1+1>2”的增強(qiáng)型智能,也就是混合智能,這種智能是一種雙向閉環(huán)系統(tǒng),既包含人,又包含機(jī)器組件。其中人可以接受機(jī)器的信息,機(jī)器也可以讀取人的信號,兩者相互作用,互相促進(jìn)。在此背景下,人工智能的根本目標(biāo)已經(jīng)演進(jìn)為提高人類智力活動能力,更智能地陪伴人類完成復(fù)雜多變的任務(wù)。

新一代人工智能技術(shù)框架

與早期人工智能相比,新一代人工智能正在全新信息環(huán)境、海量數(shù)據(jù)基礎(chǔ)和持續(xù)演進(jìn)、不斷豐富的戰(zhàn)略目標(biāo)的引領(lǐng)下,依托于云計(jì)算、大數(shù)據(jù)兩大基礎(chǔ)平臺和機(jī)器學(xué)習(xí)、模式識別和人機(jī)交互三大通用技術(shù),以新型計(jì)算架構(gòu)、通用人工智能和開源生態(tài)系統(tǒng)為主要導(dǎo)向,持續(xù)搭建和完善技術(shù)框架體系,不斷逼近技術(shù)奇點(diǎn),深刻變革人類生產(chǎn)生活。

(一)新一代人工智能的技術(shù)演進(jìn)

1、從原有的CPU架構(gòu),轉(zhuǎn)變?yōu)镚PU并行運(yùn)算架構(gòu)深

度學(xué)習(xí)算法運(yùn)行于CPU架構(gòu)的指令需求過于復(fù)雜。

機(jī)器學(xué)習(xí)領(lǐng)域的泰斗杰弗里·辛頓開啟了深度學(xué)習(xí)在人工智能領(lǐng)域研究的浪潮,大數(shù)據(jù)技術(shù)帶來的數(shù)據(jù)洪流滿足了深度學(xué)習(xí)算法對于訓(xùn)練數(shù)據(jù)量的要求,但是算法的實(shí)現(xiàn)還需要更快更強(qiáng)大的處理器予以支撐。傳統(tǒng)的主流CPU架構(gòu)如X86、ARM等往往需要數(shù)百甚至上千條指令才能完成一個神經(jīng)元的處理,對于并不需要太多的程序指令,卻需要海量數(shù)據(jù)運(yùn)算的深度學(xué)習(xí)的計(jì)算需求,并不能很好地匹配與適應(yīng)。

GPU架構(gòu)具備與深度學(xué)習(xí)相匹配的并行運(yùn)算能力。GPU(圖形處理器)最初是個人電腦、工作站、游戲機(jī)和一些移動設(shè)備上運(yùn)行繪圖運(yùn)算工作的微處理器,可以快速處理圖像上的每一個像素點(diǎn),其海量數(shù)據(jù)并行運(yùn)算的能力與深度學(xué)習(xí)需求非常符合。當(dāng)前主流的CPU只有4核或者8核,可以模擬出12個處理線程來進(jìn)行運(yùn)算,但是普通級別的GPU就包含了成百上千個處理單元,高端的甚至更多,這對于多媒體計(jì)算中大量的重復(fù)處理過程有著天生的優(yōu)勢。吳恩達(dá)教授領(lǐng)導(dǎo)的谷歌大腦研究工作結(jié)果表明,12顆英偉達(dá)(Nvidia)公司的GPU可以提供相當(dāng)于2000顆CPU的深度學(xué)習(xí)性能,為技術(shù)的發(fā)展帶來了實(shí)質(zhì)性飛躍,被廣泛應(yīng)用于全球各大主流深度學(xué)習(xí)開發(fā)機(jī)構(gòu)與研究院所。

2、從單一算法驅(qū)動,轉(zhuǎn)變?yōu)閿?shù)據(jù)、運(yùn)算力、算法復(fù)合驅(qū)動

缺少數(shù)據(jù)支撐與運(yùn)算力保證的算法驅(qū)動模式難以持續(xù)發(fā)展。人工智能發(fā)展以實(shí)現(xiàn)計(jì)算智能為重要研究方向,充分利用現(xiàn)代高性能計(jì)算機(jī)的快速計(jì)算和記憶存儲能力,設(shè)計(jì)出神經(jīng)計(jì)算、模糊計(jì)算和進(jìn)化計(jì)算等求解算法,解決優(yōu)化篩選、單點(diǎn)搜索、邏輯推理等實(shí)際應(yīng)用問題。盡管深度學(xué)習(xí)概念和淺層學(xué)習(xí)算法已經(jīng)被提出多年,但是一直進(jìn)展緩慢,究其原因是缺乏海量的數(shù)據(jù)積累和與之相匹配的高水平計(jì)算能力,無法對算法模型進(jìn)行持續(xù)的改進(jìn)與優(yōu)化,只停留在理論研究階段,距離實(shí)際應(yīng)用存在不小的差距。

數(shù)據(jù)、運(yùn)算力和算法復(fù)合驅(qū)動模式引發(fā)人工智能爆發(fā)式增長。與早期人工智能相比,新一代人工智能體現(xiàn)出數(shù)據(jù)、運(yùn)算力和算法相互融合、優(yōu)勢互補(bǔ)的良好特點(diǎn)。數(shù)據(jù)方面,人類進(jìn)入互聯(lián)網(wǎng)時(shí)代后,數(shù)據(jù)技術(shù)高速發(fā)展,各類數(shù)據(jù)資源不斷積累,為人工智能的訓(xùn)練學(xué)習(xí)過程奠定了良好的基礎(chǔ)。運(yùn)算力方面,摩爾定律仍在持續(xù)發(fā)揮效用,計(jì)算系統(tǒng)的硬件性能逐年提升,云計(jì)算、并行計(jì)算、網(wǎng)格計(jì)算等新型計(jì)算方式的出現(xiàn)拓展了現(xiàn)代計(jì)算機(jī)性能,獲得更快的計(jì)算速度。算法方面,伴隨著深度學(xué)習(xí)技術(shù)的不斷成熟,運(yùn)算模型日益優(yōu)化,智能算法不斷更新,提升了模型辨識解析的準(zhǔn)確度。

3、從封閉的單機(jī)系統(tǒng),轉(zhuǎn)變?yōu)榭旖蒽`活的開源框架

專家系統(tǒng)本地化特性限制了人工智能發(fā)展步伐。以往的人工智能專家系統(tǒng)是基于本地化專業(yè)知識進(jìn)行設(shè)計(jì)開發(fā),以知識庫和推理機(jī)為中心而展開,推理機(jī)設(shè)計(jì)內(nèi)容由不同的專家系統(tǒng)應(yīng)用環(huán)境決定,單獨(dú)設(shè)定模型函數(shù)與運(yùn)算機(jī)制,一般不具備通用性。同時(shí),知識庫是開發(fā)者收集錄入的專家分析模型與案例的資源集合,只能夠在單機(jī)系統(tǒng)環(huán)境下使用且無法連接網(wǎng)絡(luò),升級更新較為不便。

開源框架推動構(gòu)建人工智能行業(yè)解決方案。人工智能系統(tǒng)的開發(fā)工具日益成熟,通用性較強(qiáng)且各具特色的開源框架不斷涌現(xiàn),如谷歌的TensorFlow、Facebook的Torchnet、百度的PaddlePaddle等,其共同特點(diǎn)均是基于Linux生態(tài)系統(tǒng),具備分布式深度學(xué)習(xí)數(shù)據(jù)庫和商業(yè)級即插即用功能,能夠在GPU上較好地繼承Hadoop和Spark架構(gòu),廣泛支持Python、Java、Scala、R等流行開發(fā)語言,與硬件結(jié)合生成各種應(yīng)用場景下的人工智能系統(tǒng)與解決方案。

4、從學(xué)術(shù)研究探索導(dǎo)向,轉(zhuǎn)變?yōu)榭焖俚膶?shí)踐應(yīng)用導(dǎo)向

學(xué)術(shù)導(dǎo)向難以滿足復(fù)雜數(shù)據(jù)信息背景下的創(chuàng)新需求。隨著人工智能的不斷發(fā)展,分化產(chǎn)生了不同的學(xué)術(shù)流派,以符號主義、聯(lián)結(jié)主義、進(jìn)化主義、貝葉斯學(xué)派、類推學(xué)派等為典型。不同學(xué)派按照各自對人工智能領(lǐng)域基本理論、研究方法和技術(shù)路線的理解,以學(xué)術(shù)研究為目的進(jìn)行探索實(shí)踐,一定程度上推動了人工智能理論與技術(shù)的發(fā)展。在如今數(shù)據(jù)環(huán)境改變和信息環(huán)境變化的背景下,現(xiàn)實(shí)世界結(jié)構(gòu)趨向復(fù)雜,單純依靠課題立項(xiàng)和學(xué)術(shù)研究無法持續(xù)推動人工智能滿足當(dāng)前現(xiàn)實(shí)世界的模擬與互動需求,快速變化的應(yīng)用環(huán)境也容易導(dǎo)致理論研究與實(shí)際應(yīng)用相脫節(jié),影響人工智能技術(shù)對經(jīng)濟(jì)發(fā)展和社會進(jìn)步的積極拉動作用。

快速迭代的實(shí)踐應(yīng)用導(dǎo)向加速形成技術(shù)發(fā)展正循環(huán)。目前,人工智能圍繞醫(yī)療、金融、交通、教育、零售等數(shù)據(jù)較集中且質(zhì)量較高的行業(yè)的實(shí)踐需求,在算法模型、圖像識別、自然語言處理等方面將持續(xù)出現(xiàn)迭代式的技術(shù)突破,在深度應(yīng)用中支撐人工智能實(shí)現(xiàn)“數(shù)據(jù)-技術(shù)-產(chǎn)品-用戶”的往復(fù)正循環(huán),由學(xué)術(shù)驅(qū)動向應(yīng)用拉動轉(zhuǎn)化。在人工智能技術(shù)準(zhǔn)備期,由于提供數(shù)據(jù)支撐較少,技術(shù)提升度慢,一旦進(jìn)入應(yīng)用期,大量的優(yōu)質(zhì)數(shù)據(jù)有助于分析技術(shù)弊端,通過對相關(guān)技術(shù)進(jìn)行改進(jìn)升級,提升了產(chǎn)品的應(yīng)用水平,用戶在得到更好的產(chǎn)品體驗(yàn)后,繼續(xù)為應(yīng)用平臺創(chuàng)造了更大規(guī)模的后臺數(shù)據(jù),用來進(jìn)行下一步的技術(shù)升級與產(chǎn)品改良,由此進(jìn)入了大規(guī)模應(yīng)用階段。在技術(shù)快速迭代發(fā)展的過程中,數(shù)據(jù)累積和大規(guī)模應(yīng)用起到了至關(guān)重要的作用,能夠持續(xù)推動人工智能技術(shù)實(shí)現(xiàn)自我超越。

(二)新一代人工智能技術(shù)體系

 新一代人工智能技術(shù)體系由基礎(chǔ)技術(shù)平臺和通用技術(shù)體系構(gòu)成,其中基礎(chǔ)技術(shù)平臺包括云計(jì)算平臺與大數(shù)據(jù)平臺,通用技術(shù)體系包括機(jī)器學(xué)習(xí)、模式識別與人機(jī)交互。在此技術(shù)體系的基礎(chǔ)上,人工智能技術(shù)不斷創(chuàng)新發(fā)展,應(yīng)用場景和典型產(chǎn)品不斷涌現(xiàn)。

1、云計(jì)算:基礎(chǔ)的資源整合交互平臺

云計(jì)算主要共性技術(shù)包括虛擬化技術(shù)、分布式技術(shù)、計(jì)算管理技術(shù)、云平臺技術(shù)和云安全技術(shù),具備實(shí)現(xiàn)資源快速部署和服務(wù)獲取、進(jìn)行動態(tài)可伸縮擴(kuò)展及供給、面向海量信息快速有序化處理、可靠性高、容錯能力強(qiáng)等特點(diǎn),為人工智能的發(fā)展提供了資源整合交互的基礎(chǔ)平臺。尤其與大數(shù)據(jù)技術(shù)結(jié)合,為當(dāng)前受到最多關(guān)注的深度學(xué)習(xí)技術(shù)搭建了強(qiáng)大的存儲和運(yùn)算體系架構(gòu),促進(jìn)了神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練優(yōu)化過程,顯著提高語音、圖片、文本等辨識對象的識別率。

2、大數(shù)據(jù):提供豐富的分析、訓(xùn)練與應(yīng)用資源

大數(shù)據(jù)主要共性技術(shù)包括采集與預(yù)處理、存儲與管理、計(jì)算模式與系統(tǒng)、分析與挖掘、可視化計(jì)算及隱私及安全等,具備數(shù)據(jù)規(guī)模不斷擴(kuò)大、種類繁多、產(chǎn)生速度快、處理能力要求高、時(shí)效性強(qiáng)、可靠性要求嚴(yán)格、價(jià)值大但密度較低等特點(diǎn),為人工智能提供豐富的數(shù)據(jù)積累和價(jià)值規(guī)律,引發(fā)分析需求。同時(shí),從跟蹤靜態(tài)數(shù)據(jù)到結(jié)合動態(tài)數(shù)據(jù),可以推動人工智能根據(jù)客觀環(huán)境變化進(jìn)行相應(yīng)的改變和適應(yīng),持續(xù)提高算法的準(zhǔn)確性與可靠性。

3、機(jī)器學(xué)習(xí):持續(xù)引導(dǎo)機(jī)器智能水平提升

機(jī)器學(xué)習(xí)指通過數(shù)據(jù)和算法在機(jī)器上訓(xùn)練模型,并利用模型進(jìn)行分析決策與行為預(yù)測的過程。機(jī)器學(xué)習(xí)技術(shù)體系主要包括監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí),目前廣泛應(yīng)用在專家系統(tǒng)、認(rèn)知模擬、數(shù)據(jù)挖掘、圖像識別、故障診斷、自然語言理解、機(jī)器人和博弈等領(lǐng)域。機(jī)器學(xué)習(xí)作為人工智能最為重要的通用技術(shù),未來將持續(xù)引導(dǎo)機(jī)器獲取新的知識與技能,重新組織整合已有知識結(jié)構(gòu),有效提升機(jī)器智能化水平,不斷完善機(jī)器服務(wù)決策能力。

4、模式識別:從感知環(huán)境和行為到基于認(rèn)知的決策

模式識別是對各類目標(biāo)信息進(jìn)行處理分析,進(jìn)而完成描述、辨認(rèn)、分類和解釋的過程。模式識別技術(shù)體系包括決策理論、句法分析和統(tǒng)計(jì)模式等,目前廣泛應(yīng)用在語音識別、指紋識別、人臉識別、手勢識別、文字識別、遙感和醫(yī)學(xué)診斷等領(lǐng)域。隨著理論基礎(chǔ)和實(shí)際應(yīng)用研究范圍的不斷擴(kuò)大,模式識別技術(shù)將與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合,由目前單純的環(huán)境感知進(jìn)化為認(rèn)知決策,同時(shí)量子計(jì)算技術(shù)也將用于未來模式識別研究工作,助力模式識別技術(shù)突破與應(yīng)用領(lǐng)域拓展。

5、人機(jī)交互:支撐實(shí)現(xiàn)人機(jī)物交叉融合與協(xié)同互動

人機(jī)交互技術(shù)賦予機(jī)器通過輸出或顯示設(shè)備對外提供有關(guān)信息的能力,同時(shí)可以讓用戶通過輸入設(shè)備向機(jī)器傳輸反饋信息達(dá)到交互目的。人機(jī)交互技術(shù)體系包括交互設(shè)計(jì)、可用性分析評估、多通道交互、群件、移動計(jì)算等,目前廣泛應(yīng)用在地理空間跟蹤、動作識別、觸覺交互、眼動跟蹤、腦電波識別等領(lǐng)域。隨著交互方式的不斷豐富以及物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,未來肢體識別和生物識別技術(shù)將逐漸取代現(xiàn)有的觸控和密碼系統(tǒng),人機(jī)融合將向人機(jī)物交叉融合進(jìn)化發(fā)展,帶來信息技術(shù)領(lǐng)域的深刻變革。

(三)國內(nèi)外技術(shù)對比分析

1、發(fā)達(dá)國家基礎(chǔ)平臺布局完善,國內(nèi)仍缺乏自主核心技術(shù)。

國外企業(yè)技術(shù)領(lǐng)先且大量布局公有云業(yè)務(wù)領(lǐng)域,大數(shù)據(jù)業(yè)務(wù)經(jīng)驗(yàn)成熟、分工明確且數(shù)據(jù)開放程度較高。云計(jì)算方面,國外云計(jì)算企業(yè)基礎(chǔ)技術(shù)相對領(lǐng)先,服務(wù)器虛擬化、網(wǎng)絡(luò)技術(shù)(SDN)、存儲技術(shù)、分布式計(jì)算、OS、開發(fā)語言和平臺等核心技術(shù)基本上都掌握在少數(shù)國外公司手中,憑借著強(qiáng)大的創(chuàng)新和資本轉(zhuǎn)化能力,有能力支持技術(shù)不斷推陳出新。同時(shí),國外企業(yè)在細(xì)分領(lǐng)域都有所布局,形成了完善的產(chǎn)業(yè)鏈配合,提供各種解決方案的集成,可以滿足多場景使用要求。大數(shù)據(jù)方面,國外公司在大數(shù)據(jù)技術(shù)各個領(lǐng)域方面分工明確,有的專注于數(shù)據(jù)挖掘,有的專注于數(shù)據(jù)清洗,也有的專注于數(shù)據(jù)存儲與管理。同時(shí),國外從事大數(shù)據(jù)技術(shù)研發(fā)的企業(yè)有很大一部分是由傳統(tǒng)的數(shù)據(jù)公司轉(zhuǎn)型而來,如IBM、甲骨文(Oracle)、易安信(EMC,2015年10月被戴爾公司收購)等,這類公司在大數(shù)據(jù)概念興起之前就早已充分接觸數(shù)據(jù)領(lǐng)域業(yè)務(wù),在數(shù)據(jù)科學(xué)領(lǐng)域有較強(qiáng)的研發(fā)能力。國外數(shù)據(jù)保護(hù)制度相對完善,數(shù)據(jù)開放標(biāo)準(zhǔn)成熟,為大數(shù)據(jù)技術(shù)研發(fā)提供了良好的外部環(huán)境。

國內(nèi)企業(yè)自主核心技術(shù)有待提高,數(shù)據(jù)開放程度偏低且缺乏必要的保護(hù)。云計(jì)算方面,國內(nèi)雖然有阿里、華為、新華三、易華錄等一批科技公司大力投入研發(fā)資源,但核心技術(shù)積累依然不足,難以主導(dǎo)產(chǎn)業(yè)鏈發(fā)展。大數(shù)據(jù)方面,國內(nèi)企業(yè)仍處于“跟風(fēng)”國外企業(yè)的發(fā)展階段,在數(shù)據(jù)服務(wù)內(nèi)核等方面缺乏積淀與經(jīng)驗(yàn),未能完全實(shí)現(xiàn)從IT領(lǐng)域向DT(數(shù)據(jù)技術(shù))領(lǐng)域的轉(zhuǎn)型。同時(shí),國內(nèi)數(shù)據(jù)應(yīng)用環(huán)境相對封閉,政府公共數(shù)據(jù)開放程度較低,數(shù)據(jù)安全保護(hù)等級有待提高,數(shù)據(jù)安全風(fēng)險(xiǎn)評估制度與保障體系有待完善,對大數(shù)據(jù)技術(shù)的升級發(fā)展形成了一定的限制因素。

2、發(fā)達(dá)國家在機(jī)器學(xué)習(xí)和人機(jī)交互領(lǐng)域具備先發(fā)優(yōu)勢,國內(nèi)企業(yè)存在技術(shù)差距與人才短板。

國外機(jī)構(gòu)發(fā)力機(jī)器學(xué)習(xí)主流開源框架,積極開發(fā)人機(jī)交互下一代新型技術(shù)。機(jī)器學(xué)習(xí)方面,目前較為流行的開源框架基本都為國外公司或機(jī)構(gòu)所開發(fā),例如TensorFlow、Torchnet、Caffe、DMTK、SystemML等,同時(shí)注重大數(shù)據(jù)、云計(jì)算等基礎(chǔ)支撐信息技術(shù)對機(jī)器學(xué)習(xí)研究的促進(jìn)作用,以及機(jī)器學(xué)習(xí)的應(yīng)用實(shí)踐,已進(jìn)入研發(fā)穩(wěn)定階段。人機(jī)交互方面,國外技術(shù)企業(yè)基于觸控技術(shù)、可穿戴設(shè)備、物聯(lián)網(wǎng)和車聯(lián)網(wǎng)的發(fā)展基礎(chǔ),正在積極開發(fā)性價(jià)比更高的下一代人機(jī)交互新型技術(shù),以對現(xiàn)有產(chǎn)品進(jìn)行升級并降低成本。

國內(nèi)機(jī)器學(xué)習(xí)基礎(chǔ)理論體系尚不成熟,缺乏人機(jī)交互專業(yè)領(lǐng)域人才培養(yǎng)環(huán)境。機(jī)器學(xué)習(xí)方面,盡管國內(nèi)學(xué)者在數(shù)據(jù)挖掘?qū)用嫒〉昧艘欢ǖ难芯砍煽儯珜τ跈C(jī)器學(xué)習(xí)的底層技術(shù)、實(shí)現(xiàn)原理及應(yīng)用方法缺乏足夠的重視,導(dǎo)致關(guān)鍵技術(shù)環(huán)節(jié)缺失與重要領(lǐng)域邊緣化,不利于在國際主流機(jī)器學(xué)習(xí)技術(shù)角逐中展開有效競爭。人機(jī)交互方面,研究者需要具備數(shù)學(xué)、計(jì)算機(jī)學(xué)和心理學(xué)等相關(guān)背景,復(fù)合型較強(qiáng),相比于國外高校都設(shè)立單獨(dú)的人機(jī)交互專業(yè),國內(nèi)高校開設(shè)的專業(yè)相對傳統(tǒng),缺乏交叉復(fù)合型人才的培養(yǎng)機(jī)制,亟需建立人機(jī)交互領(lǐng)域技術(shù)人才培養(yǎng)的良好環(huán)境。

3、國內(nèi)外模式識別研究水平基本處于同一起跑線,重點(diǎn)聚焦于語音識別與圖像識別。

國內(nèi)外研究領(lǐng)域基本一致,圍繞前沿技術(shù)領(lǐng)域開展持續(xù)創(chuàng)新。目前,國內(nèi)外企業(yè)均在圍繞模式識別領(lǐng)域的基礎(chǔ)理論、圖像處理、計(jì)算機(jī)視覺以及語音信息處理展開集中研究,探索模式識別機(jī)理以及有效計(jì)算方法,為解決應(yīng)用實(shí)踐問題提供關(guān)鍵技術(shù)。國外科技公司在模式識別各領(lǐng)域擁有多年的技術(shù)積累,深入語音合成、生物認(rèn)證分析、計(jì)算機(jī)視覺等前沿技術(shù)領(lǐng)域,具備原創(chuàng)性技術(shù)突破能力;國內(nèi)企業(yè)在模式識別前沿技術(shù)研發(fā)方面與國外同行處于并跑狀態(tài),除百度、訊飛等行業(yè)龍頭外,眾多初創(chuàng)公司也加入了模式識別研究的技術(shù)與應(yīng)用創(chuàng)新,催生了一批有創(chuàng)意的新型產(chǎn)品。

語音識別和圖像識別準(zhǔn)確率明顯提升,國內(nèi)企業(yè)中文語音識別技術(shù)相對領(lǐng)先。國內(nèi)外企業(yè)均致力于提高語音識別和圖像識別準(zhǔn)確率,谷歌和微軟分別表示旗下的語音識別產(chǎn)品技術(shù)出錯率已降至8%和6.3%,微軟研究院開發(fā)的圖像識別系統(tǒng)在世界著名的圖片識別競賽ImageNet中獲得多個類別評比的第一名,為下一步的商業(yè)化應(yīng)用奠定了良好基礎(chǔ)。同時(shí),國內(nèi)企業(yè)重點(diǎn)突破中文語音識別技術(shù),搜狗、百度和科大訊飛三家公司各自宣布旗下的中文語音產(chǎn)品識別準(zhǔn)確率達(dá)到了97%,處于業(yè)內(nèi)領(lǐng)先水平。

中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(m.u63ivq3.com)獨(dú)家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時(shí)須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0