人工智能三大推動力:技術(shù)是源動力,應(yīng)用是牽引力,安全是信任力
1)趨勢一 統(tǒng)一未來:多模態(tài)模型加速文本、圖像和視頻融合
多模態(tài)模型:多模態(tài)模型能夠處理視覺信息、文本信息、聽覺信息等多元化數(shù)據(jù),可以對不同表現(xiàn)形式的信息進(jìn)行融合理解,進(jìn)一步提升大模型的遷移學(xué)習(xí)能力,是人工智能全面理解真實(shí)世界的重要一步。
發(fā)展情況:文本、語音、等單模態(tài)人工智能模型已經(jīng)相對成熟,大模型正在朝著多模態(tài)信息融合的方向快速發(fā)展。從CLIP的誕生再到GPT-4的圖像處理能力,圖文多模態(tài)技術(shù)已經(jīng)取得了顯著的進(jìn)步。大模型不止?jié)M足文字和圖像,開始向著音頻、視頻等領(lǐng)域拓展。
未來展望:未來模型將面對更加復(fù)雜多樣化的交互場景,更加注重各種形式的信息融合,多模態(tài)技術(shù)將在智能家居、智慧城市、醫(yī)療診斷、自動駕駛等方面打開全新的應(yīng)用空間。
多模態(tài)模型迭代歷程
2)趨勢二 逾越虛擬邊界:具身智能成為AI發(fā)展新形態(tài)
具身智能:具身智能是可以和物理世界進(jìn)行感知交互,并具有自主決策和行動能力的人工智能系統(tǒng)。具身智能中的智能體能夠以主人公的視角感受物理世界,通過與環(huán)境產(chǎn)生交互并結(jié)合自我學(xué)習(xí),從而產(chǎn)生對于客觀世界的理解和改造能力。
發(fā)展情況:斯坦福大學(xué)教授李飛飛將具身智能列為計(jì)算機(jī)視覺未來的關(guān)鍵發(fā)展方向,并將其稱之為人工智能研究的“北極星”?,F(xiàn)階段來看,谷歌推出RoboCat大模型,英偉達(dá)推出Nvidia VIMA,具身智能已經(jīng)成為AI龍頭企業(yè)競相爭奪的高地。
未來展望:通用人工智能與機(jī)器人產(chǎn)業(yè)正處在快速發(fā)展、互相融合促進(jìn)的戰(zhàn)略機(jī)遇期,作為兩大領(lǐng)域交叉的核心應(yīng)用,具身智能有望在未來取得快速發(fā)展。具身智能將促使智能體具備自主規(guī)劃、決策、行動、執(zhí)行等能力,實(shí)現(xiàn)人工智能的能力進(jìn)階。
人工智能能力進(jìn)階
3)趨勢三 大模型智慧火花:走向通用人工智能的途徑愈發(fā)明晰,腦機(jī)接口創(chuàng)造新的交互方式
通用人工智能(AGI)是指具有像人類一樣的思考能力,可以適應(yīng)廣泛的領(lǐng)域并解決多種問題的機(jī)器智能,AGI是人工智能研究的重要目標(biāo)之一。狹義人工智能是指當(dāng)下已取得顯著進(jìn)展但局限特定領(lǐng)域的人工智能,如語音識別、機(jī)器視覺等。我們正處于狹義人工智能相對成熟、通用人工智能曙光乍現(xiàn)的階段,目前以GPT-4為代表的自然語言大模型被認(rèn)為是通往通用人工智能的重要潛在路徑,OpenAICEO薩姆·奧特曼(Sam Altman) 表示,AGI時代可能很快就會到來,未來十年內(nèi)行業(yè)可能會擁有超強(qiáng)的AI系統(tǒng)。
人類與人工智能之間的溝通方式也在不斷升級,腦機(jī)接口有望成為下一代人機(jī)交互方式。當(dāng)前,腦機(jī)接口技術(shù)正在突破人類的生理界限,不僅為殘障人士提供了前所未有的可能性,而且有望成為下一代的人機(jī)交互方式。
4)趨勢四 數(shù)據(jù)的力量:海量數(shù)據(jù)帶來模型能力涌現(xiàn),高質(zhì)量數(shù)據(jù)提升模型性能
深度學(xué)習(xí)的進(jìn)步建立在以更大的模型處理海量數(shù)據(jù)基礎(chǔ)之上。GPT-1模型從1.17億參數(shù)上升至GPT-3的1750億參數(shù),模型效果取得了顯著突破,同時還有能力的涌現(xiàn)。但是模型參數(shù)量的增大帶來算力需求的激增,模型架構(gòu)和參數(shù)量提升帶來的收益正處于遞減狀態(tài)。
阿伯丁大學(xué)、麻省理工大學(xué)等研究機(jī)構(gòu)的一項(xiàng)研究顯示,高質(zhì)量的語言數(shù)據(jù)將在2026年耗盡,低質(zhì)量的語言數(shù)據(jù)和圖像數(shù)據(jù)將分別在2030 -2050年、2030 -2060年間枯竭。
以數(shù)據(jù)為中心的人工智能更加專注于數(shù)據(jù)的價值,進(jìn)一步推動AI模型的性能突破。斯坦福大學(xué)吳恩達(dá)教授提出二八定律:80%的數(shù)據(jù)+20%的模型=更好的AI。以數(shù)據(jù)為中心的策略可以解決數(shù)據(jù)樣本不足、數(shù)據(jù)偏差等問題,高質(zhì)量數(shù)據(jù)集成為推動模型性能進(jìn)一步提升的關(guān)鍵要素,高質(zhì)量的數(shù)據(jù)處理、數(shù)據(jù)標(biāo)注服務(wù)以及完善的數(shù)據(jù)收集和評估體系的價值將進(jìn)一步凸顯。
5)趨勢五 數(shù)據(jù)中心的AI變革:智算中心成為關(guān)鍵基礎(chǔ)設(shè)施
云計(jì)算是當(dāng)前重要的AI算力提供方案,AI服務(wù)器市場獲得迅猛發(fā)展。根據(jù)TrendForce數(shù)據(jù),2022年全球AI服務(wù)器的出貨量占整體服務(wù)器比重約1%,隨著大模型訓(xùn)練側(cè)和推理側(cè)的需求爆發(fā),AI算力資源需求預(yù)計(jì)將呈指數(shù)增長。根據(jù)IDC數(shù)據(jù),預(yù)計(jì)未來5年中國智能算力規(guī)模的年復(fù)合增長率將達(dá)52.3%,全球價值萬億美金的數(shù)據(jù)中心存量市場將從通用計(jì)算逐步過渡向AI計(jì)算。
云計(jì)算正從CPU為中心的同構(gòu)計(jì)算架構(gòu)向以CPU+GPU/NPU為中心的異構(gòu)計(jì)算架構(gòu)深度演進(jìn)。預(yù)計(jì),大模型帶來的GPU存量空間將從2023年的277億美金上升至2025年的1121億美金,以GPU為代表的AI計(jì)算資源中短期將處于供不應(yīng)求的狀態(tài)。
隨著專有領(lǐng)域的計(jì)算需求提升,AI芯片追求更高的性能和更低的功耗,芯片的多樣性和生態(tài)豐富性將不斷提升。部分頭部互聯(lián)網(wǎng)廠商將著力推進(jìn)AI芯片的自主研發(fā),如谷歌著力打造專注深度學(xué)習(xí)的TPU,同時不斷豐富其AI生態(tài)布局。
6)趨勢六 大模型C端角色:個人智能助理與新一代的流量入口
大語言模型將成為個人智能助理。大模型目前具備接入互聯(lián)網(wǎng)、進(jìn)行內(nèi)存管理等能力,通過目標(biāo)任務(wù)自動拆分、計(jì)劃制定、計(jì)劃實(shí)施等方式,能夠自主完成用戶的需求,成為每個人的智能助理,如制定旅行計(jì)劃并進(jìn)一步預(yù)定賓館和餐飲。
大模型正在成為新一代的流量入口。GPT-4正在逐步開放插件功能,通過底層模型連接第三方應(yīng)用,從而構(gòu)建豐富的生態(tài)系統(tǒng)。GPT-4自插件功能開放以來,目前已經(jīng)接入超過500個插件(其中包括教育、金融等場景)。隨著大模型能力的不斷增強(qiáng)以及插件生態(tài)的不斷豐富,大模型有望成為新一代的人機(jī)交互方式以及流量入口,2023年5月OpenAI官網(wǎng)訪問量為18.6億次,是全球第19名次的互聯(lián)網(wǎng)訪問IP。
GPT-4構(gòu)建豐富的應(yīng)用生態(tài)
7)趨勢七 大模型B端應(yīng)用:專業(yè)數(shù)據(jù)與成本驅(qū)動行業(yè)模型百花齊放,打開廣闊應(yīng)用空間
數(shù)據(jù)壁壘帶來企業(yè)端大模型百花齊放。通用大模型可以幫助用戶解決一般性問題,而當(dāng)企業(yè)需要處理其特定行業(yè)的數(shù)據(jù)和任務(wù)時,往往需要針對其行業(yè)數(shù)據(jù)庫來對基本模型進(jìn)行微調(diào),垂直行業(yè)的特性和需求不盡相同,因此大模型的應(yīng)用也呈現(xiàn)出多樣化的趨勢。
B端應(yīng)用出于對模型的經(jīng)濟(jì)性考量,未來將呈現(xiàn)階梯式、差異性需求。大模型在垂直領(lǐng)域的商業(yè)化落地對模型的運(yùn)行成本更為敏感,模型的推理成本與模型的參數(shù)量多少密切相關(guān),需要不同參數(shù)規(guī)模的大模型組成多層次的產(chǎn)品組合,從而在不同場景下實(shí)現(xiàn)最佳的經(jīng)濟(jì)性,進(jìn)一步提升大模型的豐富度。
B端大模型多層級結(jié)構(gòu)
8)趨勢八 大模型輕量化:降低應(yīng)用成本、帶動端側(cè)算力發(fā)展
隨著大模型小型化、場景化需求增加,同時出于對AI應(yīng)用的經(jīng)濟(jì)性、可靠性和安全性考量,部分場景的推理將逐步從云側(cè)擴(kuò)展向端側(cè),帶動端側(cè)算力需求的進(jìn)一步提升。
目前多個大模型都已推出“小型化”和“場景化”版本。5月23日谷歌發(fā)布的PaLM-2大模型,其中最輕量版本“壁虎”可在移動端運(yùn)行,運(yùn)行速度快且支持離線操作,其他多個大模型也都有其對應(yīng)的小參數(shù)版本。
大模型端側(cè)應(yīng)用布局不斷加速。端側(cè)算力正在快速發(fā)展過程中,高通通過量化、編譯和硬件加速進(jìn)行優(yōu)化,使Stable Diffusion能在搭載第二代驍龍8移動平臺的手機(jī)上運(yùn)行。高通在微軟Build2023開發(fā)者大會上展示了最新的端側(cè)AI能力以及在下一代Windows 11上開發(fā)生成式AI的工具,并表示未來幾個月大語言模型有望在端側(cè)運(yùn)行。
9)趨勢九 大模型的深遠(yuǎn)影響:重構(gòu)勞動力市場、改寫科研范式
大語言模型對勞動力市場結(jié)構(gòu)的影響深遠(yuǎn)而復(fù)雜。據(jù)OpenAI聯(lián)合賓夕法尼亞大學(xué)的研究報告預(yù)測,約80%的美國勞動力可能有至少10%的工作受到大語言模型的影響。
大語言模型的應(yīng)用帶來勞動力市場結(jié)構(gòu)的調(diào)整和變化。短期而言,大語言模型可能替代部分低技能或重復(fù)性工作;中期來看,大語言模型也將創(chuàng)造新的人工智能相關(guān)就業(yè)機(jī)會;長期來看,大語言模型的應(yīng)用將會深度改變各行業(yè)的工作模式和商業(yè)模式,讓企業(yè)的組織架構(gòu)更加扁平化和小型化。過程中需要個人和企業(yè)去積極適應(yīng),發(fā)展人類獨(dú)有的創(chuàng)新、協(xié)作和社交等能力,與人工智能共同進(jìn)化。
AI與前沿科學(xué)的結(jié)合展現(xiàn)出了巨大潛力,可顯著降低前沿科技研究中的智力成本并提升研究效率。生命科學(xué)、氣象預(yù)測、數(shù)學(xué)、分子動力學(xué)等前沿科學(xué)均得到了人工智能的廣泛助力,AI for Science將帶來科研范式的變革和新的產(chǎn)業(yè)形態(tài)。
10)趨勢十 AI治理與技術(shù)的平衡:AI可解釋性亟待增強(qiáng),監(jiān)管緊迫性日益凸顯
在人工智能的快速發(fā)展中,加強(qiáng)AI監(jiān)管與推動AI技術(shù)的進(jìn)步同等重要。AI能力帶來應(yīng)用的便利性,同時也可能引發(fā)數(shù)據(jù)隱私、算法偏見、AI倫理等一系列問題。
從技術(shù)角度來看,可以通過可解釋AI等技術(shù)手段增強(qiáng)AI的可信度??山忉孉I使人工智能的決策過程透明化,增加輸出內(nèi)容的可理解性和可信任度,對于構(gòu)建用戶對AI系統(tǒng)的信任、提升系統(tǒng)的有效性、應(yīng)對潛在的倫理問題都至關(guān)重要。
從規(guī)范角度來看,各國政府也都已經(jīng)開始采取行動,制定和執(zhí)行各種AI政策和法規(guī)。4月份,我國網(wǎng)信辦出臺《生成式人工智能服務(wù)管理辦法(征求意見稿)》,明確了生成式人工智能的定義,從明確條件要求、劃定責(zé)任主體、形成問題處理機(jī)制、明晰法律責(zé)任幾個方面為行業(yè)劃定底線。
人工智能相關(guān)法案