AI既是數(shù)字人的基礎(chǔ),也決定了數(shù)字人能力的天花板。
“百度世界大會(huì)的一大看點(diǎn)正是火出圈、成頂流的數(shù)字人?!?/p>
7月6日,百度世界大會(huì)預(yù)溝通會(huì)上,百度高級(jí)副總裁袁佛玉著重介紹了當(dāng)下數(shù)字人的發(fā)展情況。
讓人印象深刻的是在信息密集、節(jié)奏緊湊的預(yù)溝通會(huì)中,主持人度曉曉始終應(yīng)對(duì)自如,其間“她”還向百度高級(jí)副總裁袁佛玉問(wèn)了一個(gè)關(guān)于自己的問(wèn)題。而在剛剛過(guò)去的6月,度曉曉用40秒鐘時(shí)間完成了40篇高考全國(guó)卷的命題作文,驚艷眾人。就在今天,度曉曉還將直播挑戰(zhàn)上海高考英語(yǔ)作文。
眼下不止是百度在打造數(shù)字人,包括阿里、網(wǎng)易、騰訊、字節(jié)、華為等都推出了類似產(chǎn)品。巨頭下場(chǎng)造“人”不單是具有打造IP的能力,從某種意義上講,數(shù)字人是衡量科技企業(yè)技術(shù)集成與整合能力的標(biāo)尺。
一位業(yè)內(nèi)人士認(rèn)為:“科技公司以IP的方式,全方位呈現(xiàn)各自能力,這背后其實(shí)是各自生態(tài)展示肌肉的表現(xiàn)形式。”
一、數(shù)字人“纏斗”
巨大的市場(chǎng)潛力,是巨頭批量制造數(shù)字人的直接原因。
日前,IDC發(fā)布的報(bào)告顯示,中國(guó)AI數(shù)字人市場(chǎng)規(guī)模呈現(xiàn)高速增長(zhǎng)趨勢(shì),預(yù)計(jì)到2026年將達(dá)102.4億元人民幣。而巨頭推出各種各樣的數(shù)字人,看似雜亂無(wú)章,實(shí)際皆有深層次的考量。
騰訊數(shù)字人的基底是建立在語(yǔ)音智能和大文娛生態(tài)上的。語(yǔ)音智能方面,根據(jù)語(yǔ)義匹配對(duì)應(yīng)動(dòng)作、字詞的能力,是騰訊數(shù)字人在技術(shù)上的底色。此外,微信上的實(shí)時(shí)語(yǔ)音轉(zhuǎn)換與翻譯,所產(chǎn)生的海量數(shù)據(jù),使得其語(yǔ)音會(huì)話能力能夠經(jīng)過(guò)翻譯和轉(zhuǎn)化而持續(xù)生長(zhǎng)。
推動(dòng)騰訊發(fā)布數(shù)字人的動(dòng)因是鞏固大文娛生態(tài)?!霸菩∥?shù)智人平臺(tái)”由播報(bào)數(shù)智人平臺(tái)與交互數(shù)智人平臺(tái)兩個(gè)系統(tǒng)組成。對(duì)應(yīng)的落地場(chǎng)景為手語(yǔ)主播、數(shù)字導(dǎo)游、數(shù)字客服、虛擬IP偶像等虛擬資產(chǎn)。
同樣身處文娛市場(chǎng)的字節(jié)跳動(dòng),雖然在IP與版權(quán)資源上的積累有限,但是通過(guò)連續(xù)不斷地投資與人才引入,一個(gè)AI+XR的軟硬協(xié)同生態(tài)正日益明顯。
塑造IP較為成功的還有阿里,其曾借著冬奧會(huì),推出了自己的數(shù)字人“冬冬”,展示其肌肉。透過(guò)冬冬可以發(fā)現(xiàn),由于AI實(shí)時(shí)驅(qū)動(dòng),數(shù)字人說(shuō)話的同時(shí),能協(xié)調(diào)嘴形、表情、動(dòng)作,乃至模擬真實(shí)環(huán)境下的部分場(chǎng)景。而且采用了面向高質(zhì)量圖形的Unity高清渲染管線(HDRP),因此在視覺(jué)上有著不輸AR/VR的效果。
阿里數(shù)字人早已開(kāi)始直播帶貨,用AI“平替”主播。從邏輯上講,數(shù)字人帶貨能夠解決真人帶貨的種種局限和各類不可預(yù)測(cè)的風(fēng)險(xiǎn)。
AI驅(qū)動(dòng)是百度的數(shù)字人的最大特點(diǎn),靠著硬實(shí)力,截至目前打造了多個(gè)不同面向的IP,如度曉曉、希加加、文夭夭,覆蓋了功能型與演藝型兩個(gè)大類。
百度AI數(shù)字人度曉曉
度曉曉和文夭夭創(chuàng)造了功能型數(shù)字人的兩個(gè)范式。前者能力全面,后者則主要面向垂直領(lǐng)域。度曉曉不單是一個(gè)CG或者問(wèn)答環(huán)節(jié)的數(shù)字人,而是能夠勝任各類創(chuàng)意型工作,能夠作文、作詞、作曲、作畫,開(kāi)辟了一個(gè)AIGC的內(nèi)容生產(chǎn)模式。文夭夭為數(shù)字人運(yùn)營(yíng)細(xì)分領(lǐng)域,打開(kāi)了市場(chǎng),通過(guò)AI技術(shù)為文博領(lǐng)域提供新玩法。
演藝型數(shù)字人希加加,早前在集度汽車發(fā)布會(huì)上亮相,一度驚艷業(yè)內(nèi),百度也成為業(yè)內(nèi)率先嘗試在會(huì)展領(lǐng)域引入數(shù)字人的巨頭。
百度AI數(shù)字人希加加
看得出或許是由于尋求技術(shù)突破的周期長(zhǎng)、難度高,現(xiàn)下大部分廠商皆圍繞自身長(zhǎng)處,推出數(shù)字人。
像網(wǎng)易林幺幺通過(guò)接入AI算法,主要應(yīng)用到電商帶貨中。科大訊飛,雖然沒(méi)有騰訊、網(wǎng)易、阿里那樣強(qiáng)大的圖像處理能力,但是從“冰冰”與“加加”兩個(gè)虛擬IP來(lái)看,其核心還是輸出科大訊飛的語(yǔ)音交互能力。
二、百度整“花活兒”
不難發(fā)現(xiàn),時(shí)下的數(shù)字人更像是一個(gè)載體,要么搭載內(nèi)容與場(chǎng)景,要么搭載各類技術(shù),正是因?yàn)檫@個(gè)原因,巨頭們才不遺余力造“人”。
在梳理之中我們也能看到,無(wú)論是知識(shí)庫(kù)與交互,還是算法與建模,AI都扮演了舉足輕重的角色,不過(guò)分地說(shuō),數(shù)字人的競(jìng)爭(zhēng)本質(zhì)上其實(shí)是AI能力的競(jìng)爭(zhēng)。
而百度可以在短短兩年多時(shí)間內(nèi)接連推出度曉曉、希加加、文夭夭等特點(diǎn)、功能、使用場(chǎng)景截然不同的數(shù)字人IP,表明“AI路線”的潛能。
在今天的百度世界大會(huì)預(yù)溝通會(huì)上,百度高級(jí)副總裁袁佛玉提到,百度AI驅(qū)動(dòng)的數(shù)字人的不同在于“可交互”性,而且還具備創(chuàng)作能力。
把時(shí)間回?fù)艿?020年,那年百度世界大會(huì)上,度曉曉被定義為“智能助理”而首度問(wèn)世,彼時(shí),人們只是感受到了AI原來(lái)并非那么冷冰冰,而是可以有溫度,這顛覆了傳統(tǒng)認(rèn)知中,技術(shù)都是冷冰冰的陳見(jiàn)。
“智能助理”的定位意味著百度需要持續(xù)解決人的各類需求,全方位應(yīng)對(duì)信息輸入、處理、輸出的挑戰(zhàn)。僅僅通過(guò)營(yíng)銷方式制造IP,讓市場(chǎng)接受數(shù)字人,似乎有些追本逐末。事實(shí)上,隨著入局玩家、搭載場(chǎng)景的增加,以及競(jìng)爭(zhēng)走向激烈,市場(chǎng)走過(guò)新奇階段時(shí),技術(shù)能力將起到?jīng)Q定性作用。
數(shù)字人為百度提供了AI技術(shù)落地的場(chǎng)景之一。之所以度曉曉們能夠有極強(qiáng)的互動(dòng)性,與之溝通更絲滑,主要原因在于由文心大模型、AI超寫實(shí)建模所構(gòu)成的AI內(nèi)核。
由于數(shù)據(jù)、算法和算力出現(xiàn)巨大增長(zhǎng),人工智能發(fā)展開(kāi)始轉(zhuǎn)向泛化能力與通用性強(qiáng)的預(yù)訓(xùn)練大模型。在百度文心大模型加持下,數(shù)字人在生產(chǎn)與創(chuàng)意類應(yīng)用中的潛能也得到了釋放。
日前,像度曉曉迅速完成高考作文,以唱作人的身份推出《每分每秒每天》單曲,作出“無(wú)界”系列畫作,表明百度數(shù)字人已經(jīng)具備面向多領(lǐng)域能力。而且其創(chuàng)意能力,或?qū)⑾破餟GC與PGC兩大生產(chǎn)方式之外,一種全新的內(nèi)容生產(chǎn)方式:AIGC。
具體而言,百度文心大模型,讓數(shù)字人能夠通過(guò)AI技術(shù)以自動(dòng)編排合成的方式生產(chǎn)內(nèi)容。
AIGC將完全解放內(nèi)容生產(chǎn)力,滿足一些對(duì)時(shí)效性要求較高的領(lǐng)域。例如新聞,過(guò)去完全依賴人工創(chuàng)作與審校,即便如此,走完三審三校流程之后,新聞時(shí)效性已經(jīng)大打折扣,而且還可能出現(xiàn)“謬誤”。AIGC的出現(xiàn)解決了依賴人工創(chuàng)作,在可靠性與效率上的劣勢(shì)。
今年兩會(huì)時(shí),度曉曉就曾在兩會(huì)報(bào)道中與工人日?qǐng)?bào)開(kāi)辟了專欄《兩會(huì)曉曉說(shuō)》,為融媒體報(bào)道帶來(lái)一種耳目一新的體驗(yàn)。
憑借在AI方面的積累,百度可以在AI各落地場(chǎng)景中玩各種“花活兒”,無(wú)論是作為功能型數(shù)字人的智能助理度曉曉,還是作為表演型的“虛擬車主”希加加。
反之,我們甚至可以認(rèn)為,AI既是數(shù)字人的基礎(chǔ),也決定了數(shù)字人能力的天花板。
“數(shù)字人生產(chǎn)周期,從動(dòng)輒幾個(gè)月,縮短到小時(shí)級(jí)別。”袁佛玉在預(yù)溝通會(huì)上提到,由于百度積累了深厚的AI底層技術(shù),其數(shù)字人的成本和制作周期優(yōu)勢(shì)將逐漸顯現(xiàn)。
三、短期拼場(chǎng)景,長(zhǎng)期拼AI
任何技術(shù),如果不能創(chuàng)造價(jià)值,很難持續(xù),正是因?yàn)榫揞^們看到數(shù)字人背后的巨大寶藏,眼下才會(huì)魚(yú)貫而入。
數(shù)字人需要走過(guò)如下幾個(gè)階段“外表像人,對(duì)話像人、作為人的幫手”,AI覆蓋了整個(gè)過(guò)程。無(wú)論是AI建模,還是NLP,或者是更為深入的知識(shí)圖譜與百度文心大模型所帶來(lái)新的AIGC生產(chǎn)模式。
事實(shí)是,數(shù)字人短期拼場(chǎng)景,長(zhǎng)期拼AI。
短期來(lái)看,市場(chǎng)對(duì)數(shù)字人還處于“新奇”階段,因此主要應(yīng)用場(chǎng)景集中在廣告、電商、游戲領(lǐng)域。這也是為什么,主要受到文娛行業(yè)的追捧。
這里需要提到一點(diǎn),作為另一種IP形式,數(shù)字人風(fēng)險(xiǎn)可控,只要不過(guò)度營(yíng)銷,較少出現(xiàn)翻車的情況。在偶像頻繁塌方的情況下,確實(shí)能夠填補(bǔ)一定市場(chǎng),可是如果AI能力不能進(jìn)一步提升,真正縮小與人的距離,天花板也不會(huì)太高。
市場(chǎng)遲早會(huì)來(lái)到成長(zhǎng)與成熟階段,所以從長(zhǎng)期來(lái)看,無(wú)論是文娛,還是教育、服務(wù)、金融,AI的效能將會(huì)持續(xù)釋放。
而另一頭,AI能力也將改變當(dāng)下各方混戰(zhàn)的格局。眼下百度“AI路線”,已經(jīng)提前完成了布局,只需要等待從春秋到戰(zhàn)國(guó)。
到那時(shí),沒(méi)有了新奇,人們只會(huì)問(wèn)如下問(wèn)題:你能幫我解決什么問(wèn)題。
顯然,百度已經(jīng)寫就了答案。