巨頭造“人 一場(chǎng)AI較量

時(shí)間:2022-07-13

來(lái)源:控制工程網(wǎng)

導(dǎo)語(yǔ):AI既是數(shù)字人的基礎(chǔ),也決定了數(shù)字人能力的天花板。

  AI既是數(shù)字人的基礎(chǔ),也決定了數(shù)字人能力的天花板。

  “百度世界大會(huì)的一大看點(diǎn)正是火出圈、成頂流的數(shù)字人?!?/p>

  7月6日,百度世界大會(huì)預(yù)溝通會(huì)上,百度高級(jí)副總裁袁佛玉著重介紹了當(dāng)下數(shù)字人的發(fā)展情況。

  讓人印象深刻的是在信息密集、節(jié)奏緊湊的預(yù)溝通會(huì)中,主持人度曉曉始終應(yīng)對(duì)自如,其間“她”還向百度高級(jí)副總裁袁佛玉問(wèn)了一個(gè)關(guān)于自己的問(wèn)題。而在剛剛過(guò)去的6月,度曉曉用40秒鐘時(shí)間完成了40篇高考全國(guó)卷的命題作文,驚艷眾人。就在今天,度曉曉還將直播挑戰(zhàn)上海高考英語(yǔ)作文。

  眼下不止是百度在打造數(shù)字人,包括阿里、網(wǎng)易、騰訊、字節(jié)、華為等都推出了類似產(chǎn)品。巨頭下場(chǎng)造“人”不單是具有打造IP的能力,從某種意義上講,數(shù)字人是衡量科技企業(yè)技術(shù)集成與整合能力的標(biāo)尺。

  一位業(yè)內(nèi)人士認(rèn)為:“科技公司以IP的方式,全方位呈現(xiàn)各自能力,這背后其實(shí)是各自生態(tài)展示肌肉的表現(xiàn)形式。”

  一、數(shù)字人“纏斗”

  巨大的市場(chǎng)潛力,是巨頭批量制造數(shù)字人的直接原因。

  日前,IDC發(fā)布的報(bào)告顯示,中國(guó)AI數(shù)字人市場(chǎng)規(guī)模呈現(xiàn)高速增長(zhǎng)趨勢(shì),預(yù)計(jì)到2026年將達(dá)102.4億元人民幣。而巨頭推出各種各樣的數(shù)字人,看似雜亂無(wú)章,實(shí)際皆有深層次的考量。

  騰訊數(shù)字人的基底是建立在語(yǔ)音智能和大文娛生態(tài)上的。語(yǔ)音智能方面,根據(jù)語(yǔ)義匹配對(duì)應(yīng)動(dòng)作、字詞的能力,是騰訊數(shù)字人在技術(shù)上的底色。此外,微信上的實(shí)時(shí)語(yǔ)音轉(zhuǎn)換與翻譯,所產(chǎn)生的海量數(shù)據(jù),使得其語(yǔ)音會(huì)話能力能夠經(jīng)過(guò)翻譯和轉(zhuǎn)化而持續(xù)生長(zhǎng)。

  推動(dòng)騰訊發(fā)布數(shù)字人的動(dòng)因是鞏固大文娛生態(tài)?!霸菩∥?shù)智人平臺(tái)”由播報(bào)數(shù)智人平臺(tái)與交互數(shù)智人平臺(tái)兩個(gè)系統(tǒng)組成。對(duì)應(yīng)的落地場(chǎng)景為手語(yǔ)主播、數(shù)字導(dǎo)游、數(shù)字客服、虛擬IP偶像等虛擬資產(chǎn)。

  同樣身處文娛市場(chǎng)的字節(jié)跳動(dòng),雖然在IP與版權(quán)資源上的積累有限,但是通過(guò)連續(xù)不斷地投資與人才引入,一個(gè)AI+XR的軟硬協(xié)同生態(tài)正日益明顯。

  塑造IP較為成功的還有阿里,其曾借著冬奧會(huì),推出了自己的數(shù)字人“冬冬”,展示其肌肉。透過(guò)冬冬可以發(fā)現(xiàn),由于AI實(shí)時(shí)驅(qū)動(dòng),數(shù)字人說(shuō)話的同時(shí),能協(xié)調(diào)嘴形、表情、動(dòng)作,乃至模擬真實(shí)環(huán)境下的部分場(chǎng)景。而且采用了面向高質(zhì)量圖形的Unity高清渲染管線(HDRP),因此在視覺(jué)上有著不輸AR/VR的效果。

  阿里數(shù)字人早已開(kāi)始直播帶貨,用AI“平替”主播。從邏輯上講,數(shù)字人帶貨能夠解決真人帶貨的種種局限和各類不可預(yù)測(cè)的風(fēng)險(xiǎn)。

  AI驅(qū)動(dòng)是百度的數(shù)字人的最大特點(diǎn),靠著硬實(shí)力,截至目前打造了多個(gè)不同面向的IP,如度曉曉、希加加、文夭夭,覆蓋了功能型與演藝型兩個(gè)大類。

  百度AI數(shù)字人度曉曉

  度曉曉和文夭夭創(chuàng)造了功能型數(shù)字人的兩個(gè)范式。前者能力全面,后者則主要面向垂直領(lǐng)域。度曉曉不單是一個(gè)CG或者問(wèn)答環(huán)節(jié)的數(shù)字人,而是能夠勝任各類創(chuàng)意型工作,能夠作文、作詞、作曲、作畫,開(kāi)辟了一個(gè)AIGC的內(nèi)容生產(chǎn)模式。文夭夭為數(shù)字人運(yùn)營(yíng)細(xì)分領(lǐng)域,打開(kāi)了市場(chǎng),通過(guò)AI技術(shù)為文博領(lǐng)域提供新玩法。

  演藝型數(shù)字人希加加,早前在集度汽車發(fā)布會(huì)上亮相,一度驚艷業(yè)內(nèi),百度也成為業(yè)內(nèi)率先嘗試在會(huì)展領(lǐng)域引入數(shù)字人的巨頭。

  百度AI數(shù)字人希加加

  看得出或許是由于尋求技術(shù)突破的周期長(zhǎng)、難度高,現(xiàn)下大部分廠商皆圍繞自身長(zhǎng)處,推出數(shù)字人。

  像網(wǎng)易林幺幺通過(guò)接入AI算法,主要應(yīng)用到電商帶貨中。科大訊飛,雖然沒(méi)有騰訊、網(wǎng)易、阿里那樣強(qiáng)大的圖像處理能力,但是從“冰冰”與“加加”兩個(gè)虛擬IP來(lái)看,其核心還是輸出科大訊飛的語(yǔ)音交互能力。

  二、百度整“花活兒”

  不難發(fā)現(xiàn),時(shí)下的數(shù)字人更像是一個(gè)載體,要么搭載內(nèi)容與場(chǎng)景,要么搭載各類技術(shù),正是因?yàn)檫@個(gè)原因,巨頭們才不遺余力造“人”。

  在梳理之中我們也能看到,無(wú)論是知識(shí)庫(kù)與交互,還是算法與建模,AI都扮演了舉足輕重的角色,不過(guò)分地說(shuō),數(shù)字人的競(jìng)爭(zhēng)本質(zhì)上其實(shí)是AI能力的競(jìng)爭(zhēng)。

  而百度可以在短短兩年多時(shí)間內(nèi)接連推出度曉曉、希加加、文夭夭等特點(diǎn)、功能、使用場(chǎng)景截然不同的數(shù)字人IP,表明“AI路線”的潛能。

  在今天的百度世界大會(huì)預(yù)溝通會(huì)上,百度高級(jí)副總裁袁佛玉提到,百度AI驅(qū)動(dòng)的數(shù)字人的不同在于“可交互”性,而且還具備創(chuàng)作能力。

  把時(shí)間回?fù)艿?020年,那年百度世界大會(huì)上,度曉曉被定義為“智能助理”而首度問(wèn)世,彼時(shí),人們只是感受到了AI原來(lái)并非那么冷冰冰,而是可以有溫度,這顛覆了傳統(tǒng)認(rèn)知中,技術(shù)都是冷冰冰的陳見(jiàn)。

  “智能助理”的定位意味著百度需要持續(xù)解決人的各類需求,全方位應(yīng)對(duì)信息輸入、處理、輸出的挑戰(zhàn)。僅僅通過(guò)營(yíng)銷方式制造IP,讓市場(chǎng)接受數(shù)字人,似乎有些追本逐末。事實(shí)上,隨著入局玩家、搭載場(chǎng)景的增加,以及競(jìng)爭(zhēng)走向激烈,市場(chǎng)走過(guò)新奇階段時(shí),技術(shù)能力將起到?jīng)Q定性作用。

  數(shù)字人為百度提供了AI技術(shù)落地的場(chǎng)景之一。之所以度曉曉們能夠有極強(qiáng)的互動(dòng)性,與之溝通更絲滑,主要原因在于由文心大模型、AI超寫實(shí)建模所構(gòu)成的AI內(nèi)核。

  由于數(shù)據(jù)、算法和算力出現(xiàn)巨大增長(zhǎng),人工智能發(fā)展開(kāi)始轉(zhuǎn)向泛化能力與通用性強(qiáng)的預(yù)訓(xùn)練大模型。在百度文心大模型加持下,數(shù)字人在生產(chǎn)與創(chuàng)意類應(yīng)用中的潛能也得到了釋放。

  日前,像度曉曉迅速完成高考作文,以唱作人的身份推出《每分每秒每天》單曲,作出“無(wú)界”系列畫作,表明百度數(shù)字人已經(jīng)具備面向多領(lǐng)域能力。而且其創(chuàng)意能力,或?qū)⑾破餟GC與PGC兩大生產(chǎn)方式之外,一種全新的內(nèi)容生產(chǎn)方式:AIGC。

  具體而言,百度文心大模型,讓數(shù)字人能夠通過(guò)AI技術(shù)以自動(dòng)編排合成的方式生產(chǎn)內(nèi)容。

  AIGC將完全解放內(nèi)容生產(chǎn)力,滿足一些對(duì)時(shí)效性要求較高的領(lǐng)域。例如新聞,過(guò)去完全依賴人工創(chuàng)作與審校,即便如此,走完三審三校流程之后,新聞時(shí)效性已經(jīng)大打折扣,而且還可能出現(xiàn)“謬誤”。AIGC的出現(xiàn)解決了依賴人工創(chuàng)作,在可靠性與效率上的劣勢(shì)。

  今年兩會(huì)時(shí),度曉曉就曾在兩會(huì)報(bào)道中與工人日?qǐng)?bào)開(kāi)辟了專欄《兩會(huì)曉曉說(shuō)》,為融媒體報(bào)道帶來(lái)一種耳目一新的體驗(yàn)。

  憑借在AI方面的積累,百度可以在AI各落地場(chǎng)景中玩各種“花活兒”,無(wú)論是作為功能型數(shù)字人的智能助理度曉曉,還是作為表演型的“虛擬車主”希加加。

  反之,我們甚至可以認(rèn)為,AI既是數(shù)字人的基礎(chǔ),也決定了數(shù)字人能力的天花板。

  “數(shù)字人生產(chǎn)周期,從動(dòng)輒幾個(gè)月,縮短到小時(shí)級(jí)別。”袁佛玉在預(yù)溝通會(huì)上提到,由于百度積累了深厚的AI底層技術(shù),其數(shù)字人的成本和制作周期優(yōu)勢(shì)將逐漸顯現(xiàn)。

  三、短期拼場(chǎng)景,長(zhǎng)期拼AI

  任何技術(shù),如果不能創(chuàng)造價(jià)值,很難持續(xù),正是因?yàn)榫揞^們看到數(shù)字人背后的巨大寶藏,眼下才會(huì)魚(yú)貫而入。

  數(shù)字人需要走過(guò)如下幾個(gè)階段“外表像人,對(duì)話像人、作為人的幫手”,AI覆蓋了整個(gè)過(guò)程。無(wú)論是AI建模,還是NLP,或者是更為深入的知識(shí)圖譜與百度文心大模型所帶來(lái)新的AIGC生產(chǎn)模式。

  事實(shí)是,數(shù)字人短期拼場(chǎng)景,長(zhǎng)期拼AI。

  短期來(lái)看,市場(chǎng)對(duì)數(shù)字人還處于“新奇”階段,因此主要應(yīng)用場(chǎng)景集中在廣告、電商、游戲領(lǐng)域。這也是為什么,主要受到文娛行業(yè)的追捧。

  這里需要提到一點(diǎn),作為另一種IP形式,數(shù)字人風(fēng)險(xiǎn)可控,只要不過(guò)度營(yíng)銷,較少出現(xiàn)翻車的情況。在偶像頻繁塌方的情況下,確實(shí)能夠填補(bǔ)一定市場(chǎng),可是如果AI能力不能進(jìn)一步提升,真正縮小與人的距離,天花板也不會(huì)太高。

  市場(chǎng)遲早會(huì)來(lái)到成長(zhǎng)與成熟階段,所以從長(zhǎng)期來(lái)看,無(wú)論是文娛,還是教育、服務(wù)、金融,AI的效能將會(huì)持續(xù)釋放。

  而另一頭,AI能力也將改變當(dāng)下各方混戰(zhàn)的格局。眼下百度“AI路線”,已經(jīng)提前完成了布局,只需要等待從春秋到戰(zhàn)國(guó)。

  到那時(shí),沒(méi)有了新奇,人們只會(huì)問(wèn)如下問(wèn)題:你能幫我解決什么問(wèn)題。

  顯然,百度已經(jīng)寫就了答案。


AI
中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(m.u63ivq3.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽(yáng)科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺(jué)
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0