版權(quán)問題一直是困擾視頻行業(yè)發(fā)展的一大瓶頸,隨著人工智能技術(shù)的逐漸成熟,這一問題也有望得到解決。
日前,阿里大文娛集團(tuán)聯(lián)合阿里巴巴達(dá)摩院共同發(fā)布了名為“鯨觀”的全鏈路數(shù)字版權(quán)服務(wù)平臺(tái)。據(jù)悉,該平臺(tái)通過(guò)搭載達(dá)摩院iDST(數(shù)據(jù)科學(xué)技術(shù)研究院)的人工智能技術(shù),可實(shí)現(xiàn)對(duì)視頻的智能編輯,同時(shí)在音視頻素材上抽取“指紋”,讓其在全網(wǎng)范圍可追溯。
這也是阿里達(dá)摩院自成立以后,研究成果的首次落地。阿里巴巴達(dá)摩院iDST首席科學(xué)家兼副院長(zhǎng)任小楓告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者:“馬老師(指馬云)給我們定的目標(biāo)非常高,我們要做的就是解決未來(lái)的問題。”其中就包括視頻行業(yè)的版權(quán)保護(hù)問題。
解決盜版難題
近年來(lái),視頻行業(yè)得到了迅猛的發(fā)展。據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心第40次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2017年6月,中國(guó)網(wǎng)絡(luò)視頻用戶規(guī)模已達(dá)到5.65億。
與之對(duì)應(yīng)的是視頻數(shù)量的爆發(fā)。據(jù)今日頭條創(chuàng)始人張一鳴近日表示,僅今日頭條旗下的平臺(tái),每天就有超過(guò)2150萬(wàn)條短視頻上傳。但是,隨著行業(yè)的迅猛發(fā)展,“搬運(yùn)工”、“剪刀手”等侵權(quán)現(xiàn)象也變得日益突出,如何更高效地進(jìn)行版權(quán)保護(hù),成為視頻行業(yè)發(fā)展的當(dāng)務(wù)之急。
任小楓告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,指紋對(duì)于視頻的版權(quán)保護(hù)來(lái)說(shuō)非常重要。如果能夠像指紋一樣去計(jì)算視頻的精確特征,那就可以對(duì)每一個(gè)視頻實(shí)現(xiàn)唯一的匹配。
以往,侵權(quán)者會(huì)通過(guò)加logo、壓縮分辨率或者調(diào)整亮度等一系列操作來(lái)改變某一視頻的特征。“但通過(guò)指紋技術(shù),就能夠在各種各樣的變化中找出他們,現(xiàn)在我們已經(jīng)可以去分辨多場(chǎng)景的視頻,且準(zhǔn)確率在99%以上?!比涡髡f(shuō)。
實(shí)現(xiàn)這一成果的背后,人工智能功不可沒。據(jù)悉,鯨觀平臺(tái)在處理視頻時(shí),會(huì)利用達(dá)摩院iDST的人工智能技術(shù)對(duì)視頻內(nèi)容進(jìn)行各個(gè)維度的分析,并為之打上兩萬(wàn)余種標(biāo)簽,同時(shí)利用知識(shí)圖譜對(duì)標(biāo)簽進(jìn)行多維度編目。這樣一來(lái),視頻內(nèi)容就變得可識(shí)別和搜索了。
另?yè)?jù)21世紀(jì)經(jīng)濟(jì)報(bào)道記者了解,除了精準(zhǔn)的識(shí)別技術(shù)外,鯨觀平臺(tái)在視頻處理效率上也實(shí)現(xiàn)了突破。目前,其通過(guò)一臺(tái)機(jī)器就可以處理近30萬(wàn)小時(shí)的視頻。
任小楓告訴記者,這是因?yàn)樵撈脚_(tái)采用了一個(gè)“二值”的索引引擎。簡(jiǎn)單來(lái)說(shuō),就是把視頻所有的變化都轉(zhuǎn)化成“二值”,即零或一,這樣便能簡(jiǎn)化視頻的指紋特征,使得存儲(chǔ)和計(jì)算速度得到大幅提升。
目前,鯨觀平臺(tái)上視頻的下載、解碼、編碼都能夠達(dá)到毫秒級(jí)的處理速度,5分鐘時(shí)長(zhǎng)的視頻經(jīng)過(guò)上述全鏈路處理可在10秒內(nèi)完成。更為重要的是,在這個(gè)過(guò)程中,視頻的精度不會(huì)損失,和原始特征一模一樣。
視頻技術(shù)接近美國(guó)
今年6月,任小楓加入阿里擔(dān)任阿里巴巴iDST首席科學(xué)家和副院長(zhǎng)。資料顯示,iDST是阿里巴巴負(fù)責(zé)人工智能技術(shù)研發(fā)的核心團(tuán)隊(duì),成立于2014年,由一批杰出的科學(xué)家及工程師組成,分布在杭州、北京、西雅圖、硅谷等地。
而在此之前,任小楓是亞馬遜級(jí)別最高的華人科學(xué)家。他從2013年開始任職于亞馬遜無(wú)人零售店AmazonGo部門,并領(lǐng)導(dǎo)計(jì)算機(jī)視覺算法團(tuán)隊(duì)。因此,其對(duì)計(jì)算機(jī)視覺領(lǐng)域中的圖像分類、物體識(shí)別、跟蹤、檢測(cè)、事件檢測(cè)等均有全面且深入的理解。
任小楓告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,對(duì)于視頻技術(shù),他有很多期望,這次與阿里大文娛一起發(fā)布鯨觀平臺(tái),也是希望視頻技術(shù)在這個(gè)平臺(tái)上能夠得到鍛煉和提高。
加入阿里以后,任小楓仍專注于計(jì)算機(jī)視覺領(lǐng)域的研究,并主攻圖像視頻內(nèi)容的識(shí)別和理解。在他看來(lái),目前的工作內(nèi)容其實(shí)與在亞馬遜并無(wú)太大差異,都是對(duì)動(dòng)態(tài)的人體或者物體進(jìn)行檢測(cè),同時(shí)對(duì)其姿態(tài)、動(dòng)作進(jìn)行分析等。
從技術(shù)角度來(lái)說(shuō),動(dòng)態(tài)的視頻要比靜態(tài)的圖片更加難以識(shí)別和分析。以人臉識(shí)別為例,在視頻中就可能會(huì)受到分辨率、角度、距離等因素的影響?!盀榻鉀Q這些問題,我們選擇使用超深卷積網(wǎng)絡(luò),并對(duì)模型簡(jiǎn)化加速,從而實(shí)現(xiàn)精準(zhǔn)的人臉檢測(cè)、跟蹤、識(shí)別?!比涡髡f(shuō)。
但對(duì)于這位技術(shù)大牛而言,他腦海中對(duì)視頻的理解,并不是簡(jiǎn)單的給視頻加上一些標(biāo)簽,而是要能對(duì)視頻內(nèi)容更加細(xì)致的理解和分析。比如有些視頻的人物、場(chǎng)景都無(wú)法識(shí)別,但可以分析他們的關(guān)系;或者可以對(duì)一些動(dòng)作、行為進(jìn)行識(shí)別和分析。這也將是阿里巴巴iDST未來(lái)要研究的方向。
任小楓坦言,視頻技術(shù)正處于快速發(fā)展的階段,他自己也在思考,除了提升現(xiàn)有的一些技術(shù)應(yīng)用外,還有沒有新的領(lǐng)域可以進(jìn)行探索。
而在談及中美的技術(shù)差異時(shí),他告訴記者,中國(guó)在人工智能技術(shù)上與美國(guó)其實(shí)還是有一些差距,不過(guò),在人臉和圖像的識(shí)別技術(shù)上,這個(gè)距離已經(jīng)非常接近。