數(shù)字化的視頻媒體本身就是海量的數(shù)據(jù),隨著人工智能的突破,如何辨識、理解、解析這些內(nèi)容,并通過人工智能提供反饋是目前所有科技巨頭關(guān)注的焦點:其中圖像識別、語義識別、情節(jié)和情緒辨識及搜索是各方都正在解決的問題。
人工智能和云計算正在加速改變各個行業(yè),而媒體娛樂行業(yè)可能是其中改變最快的一個。
上周在紐約舉辦的美國廣播電視展覽會(NAB)儼然成為科技巨頭的斗獸場:亞馬遜云服務(wù)AWS、IBM以及谷歌均以主要展商的姿態(tài)出現(xiàn),它們在各個論壇和技術(shù)討論中向電視臺、電影和廣告公司描述一個相似的未來。
視頻內(nèi)容不但在云端存儲和播放,其整個制作流程都將可以依托強大的計算能力在云端完成;反過來,這些海量數(shù)據(jù)將不斷“訓練”人工智能系統(tǒng),自動為媒體提供一系列有價值的信息:從哈里森福特三十年前出演第一部電影的某個片段,到哪個演員、什么樣的劇情才是此刻觀眾更想看到的。
如果當家神劇《紙牌屋》的成功證明了大數(shù)據(jù)對內(nèi)容創(chuàng)作的作用,那么奈飛(Netflix)本身的商業(yè)擴張更體現(xiàn)了云端和人工智能對媒體的作用:作為第一家將全部視頻內(nèi)容轉(zhuǎn)移到云端的內(nèi)容商,Netflix通過亞馬遜云AWS服務(wù)擴展到了130余個國家,成為真正意義上的全球互聯(lián)網(wǎng)電視網(wǎng)絡(luò)。
在美國廣播電視展覽會上,媒體和科技巨頭正在探討如何將這一趨勢延伸、擴大。
“二三十年前,技術(shù)是媒體公司的后臺部門,負責修電腦管數(shù)據(jù),但到了現(xiàn)在,媒體本身已經(jīng)變成了科技?!盜BM全球媒體和娛樂行業(yè)主管PeterGuglielmino在展會現(xiàn)場向21世紀經(jīng)濟報道記者表示。
數(shù)字化的視頻媒體本身就是海量的數(shù)據(jù),隨著人工智能的突破,如何辨識、理解、解析這些內(nèi)容,并通過人工智能提供反饋是目前所有科技巨頭關(guān)注的焦點:其中圖像識別、語義識別、情節(jié)和情緒辨識及搜索是各方都正在解決的問題。
“幾年以前,當談到云計算和人工智能時,不少媒體精英還是一頭霧水,現(xiàn)在所有人都看到了重要性?!盙uglielmino表示。
“這是一場系統(tǒng)化的升級,從數(shù)字內(nèi)容的拍攝到上傳,到渲染和剪輯,以及后期人工智能的應(yīng)用,”數(shù)字媒體傳輸和元數(shù)據(jù)采集創(chuàng)業(yè)公司QuineCEOGunleikGroven向21世紀經(jīng)濟報道記者表示,他認為,從云服務(wù)到人工智能,媒體娛樂的智能轉(zhuǎn)型還在開始階段?!安还苁莵嗰R遜谷歌還是IBM,都在盡力搭建一個更加連通的媒體拼圖?!?/p>
轉(zhuǎn)向云端:從why到how
“對媒體來說,對于向云端轉(zhuǎn)移,大家已經(jīng)開始從問為什么,到問怎么做的階段?!盙uglielmino表示。
從NAB現(xiàn)場來看,不管是微軟的Azure,還是IBM、谷歌的云服務(wù),都被眾多廠商提及。而說到媒體和云服務(wù)合作的先例,Netflix的故事無法被忽視。
2008年8月,Netflix遭遇嚴重的數(shù)據(jù)庫損壞事件,連續(xù)三天無法向成員用戶寄送DVD光碟,從那時起,Netflix意識到,線下數(shù)據(jù)中心的關(guān)系數(shù)據(jù)垂直擴展的單點數(shù)據(jù)系統(tǒng)容易發(fā)生問題,必須轉(zhuǎn)向高可靠的、水平擴展的云端分布式系統(tǒng)。
從那個事件到完成轉(zhuǎn)向亞馬遜云端網(wǎng)絡(luò)服務(wù)的真正轉(zhuǎn)換,Netflix花費了七年時間。在2016年1月,Netflix宣布完成了云端的遷移,關(guān)閉所有的自己的流媒體服務(wù)數(shù)據(jù)中心。
遷移到云端已為Netflix帶來多項利益。
一方面是體量。相比于2008年,他們現(xiàn)在的流媒體用戶增加了七倍,用戶平均觀看時間同時提高,八年內(nèi)用戶整體觀看量增長了三個數(shù)量級。
Netflix本身一直在不斷地迅速演進,各項功能越來越倚賴新的資源和不斷增長的數(shù)據(jù)體量。要支持這樣迅速的增長僅靠我們自己的數(shù)據(jù)中心已力不從心。云的彈性允許其分分鐘內(nèi)添加數(shù)以千計的虛擬服務(wù)器和千萬億字節(jié)計的存儲能力,Netflix充分利用AWS覆蓋全球的服務(wù)云區(qū),動態(tài)調(diào)整服務(wù)網(wǎng)絡(luò),擴展全球網(wǎng)絡(luò)服務(wù)能力,竭力為全球成員用戶打造更好、更滿意的流媒體服務(wù)體驗。
此外,云端也提高了Netflix服務(wù)的時段覆蓋。在本地數(shù)據(jù)中心發(fā)生過數(shù)次故障后,盡管在云端也不可避免地遇到過一些麻煩,但整體的時間覆蓋率一直在穩(wěn)定地提高,幾乎已接近期望中的99.99%不停機運行的目標。
建立云上視頻能力
“只有一個云服務(wù)器是遠遠不夠的,更重要的是在這個基礎(chǔ)上能夠提供怎樣的服務(wù)?!盦uineCEOGunleikGroven表示,“一個顯著的趨勢是,科技巨頭在馬不停蹄地并購原來細分媒體領(lǐng)域的服務(wù)公司,以把文件上傳、渲染、轉(zhuǎn)碼等具體視頻媒體技能轉(zhuǎn)化到自己的平臺之中。”
早在2013年,IBM就收購了由私人控股的大文件傳輸技術(shù)公司Aspera.
Aspera的傳輸技術(shù),能夠削減大型數(shù)據(jù)文件的傳輸時間。一份容量為24GB的大型數(shù)據(jù)文件,如傳輸?shù)降厍蛄硪欢送ǔG闆r下需要26小時,但Aspera的技術(shù)僅需30秒。Aspera采用的高速傳輸技術(shù)名為“fasp”,打破了當前制約寬帶傳輸速率的瓶頸。
在Aspera當前的客戶當中,還有一些視頻服務(wù)商,比如Netflix和環(huán)球影業(yè)等,這些視頻服務(wù)商都不希望自己的數(shù)據(jù)在傳統(tǒng)的網(wǎng)絡(luò)上受阻。
在2015年,亞馬遜以5億美元收購了視頻技術(shù)公司Elemental,將其整合AWS的視頻技術(shù)的一部分,成立了視頻云開放平臺,將視頻云技術(shù)開放給開發(fā)者,實現(xiàn)視頻的包括接收、轉(zhuǎn)碼和存儲、彈性擴容等等諸多與計算相關(guān)的功能。
今年3月,亞馬遜AWS對Thinkbox軟件進行了收購,此次收購意味著:除基本的云計算服務(wù)外,為其客戶添加更多的實用性工具,主要是針對視頻和更廣泛的視覺媒體行業(yè)的媒體設(shè)計和內(nèi)容創(chuàng)建的解決方案。
據(jù)了解,Thinkbox已提供的服務(wù)的示例包括用于渲染管理、幾何緩存和粒子網(wǎng)格劃分的系統(tǒng)以及一系列粒子渲染解決方案的其他工具。其解決方案目前已設(shè)計用于內(nèi)部部署和基于云的工作。
盡管亞馬遜沒有相關(guān)材料顯示對于Thinkbox的定位,然而基于全球媒體數(shù)字視頻內(nèi)容的大幅增長,相關(guān)猜測認為:其將建立和銷售更多服務(wù),開發(fā)企業(yè)轉(zhuǎn)向亞馬遜為其提供后端支持,幫助其不僅提供內(nèi)容,而且創(chuàng)建內(nèi)容。
在各家平臺爭搶視頻公司后,微軟的云平臺Azure也不甘示弱。今年4月,微軟宣布與全球領(lǐng)先的媒體技術(shù)提供商合作,為世界范圍內(nèi)的媒體機構(gòu)、企業(yè)用戶以及獨立藝術(shù)家們提供制作、分發(fā)、媒體價值化的工具。
作為協(xié)議的一部分,Avid選擇MicrosoftAzure作為其首選的云托管平臺,并且將發(fā)展及推出一系列軟件即服務(wù)(SaaS)和平臺即服務(wù)(PaaS)的服務(wù)模式,此服務(wù)架構(gòu)在AvidMediaCentral平臺之上,它是行業(yè)最開放、整合緊密且高效的平臺,專為媒體行業(yè)而設(shè)計。
通過建立在行業(yè)最先進、最綜合的Avid創(chuàng)意工具和媒體工作流程解決方案之上的基于云的服務(wù),戰(zhàn)略云聯(lián)盟將使媒體機構(gòu)及創(chuàng)意專業(yè)人士能夠快速及輕松地平衡效率、靈活性及敏捷性——Avid靈活的授權(quán)、部署方式使之成為可能。通過公司新的媒體工作流程、新的操作能力及新的商業(yè)機會,云還能夠驅(qū)動行業(yè)創(chuàng)新。
人工智能識別能力
把存儲、剪輯等一系列流程都在云上解決并非科技發(fā)展的目標,運用人工智能來分析和識別數(shù)據(jù),更好服務(wù)于內(nèi)容創(chuàng)作才是更重要的。
PeterGuglielmino向21世紀經(jīng)濟報道記者表示,IBM剛剛針對媒體推出了IBMWastonMedia,通過從媒體和娛樂公司的視頻庫內(nèi)容中提取海量數(shù)據(jù),可以讓這些公司對其視頻庫有更深的認識。這些海量數(shù)據(jù)包括可視化數(shù)據(jù)(人或物)、文字和音頻提示(標注和聲音)、情感提示(語氣)以及其他一些特性如地點等。當各媒體和娛樂公司有了這樣的數(shù)據(jù)儲備后,它們能更好地為消費者提供參與式體驗,以及為廣告商提供更好的匹配。
在剛剛過去的9月份美國網(wǎng)球公開賽中,IBM沃森媒體的“識別對焦”(CognitiveHighlight)功能使用人工智能實時分析選手和觀眾。在比賽期間,該系統(tǒng)一直在監(jiān)控七個不同的美國網(wǎng)球公開賽場地,分析球速、球員跑動距離以及觀眾的歡呼次數(shù)等,以便將其分配給“整體興奮”得分。所有這些數(shù)據(jù)都是由沃森處理的,然后將出現(xiàn)在美國網(wǎng)球公開賽應(yīng)用程序和USTAFacebook頁面上。
此外,“CognitiveHighlight”的新功能加入了已“委托”給Watson的任務(wù)列表中,包括收集和分析統(tǒng)計信息以向電視臺提供信息,積極監(jiān)控美國網(wǎng)球公開賽官網(wǎng)以防范安全威脅,并擴大規(guī)模以適應(yīng)比賽前后網(wǎng)絡(luò)流量的大幅增長。
半島電視臺已經(jīng)開始了這樣的嘗試。半島電視臺副臺長阿布格拉認為,人工智能和大數(shù)據(jù)很有可能在未來重塑新聞編輯室。阿布格拉指出,大約一年以前,半島電視臺就開始通過面部識別、語音翻譯和情感分析來分析其內(nèi)容,“我們正在搞清楚,那個家伙到底是怎么生氣的?聲音是什么時候發(fā)出的?人們在什么時刻歡呼?”
他表示,增強、豐富元數(shù)據(jù)只能通過一個非常聰明的人工智能平臺來實現(xiàn)。“我們盡管擁有大量的內(nèi)容,但無法在沒有云計算和強大的人工智能的情況下實現(xiàn)這個目標?!卑⒉几窭f。
阿布格拉指出,“為了實現(xiàn)它,我們需要確保我們做出了正確的判斷。有些不是依靠你自己就能實現(xiàn)的,你需要支持的技術(shù)來幫你重塑思維,甚至做出明智的決定?!?/p>
除了應(yīng)用人工智能分析其內(nèi)容外,半島電視臺還在利用大數(shù)據(jù)來挖掘可能隱藏在其20年新聞節(jié)目檔案中的信息。例如,分析員認為,一位政治家在某一國家發(fā)表演講時使用了一個句子,然后試圖辨別出與他所作出的某項政策決定有關(guān)?!坝泻芏嗟目赡苄??!卑⒉几窭f,“你必須數(shù)字化,然后分析?!?/p>
PeterGuglielmino向21世紀經(jīng)濟報道記者表示,從技術(shù)發(fā)展和需求來看,追求高效快捷的新聞和體育是目前媒體系統(tǒng)的最早應(yīng)用,但未來必將深入到廣告、電影、電視制作中。
“內(nèi)容制作是一個千億市場,每個人都在加油沖刺?!盙uglielmino說。
更多資訊請關(guān)注工業(yè)機器人頻道