曾在《最強(qiáng)大腦》節(jié)目中一眼辨認(rèn)出同質(zhì)同量同水源的520杯水,被譽(yù)為“水哥”的王昱珩,近日與搭載百度大腦的小度機(jī)器人進(jìn)行實(shí)力交鋒時卻以0:2惜敗,這樣的結(jié)果引發(fā)輿論嘩然。此前,王昱珩是《最強(qiáng)大腦》開播四季唯一未獲敗績的選手,堪稱該節(jié)目的“最強(qiáng)大腦”,王昱珩的失利令無數(shù)觀眾失望不已,同時也對人工智能的先進(jìn)感到一絲的恐懼。百度人工智能究竟贏在哪兒?我們可以從小度機(jī)器人此次與與王昱珩PK項目細(xì)節(jié)上首先窺探出百度人工智能的進(jìn)步:
雙方此次PK項目是通過三段在夜幕下分別從行車記錄儀、高位攝像頭和女生手機(jī)中拍到的模糊動態(tài)影像中,通過識別三位“嫌疑人”的特征后,從30位性別相同、身高體重年齡均相似的候選人現(xiàn)場拍照中,準(zhǔn)確找出三位“嫌疑人”。
這運(yùn)用到百度深度學(xué)習(xí)實(shí)驗(yàn)室現(xiàn)在做的方向之一——計算機(jī)視覺即人臉識別技術(shù),與智能駕駛和增強(qiáng)現(xiàn)實(shí)堪稱百度人工智能的“三駕馬車”。通常情況下,人臉識別主要包括人臉檢測、人臉圖像預(yù)處理、人臉圖像特征提取、人臉圖像匹配與識別四個步驟。目前百度人臉測試集有2百萬人的2億張圖片作為訓(xùn)練樣本數(shù)據(jù),不斷實(shí)現(xiàn)成長與進(jìn)化技術(shù)近來在百度金融遠(yuǎn)程預(yù)授信、國航航班上與乘客微笑互動裝置、烏鎮(zhèn)景區(qū)人臉識別閘機(jī)等領(lǐng)域已實(shí)現(xiàn)頻頻亮相及落地。
人工智能一直在海量信息搜索、存儲、計算推演能力等方面均遙遙領(lǐng)先,通過搜索引擎起家、不斷“吃”大數(shù)據(jù)長大的百度辨別再匹配的能力遠(yuǎn)勝于人,基于百度領(lǐng)先的深度學(xué)習(xí)算法,百度識圖也很早就擁有超越傳統(tǒng)底層特征的圖像識別和高層語義特征表達(dá)能力。
無獨(dú)有偶,近日搜狗機(jī)器人汪仔也參加問答綜藝節(jié)目《一站到底》,以9:7的成績贏得了這場人機(jī)大戰(zhàn)的勝利,但搜狗汪仔的表現(xiàn)卻引發(fā)了較大爭議。
《一站到底》中主持人提問均為搜索關(guān)鍵詞似的句式,如“具有明目功效的中藥‘白丁香’是哪種動物的糞便?”“世界上面積最大的內(nèi)陸國是哪個國家?”等。這也就意味著對于搜狗汪仔來說,只需要識別關(guān)鍵詞——背后是浸淫搜索引擎多年的搜狗必備的數(shù)據(jù)庫,即可完成答題。而這個過程中體現(xiàn)的只有搜狗對信息的儲備和檢索,并沒有真正涉及人工智能的層面。
眾所周知,人工智能(ArtificialIntelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。必須強(qiáng)調(diào)的是,人工智能是對人的意識、思維的信息過程的模擬。人工智能不是人的智能,但能像人那樣思考、也可能超過人的智能。
與之相對應(yīng)的,以上文提到的小度為例,其能做到完勝就是利用人臉識別技術(shù),并模擬人類思考來選擇幾個優(yōu)勢點(diǎn),然后通過蒙特卡羅樹搜索,窮舉計算這幾個點(diǎn)勝率再從中優(yōu)選。這就體現(xiàn)了人工智能深度學(xué)習(xí)和模擬人類思維的特點(diǎn)。
而在搜狗機(jī)器人名為人工智能大獲全勝的背后,實(shí)質(zhì)上體現(xiàn)的只是搜狗數(shù)據(jù)庫信息儲備和關(guān)鍵詞檢索功能,用人腦和之對比再宣布勝利,搜狗此舉更像是一場碰瓷人工智能的營銷。
搜狗此次倉促地推出搜狗汪仔,并使其站上《一站到底》的舞臺,肯定是想借勢最近人工智能領(lǐng)域最為火爆的事件——谷歌的Master戰(zhàn)勝了眾多圍棋名家。搜狗想蹭熱點(diǎn)事件進(jìn)行營銷傳播,并把自身和人工智能領(lǐng)域的領(lǐng)跑者進(jìn)行捆綁,想法是非常好的。但未免用力過猛了,產(chǎn)品還只是智能搜索,就急忙披著人工智能的皮推出,并進(jìn)行了大量的曝光。實(shí)際上,這種缺少產(chǎn)品力的營銷,往往只是有曝光沒認(rèn)可,有輿論沒口碑。
搜狗目前在人工智能領(lǐng)域還處于落后的態(tài)勢,想要完成逆襲絕不是一場碰瓷營銷就可實(shí)現(xiàn)的。搜狗在人工智能方面最值得稱道的語音識別和交互領(lǐng)域,仍有訊飛輸入法這一強(qiáng)勢對手存在,科大訊飛作為中國第一個在商用系統(tǒng)里使用深度神經(jīng)網(wǎng)絡(luò)的公司,早在2010年就率先將語音輸入功能引入到了手機(jī)當(dāng)中,截至2016年6月,訊飛輸入法已經(jīng)擁有3.6億用戶,其中語音用戶滲透率高達(dá)59%。
技術(shù)方面,搜狗表現(xiàn)的也并不盡如人意,比如不久之前秀出的實(shí)時機(jī)器翻譯以“90%準(zhǔn)確率秒殺同傳、AI里程碑”自夸,但不僅多次出現(xiàn)前后矛盾的現(xiàn)場BUG,更被一位知乎上備注為北京語言大學(xué)高級翻譯學(xué)院教師批評為“無法像人一樣體會上下文,不客氣的說,沒有一句話是翻譯對的?!?/p>
除此之外,在人才和資金投入方面,搜狗也并沒有什么拿得出手的優(yōu)勢,唯一值得一提的是在去年6月捐贈1.8億給清華大學(xué)并聯(lián)合成立專攻人工智能的研究院,而這遠(yuǎn)遠(yuǎn)難于比擬早已完成領(lǐng)跑的谷歌、微軟等巨頭在人工智能方面的大力投入。
而百度則領(lǐng)先一大截,李彥宏說,“百度在人工智能方面確實(shí)有五六年的積累,在人工智能的基礎(chǔ)技術(shù)上處在比較領(lǐng)先的地位?!辈⒈硎荆俣认M麑⑵湓谡Z音識別、圖像識別、自然語言和用戶畫像等方面的能力開放出來。按照記者了解到的信息顯示,百度早在2013年便已經(jīng)建立語音開放平臺,2015年之后則相繼上線百度地圖、百度翻譯開放平臺。
其實(shí),搜狗既然已經(jīng)“上車”晚了,就也沒必要操之過急了,急也沒有用,還不如靜下心來,先把產(chǎn)品好好地做好再說。