人工+智能的人工智能
近年來(lái)隨著機(jī)器學(xué)習(xí)大火,人工智能又重新出現(xiàn)在公眾面前,變成了風(fēng)口。媒體經(jīng)常報(bào)道某家的AI產(chǎn)品十分智能,堪比人類(lèi),人類(lèi)與人工智能之間的對(duì)戰(zhàn)也越演越烈,一時(shí)間AI即將代替人類(lèi)的傳聞引發(fā)了公眾們的擔(dān)憂(yōu)。目前來(lái)看,人工智能創(chuàng)新依賴(lài)的都是深度學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)。深度神經(jīng)網(wǎng)絡(luò)在信息分類(lèi)方面確實(shí)非常有效,在許多情況下,例如語(yǔ)音和面部識(shí)別或在MRI和CT掃描中識(shí)別癌癥,它們的表現(xiàn)甚至勝過(guò)人類(lèi)。但這并不意味著目前深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)能夠完成人類(lèi)可以完成的任何任務(wù)。
“Andrew"是總部位于紐約的創(chuàng)業(yè)公司X.ai開(kāi)發(fā)的一名數(shù)字助理,可以?huà)呙桦娮余]件,為你與同事討論的會(huì)議和約會(huì)提供日程安排,創(chuàng)建任務(wù),幾乎不需要任何人工協(xié)助。它采用了X.ai的高級(jí)人工智能功能。但今年五月,《連線(xiàn)》雜志報(bào)道Andrew并非完全是人工智能的,它是由位于馬尼拉郊區(qū)一座高度安全的大廈中的40名菲律賓人提供支持,他們監(jiān)控人工智能助理的行為,一旦助理遇到無(wú)法處理的任務(wù)時(shí)就立刻接管。
同樣的事情也發(fā)生在國(guó)內(nèi)。圖像識(shí)別剛剛興起時(shí),將圖像識(shí)別技術(shù)引入到內(nèi)容審核領(lǐng)域成了人工智能商業(yè)落地的首選方案,很多公司都選擇了使用AI技術(shù)來(lái)進(jìn)行內(nèi)容審核。然而今年4月開(kāi)始,國(guó)家監(jiān)管部門(mén)連續(xù)對(duì)眾多直播短視頻社區(qū)提出”內(nèi)容整改“的需求,而相對(duì)應(yīng)的直播短視頻社區(qū)也紛紛表示將擴(kuò)大人工審核團(tuán)隊(duì)。大家很快發(fā)現(xiàn),盡管智能審核已經(jīng)相對(duì)比較成熟了,但仍然不能完全脫離人工。而人工+機(jī)器審核是目前科技公司常用的審核方法。以快手為例,快手擁有數(shù)百人的內(nèi)容審核團(tuán)隊(duì),每條快手短視頻、直播的發(fā)布都要經(jīng)過(guò)機(jī)器和人工等多道審核。
對(duì)此,圖普科技的運(yùn)營(yíng)總監(jiān)姜澤榮表示,“所有深度學(xué)習(xí)應(yīng)用程序都面臨著人工智能模型準(zhǔn)確度的問(wèn)題,在訓(xùn)練模型的時(shí)候也需要人工的參與,內(nèi)容審核也不例外。而訓(xùn)練執(zhí)行特定任務(wù)的神經(jīng)網(wǎng)絡(luò)所需付出的努力和數(shù)據(jù)取決于該問(wèn)題涉及的領(lǐng)域以及所需的準(zhǔn)確度。我們認(rèn)為人工加機(jī)器審核是一種比較合適的選擇,一方面可以持續(xù)優(yōu)化模型,另一方面也可以根據(jù)不同公司的過(guò)濾規(guī)則來(lái)進(jìn)行調(diào)整。”
據(jù)了解,圖普科技是目前國(guó)內(nèi)已知最大的內(nèi)容審核服務(wù)商之一,識(shí)別準(zhǔn)確率和召回率均高于99%。姜澤榮介紹到,通常來(lái)說(shuō)客戶(hù)會(huì)根據(jù)自身的過(guò)濾規(guī)則定制服務(wù),而圖普科技會(huì)將機(jī)器審核的結(jié)果反饋給客戶(hù),最終客戶(hù)還需要一部分人工審核來(lái)調(diào)節(jié)。
有專(zhuān)家聲稱(chēng)這種用人類(lèi)來(lái)彌補(bǔ)人工智能算法缺點(diǎn)的做法是偽人工智能,而也有專(zhuān)家表示只是人工智能的能力被過(guò)度吹捧了,目前所謂的人工智能遠(yuǎn)遠(yuǎn)不是“強(qiáng)人工智能”,更多的只是一種機(jī)器智能,而人工+智能的做法也確實(shí)揭示了人工智能初創(chuàng)公司在技術(shù)落地時(shí)面臨的一些更深層次的挑戰(zhàn)。
初創(chuàng)公司面臨的數(shù)據(jù)斷層
感知問(wèn)題一直是制約著人工智能發(fā)展的重要因素之一,而深度學(xué)習(xí)確實(shí)在某種程度上可以解決感知的問(wèn)題,但常識(shí)推理和理解仍然是深度學(xué)習(xí)難以攻克的問(wèn)題。
舉例來(lái)說(shuō),語(yǔ)言是一種感知問(wèn)題,將單詞和句子轉(zhuǎn)換為向量,所以一些公司可以更好地呈現(xiàn)用于文本分類(lèi)和機(jī)器翻譯的文本(的確,Google翻譯近幾年取得了明顯的進(jìn)步),但是這些對(duì)于常識(shí)推理沒(méi)有絲毫幫助,這也是聊天機(jī)器人總是失敗的原因。
像HBO電視劇《硅谷》中的“熱狗”APP這樣的圖像分類(lèi)APP能夠執(zhí)行的任務(wù)非常有限且具體:它能告訴您智能手機(jī)的鏡頭中是否有熱狗。如果有足夠的熱狗圖像,該應(yīng)用程序的人工智能的準(zhǔn)確度會(huì)更高。即使它偶爾會(huì)出錯(cuò),也不會(huì)對(duì)任何人造成傷害。
但是其他人工智能應(yīng)用程序,例如X.ai正在構(gòu)建的應(yīng)用程序,試圖解決更廣泛的問(wèn)題,這意味著它們需要大量的高質(zhì)量樣本。此外,它們對(duì)錯(cuò)誤的容忍度要低得多。將黃瓜誤認(rèn)為熱狗與在錯(cuò)誤的時(shí)間安排重要的商務(wù)會(huì)議完全不是一回事。
不幸的是,并非所有公司都能擁有的高質(zhì)量的樣本數(shù)據(jù)。
人工智能試圖解決的問(wèn)題越具有一般性,可能發(fā)生的邊緣情況或異常行為就越多。不可避免地,這意味著需要更多的訓(xùn)練樣本來(lái)囊括所有可能發(fā)生的情況,初創(chuàng)公司通常無(wú)法獲得大量的訓(xùn)練數(shù)據(jù),因此他們有能力建立的模型將是非常小眾和脆弱的,通常不符合他們的期望。
只有Facebook、谷歌等大公司才能擁有大量豐富的信息,因?yàn)檫@些公司多年來(lái)一直在收集數(shù)十億用戶(hù)的數(shù)據(jù)。較小的公司必須支付大筆款項(xiàng)才能獲得或創(chuàng)建訓(xùn)練數(shù)據(jù),這會(huì)拖慢其應(yīng)用程序的發(fā)布。另一種方法是不管怎樣立即發(fā)布應(yīng)用程序,利用人類(lèi)和實(shí)時(shí)客戶(hù)數(shù)據(jù)來(lái)實(shí)時(shí)訓(xùn)練人工智能,并希望最終減少該人工智能應(yīng)用對(duì)人類(lèi)的依賴(lài)。
初創(chuàng)公司會(huì)面臨新的寒冬嗎?
1984年,美國(guó)人工智能協(xié)會(huì)(AmericanAssociationforArtificialIntelligence,后更名為NationalConferenceoftheAssociationfortheAdvanceofArtificialIntelligence)向商界發(fā)出警告,對(duì)人工智能的炒作和過(guò)度熱情最終將令人大失所望。在這之后不久,人們對(duì)人工智能的投資和興趣減退,導(dǎo)致了一個(gè)被稱(chēng)為“人工智能寒冬”的時(shí)代。
自2010年年初以來(lái),人們對(duì)該領(lǐng)域的興趣和投資再次高漲。因此,一些專(zhuān)家擔(dān)心,如果人工智能應(yīng)用程序的表現(xiàn)不佳,并未能達(dá)到預(yù)期,那將會(huì)導(dǎo)致下一個(gè)人工智能寒冬的來(lái)臨。李開(kāi)復(fù)在2018年年初的時(shí)候就曾說(shuō)過(guò),人工智能的泡沫將在年底破滅,一大波人工智能初創(chuàng)公司將面臨清算之日。近期《南華早報(bào)》報(bào)道,光大新經(jīng)濟(jì)投資負(fù)責(zé)人艾渝周六在重慶智博會(huì)也表示,AI技術(shù)商業(yè)化的壓力增大,未來(lái)如果找不到合適的落地場(chǎng)景,將有百分之九十的人工智能初創(chuàng)企業(yè)將會(huì)落敗出局。艾渝負(fù)責(zé)管理約300億元人民幣(44億美元)基金,其投資的初創(chuàng)企業(yè)包括美團(tuán)點(diǎn)評(píng)、愛(ài)奇藝、商湯科技、蔚來(lái)汽車(chē)、小鵬汽車(chē)等。這些公司中只有不到5%的公司營(yíng)收達(dá)到10億元,但卻以高昂的估值吸引了巨額資金。艾渝預(yù)測(cè),未來(lái)兩年,90%的中國(guó)AI初創(chuàng)企業(yè)將面臨“巨大困難”,而且資金緊縮“今年尤為明顯”。
據(jù)《華爾街日?qǐng)?bào)》此前的報(bào)道,在時(shí)空領(lǐng)域提供分析、構(gòu)建洞察意見(jiàn)與支持預(yù)測(cè)的超大規(guī)模數(shù)據(jù)集成平臺(tái)Geospock的首席技術(shù)官SteveMarsh認(rèn)為人工智能現(xiàn)在已經(jīng)提供了真正的價(jià)值,而不是想象中的價(jià)值,但是人工智能技術(shù)與其他領(lǐng)域的融合可能會(huì)導(dǎo)致一些幻滅的感覺(jué)。
而就這個(gè)觀點(diǎn),圖普科技的CEO李明強(qiáng)也表示,一些AI初創(chuàng)公司可能發(fā)現(xiàn)他們需要比預(yù)期更長(zhǎng)的時(shí)間來(lái)收集足夠的數(shù)據(jù),才能應(yīng)用于商業(yè),這也許會(huì)造成技術(shù)與場(chǎng)景之間的斷層。
”我們跑得比較快,但是對(duì)于數(shù)據(jù)量的重要性感受也很深??傊瑢?duì)于許多沒(méi)有有利的應(yīng)用場(chǎng)景或者大量數(shù)據(jù)的人工智能初創(chuàng)公司來(lái)說(shuō),可能會(huì)面臨一個(gè)寒冬吧。“李明強(qiáng)總結(jié)說(shuō)道。