作為第四次工業(yè)革命的引領(lǐng)性領(lǐng)域,近年來的人工智能和大數(shù)據(jù)持續(xù)升溫。最近的AlphaGo事件更是將人工智能的前沿技術(shù)呈現(xiàn)于大眾面前。
大數(shù)據(jù)概念被熱炒多年之后,我們是時(shí)候開始關(guān)注大數(shù)據(jù)與人工智能在具體領(lǐng)域中的應(yīng)用問題。那么,目前大數(shù)據(jù)和人工智能領(lǐng)域還存在著哪些技術(shù)挑戰(zhàn)?如何找到大數(shù)據(jù)和人工智能的創(chuàng)業(yè)入口,利用數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的能力創(chuàng)造出更大的商業(yè)價(jià)值?
近期,天天投聯(lián)合騰訊眾創(chuàng)、清華啟迪之星舉辦了“人工智能和大數(shù)據(jù)投融資面對(duì)面”活動(dòng)。在圓桌論壇環(huán)節(jié),幾位學(xué)術(shù)專家、投資人、創(chuàng)業(yè)者分別以各自的視角發(fā)表了自己的觀點(diǎn)。
大數(shù)據(jù)和人工智能領(lǐng)域的技術(shù)障礙
大數(shù)據(jù)技術(shù)本身的不可讀性
清華大學(xué)機(jī)算機(jī)系崔鵬教授多年深耕于數(shù)據(jù)挖掘和信息處理領(lǐng)域的研究,他認(rèn)為不管是大數(shù)據(jù)還是人工智能,從學(xué)術(shù)研究的角度來講不是新的概念,核心基本都是圍繞在數(shù)據(jù)分析和挖掘、數(shù)據(jù)建模等工作。
目前在大數(shù)據(jù)的不同層面,都出現(xiàn)了一些提供標(biāo)準(zhǔn)化服務(wù)的公司。但大數(shù)據(jù)的核心部分,也就是數(shù)據(jù)的處理和分析,恰恰不容易用一個(gè)通用的框架來實(shí)現(xiàn)。
大數(shù)據(jù)有很多的數(shù)據(jù)來源,不同領(lǐng)域的數(shù)據(jù)也呈現(xiàn)出非常強(qiáng)的領(lǐng)域特性,我們不可能搞找到一個(gè)通用的數(shù)據(jù)模型,來解決所有的問題。因此,大數(shù)據(jù)如果想真正地投入到產(chǎn)業(yè)應(yīng)用的話,一定是需要將懂大數(shù)據(jù)技術(shù)的人,與某一領(lǐng)域背景很強(qiáng)的人結(jié)合起來,才能夠使大數(shù)據(jù)的分析和處理層面實(shí)現(xiàn)比較大的突破。
其實(shí)硅谷現(xiàn)在有些公司正在試研發(fā)一些大數(shù)據(jù)的標(biāo)準(zhǔn)化工具,但是就我們了解到的情況來看,盡管能夠獲得投資,他們的存活狀態(tài)并不是太好。因?yàn)閺钠髽I(yè)的角度來講,它并沒有很好的應(yīng)用場(chǎng)景。規(guī)模比較大的企業(yè)完全有能力自己構(gòu)建一個(gè)數(shù)據(jù)分析團(tuán)隊(duì),不太可能把所有的數(shù)據(jù)都交給專門做數(shù)據(jù)分析的服務(wù)商;而小公司采用這些些服務(wù),還是會(huì)面臨工具通用性上的問題。
另外,大數(shù)據(jù)技術(shù)本身的不可讀性,使它目前存在著技術(shù)風(fēng)險(xiǎn)。目前幾乎所有大數(shù)據(jù)的分析,都是基于關(guān)聯(lián)算法進(jìn)行預(yù)測(cè)。也就是說,以前有大量的數(shù)據(jù)證明發(fā)生A就是發(fā)生B,基于這種邏輯的關(guān)聯(lián),我們就會(huì)預(yù)測(cè)在下次發(fā)生A時(shí)也會(huì)發(fā)生B。
但這些所謂的預(yù)測(cè)是存在精確度方面的限制的,并且整個(gè)過程是一個(gè)黑盒子,我們沒有辦法控制。因此,目前的大數(shù)據(jù)分析還不能實(shí)際應(yīng)用于某些領(lǐng)域的一些嚴(yán)肅決策之中。2011年,JudeaPearl憑借因果推理模型拿到圖靈獎(jiǎng),這也預(yù)示著計(jì)算機(jī)技術(shù)的發(fā)展將有可能打開黑盒子模型,使大數(shù)據(jù)分析變成一種可解釋的行為。這與目前的大數(shù)據(jù)完全是兩條線。
今年我們也看到一個(gè)標(biāo)志性的事件,就是2015年10月份《科學(xué)》雜志出現(xiàn)的文章,只需要非常少量的樣本,只用了幾百個(gè)樣本的數(shù)據(jù),加上人的推理能力在里邊,它的性能比用數(shù)十萬的樣本得到的效果還是好,這也預(yù)示著我們盡管目前大數(shù)據(jù)很熱,在很多領(lǐng)域已經(jīng)實(shí)現(xiàn)了實(shí)際應(yīng)用,但從技術(shù)的發(fā)展來講,目前的大數(shù)據(jù)技術(shù)并不是一個(gè)進(jìn)口;以前瞻性的投資視角來看,還是應(yīng)該關(guān)注更前沿的技術(shù)發(fā)展。
機(jī)器學(xué)習(xí)如何運(yùn)用于數(shù)據(jù)治理
原英特爾中國(guó)研究院院長(zhǎng)、馭勢(shì)科技CEO吳甘沙認(rèn)為,目前大數(shù)據(jù)與人工智能領(lǐng)域存在的技術(shù)障礙主要有以下兩點(diǎn):
一是大數(shù)據(jù)工具與特定領(lǐng)域的結(jié)合。過去幾年大數(shù)據(jù)關(guān)注的是最底層的存儲(chǔ),去解決分布式運(yùn)算的基礎(chǔ)設(shè)施的問題?,F(xiàn)在是時(shí)候考慮如何進(jìn)入到具體運(yùn)用的問題。太計(jì)算機(jī)化的工具,絕大多數(shù)用戶是不知道如何使用的。從某種程度上來說,如何提供實(shí)際可用的工具給不同領(lǐng)域的用戶,有針對(duì)性地提取數(shù)據(jù)中的價(jià)值,這是現(xiàn)在很多廠商都要試圖解決的問題。
第二是數(shù)據(jù)治理問題。目前大家很少談?wù)摯髷?shù)據(jù)的數(shù)據(jù)治理環(huán)節(jié)。在傳統(tǒng)的數(shù)據(jù)分析流程中,數(shù)據(jù)清洗花費(fèi)的時(shí)間可能占到整個(gè)流程的60%-70%,消耗了大量精力和資源?,F(xiàn)在,已經(jīng)有一些機(jī)器學(xué)習(xí)運(yùn)用于數(shù)據(jù)治理方面的研究和產(chǎn)業(yè)化的嘗試出現(xiàn),機(jī)器學(xué)習(xí)可以從非結(jié)構(gòu)化的結(jié)構(gòu)中學(xué)習(xí)出結(jié)構(gòu)化的數(shù)據(jù),并通過不斷的學(xué)習(xí)把一些歧義消除。未來大數(shù)據(jù)和人工智能將出現(xiàn)一個(gè)交匯點(diǎn),大數(shù)據(jù)解決通古曉今、見微知著的問題,人工智能則解決認(rèn)知的問題,二者的結(jié)合會(huì)對(duì)一些重要領(lǐng)域的發(fā)展起到里程碑式的作用。最近IBM提出了“認(rèn)知商業(yè)”的概念,某種程度上我們可以將其理解為人工智能和大數(shù)據(jù)的結(jié)合,相信這兩種技術(shù)的組合將會(huì)有非常好的發(fā)展前景。
深度學(xué)習(xí)很好地反映了技術(shù)上面的發(fā)展,但它未必是一種終極狀態(tài)。如何把深度學(xué)習(xí)和推理、邏輯這些模型、算法結(jié)合起來,把人工智能與現(xiàn)代應(yīng)用的需求結(jié)合起來,對(duì)已有的技術(shù)進(jìn)行重新組合,搭出一些獨(dú)特的架構(gòu),將人工智能從傳統(tǒng)的感知帶入到擁有決策能力的階段,來實(shí)現(xiàn)工程上的創(chuàng)新,是未來非常值得期待的。
人工智能和大數(shù)據(jù)創(chuàng)業(yè)的建議
行業(yè)垂直類的大數(shù)據(jù)項(xiàng)目受青睞
在創(chuàng)勢(shì)資本創(chuàng)始合伙人湯旭東、極客邦創(chuàng)始人蔣濤看來,現(xiàn)在一些行業(yè)垂直類的大數(shù)據(jù)項(xiàng)目更被看好,通過三個(gè)維度對(duì)項(xiàng)目進(jìn)行評(píng)估。
第一是要有基于自然語言處理的核心技術(shù),二是擁有更多的數(shù)據(jù)源,三是要解決客戶的實(shí)際問題,實(shí)現(xiàn)數(shù)據(jù)變現(xiàn)。即使是目前的市場(chǎng)容量還不大,但如果能真正解決用戶的實(shí)際問題,就是值得投資的項(xiàng)目。
集中精力做到領(lǐng)域化和專業(yè)化
雖然吳甘沙創(chuàng)業(yè)的時(shí)間不長(zhǎng),但卻深有感觸。在吳甘沙看來,創(chuàng)業(yè)者首先要明確要解決的問題和自身專注的領(lǐng)域分別是什么。每個(gè)領(lǐng)域都有不同的問題,你要解決的問題是不是用戶真正的需求。
第二是短期內(nèi),你的目標(biāo)能不能實(shí)現(xiàn)。有時(shí)不光是技術(shù)上的問題,還要對(duì)市場(chǎng)和政策等方面進(jìn)行綜合考量。
第三個(gè)就是合伙人。在人工智能領(lǐng)域創(chuàng)業(yè)還是存在一定的技術(shù)壁壘。如想想做出與眾不同的產(chǎn)品,還是需要能力很強(qiáng)的專業(yè)人才,如果能忽悠到很強(qiáng)的人和你一起創(chuàng)業(yè),一定是事半功倍的。
利用技術(shù)實(shí)現(xiàn)產(chǎn)業(yè)上的創(chuàng)新
圖靈機(jī)器人創(chuàng)始人俞志晨認(rèn)為,在人工智能和大數(shù)據(jù)領(lǐng)域創(chuàng)業(yè),不僅技術(shù)壁壘很強(qiáng),對(duì)創(chuàng)新能力要求同樣很高,人工智能和大數(shù)據(jù)是一個(gè)長(zhǎng)線的發(fā)展過程,怎樣用技術(shù)創(chuàng)造出符合當(dāng)前環(huán)境要求、更具創(chuàng)新性質(zhì)的產(chǎn)品,是最值得關(guān)注和探索的。
憑借數(shù)據(jù)的力量提升領(lǐng)域競(jìng)爭(zhēng)力
不管是零售還是商城,許多行業(yè)都可以受益于數(shù)據(jù)驅(qū)動(dòng)的方法和技術(shù)。崔鵬教授分析到,大數(shù)據(jù)的投資熱也持續(xù)了很長(zhǎng)一段時(shí)間,“大數(shù)據(jù)”的概念也慢慢被透支。如何判斷這個(gè)公司是不是真正利用大數(shù)據(jù)技術(shù)的本質(zhì)在做產(chǎn)品,利用數(shù)據(jù)的力量提升在某一垂直領(lǐng)域競(jìng)爭(zhēng)力,而不是只扣一個(gè)概念。
對(duì)于用戶來說,自己做大數(shù)據(jù)分析是一什非常奢侈的事情,因?yàn)樗皇琴I幾個(gè)工具就可以做成的,而是要真正懂得怎么樣對(duì)數(shù)據(jù)進(jìn)行建模,怎么樣進(jìn)行數(shù)據(jù)分析,并和公司里其他部門深度耦合才能解決。一些初創(chuàng)公司不具備這樣的實(shí)力,可以向一些研究機(jī)構(gòu)或是高校尋求“產(chǎn)學(xué)研”方面的合作,這也是很好的方式。
利用已有的能力和基礎(chǔ)加速進(jìn)展
數(shù)據(jù)堂CEO齊紅威坦言,他在創(chuàng)業(yè)的過程中同樣經(jīng)歷了很多的失敗和挫折,總結(jié)出三點(diǎn)建議和大家分享。
專注。尤其是在創(chuàng)業(yè)初期,精力和時(shí)間都是有限的,領(lǐng)域化、專注化非常重要。
開放的思維。尤其是在VR、AR和大數(shù)據(jù)領(lǐng)域,一定要想辦法利用已有的能力和基礎(chǔ),比如數(shù)據(jù)層面的基礎(chǔ)或者技術(shù)層面的技術(shù),這樣會(huì)加速你的進(jìn)展,不要所有的事情都自己從頭做。
耐心。這件事情不比其他的領(lǐng)域,尤其移動(dòng)互聯(lián)網(wǎng)靠一定模式砸出來,要累積技術(shù)能力,要有很強(qiáng)的耐心。
結(jié)語
AlphaGo令人震撼的思維能力背后,是大數(shù)據(jù)挖掘和學(xué)習(xí)能力。隨著硬件的達(dá)標(biāo),算法的進(jìn)步,數(shù)據(jù)的積累,也使我們?cè)谌斯ぶ悄艿拇怪鳖I(lǐng)域看到了更多新的機(jī)遇和想法。大數(shù)據(jù)與人工智能將成為企業(yè)發(fā)展的強(qiáng)大助力,產(chǎn)生更大的商業(yè)價(jià)值。