毋庸置疑,人工智能已經(jīng)成為現(xiàn)階段的主流概念,但是如此廣泛的概念到底會(huì)以怎樣的形式落地?許多人給出了不同的答案。
在云知聲CEO黃偉看來(lái),人工智能在今天火起來(lái)的原因有很多,包括產(chǎn)業(yè)環(huán)境的成熟、數(shù)據(jù)量不足以及沒有處理能力等等。但是人工智能經(jīng)過(guò)兩次高潮的時(shí)候,最關(guān)鍵的問(wèn)題是沒有滿足需求,這次的熱潮能成功的因素在于能夠落地,以及工業(yè)界環(huán)境的滿足。“當(dāng)技術(shù)能力達(dá)到一個(gè)臨界點(diǎn),意味著顛覆的機(jī)會(huì)到了?!秉S偉在今日舉辦的獵云網(wǎng)解碼人工智能峰會(huì)上稱。
黃偉表示,人工智能一定跟行業(yè)需求結(jié)合,一定打通數(shù)據(jù)和應(yīng)用的閉環(huán),只有這樣數(shù)據(jù)和技術(shù)才能形成雙輪驅(qū)動(dòng)。這是為什么云知聲先從行業(yè)切入的主要原因。
人工智能如何驅(qū)動(dòng)產(chǎn)業(yè)化驅(qū)動(dòng)?其實(shí)從Alphago這個(gè)事之后,這個(gè)熱潮到今天為止已經(jīng)一年多。一年期間我們不僅看到行業(yè)內(nèi)部,資本市場(chǎng)甚至大爺大媽都做人工智能。今天大家一見面,如果嘴里沒有人工智能這個(gè)詞你感覺已經(jīng)Out了。但是過(guò)去一年我們生活發(fā)生什么改變?好像也沒有什么。其實(shí)人工智能這個(gè)概念提出來(lái)已經(jīng)61年,那么前兩次為什么失敗了?當(dāng)然我們有很多解釋,比如說(shuō)當(dāng)年產(chǎn)業(yè)環(huán)境不成熟,我們沒有數(shù)據(jù)、沒有處理能力、沒有好的算法。
但是有一個(gè)共同的特點(diǎn)是什么?人工智能在過(guò)去的兩次高潮和低谷的時(shí)候,有一個(gè)共同特點(diǎn)是沒有滿足需求。我們的期望值和現(xiàn)實(shí)能力之間有巨大的差別,市場(chǎng)對(duì)能力的期待總是有時(shí)間窗口,那么在一定時(shí)間之內(nèi)達(dá)不到,公眾的熱情就會(huì)散去。所以我想談的就是,人工智能如果不能落地的話,那就真的是幻影。那么恰恰這一年我們作為從業(yè)者如履薄冰,戰(zhàn)戰(zhàn)兢兢,有人問(wèn)我人能不能和機(jī)器人談戀愛?我覺得有生之年是不可能的,那種強(qiáng)人工智能,通用人工智能離我們很久遠(yuǎn)。
我們簡(jiǎn)明扼要的列出了人工智能的要素,第一點(diǎn)是大數(shù)據(jù),第二是機(jī)器學(xué)習(xí)算法,第三是我們今天擁有的,歷史上不可比擬的計(jì)算能力。這三個(gè)要素相當(dāng)于把一個(gè)火箭飛向太空,需要有燃料,有耐高溫的平臺(tái)還有大引擎,這三個(gè)缺一不可。那么深度學(xué)習(xí)出現(xiàn)之前,統(tǒng)計(jì)學(xué)習(xí)壟斷著機(jī)器學(xué)習(xí)這個(gè)領(lǐng)域。我們可以看到統(tǒng)計(jì)學(xué)隨著數(shù)據(jù)規(guī)模的增加,它的性能會(huì)有一個(gè)飽和度,就是不再增加了。但是深度學(xué)習(xí)恰恰可以增加,它可以把CPU、GPU以及超算能力非常完美的結(jié)合在一起,但是深度學(xué)習(xí)是一個(gè)黑盒子,我們知道它好用但是不知道為什么好用?我相信深度學(xué)習(xí)往下走,依然會(huì)遇到它的天花板。
前面我潑了冷水,大家覺得人工智能是不是沒有什么期待?但是人工智能和前兩次,第三次的人工智能的高潮和前兩次不一樣。一個(gè)外在的表現(xiàn)是什么?過(guò)去兩次人工智能的高潮都是學(xué)術(shù)體系在主導(dǎo),或者是學(xué)術(shù)界的集體自嗨。這次不一樣,這次熱潮是工業(yè)界引導(dǎo)。比如我們參加無(wú)論是視覺、音頻的國(guó)際的學(xué)術(shù)會(huì)議,你會(huì)發(fā)現(xiàn)最好的講解者都是來(lái)自谷歌、亞馬遜頂尖的工業(yè)界。今天看到谷歌研發(fā)TPU,英偉達(dá)的股價(jià)翻了好幾倍。那么芯片的目的就是用標(biāo)準(zhǔn)化的,非常低成本的方式來(lái)滿足需求,所以這是和前兩次非常大的不同。
那么之所以不同是因?yàn)樯疃葘W(xué)習(xí)、增強(qiáng)學(xué)習(xí)這些新技術(shù)出現(xiàn),再結(jié)合互聯(lián)網(wǎng)、IOT能夠讓我們獲得海量數(shù)據(jù),使得我們?cè)跈C(jī)器翻譯、視覺、語(yǔ)音識(shí)別、自然語(yǔ)言理解,幾乎所有的領(lǐng)域里面我們可能最近幾年取得的突破,比過(guò)去二十年三十年都要大。比如說(shuō)語(yǔ)音識(shí)別,語(yǔ)音識(shí)別的準(zhǔn)確率已經(jīng)超過(guò)人耳,視覺方面,人臉識(shí)別也超過(guò)了眼睛。那么當(dāng)技術(shù)能力達(dá)到一個(gè)臨界點(diǎn),意味著顛覆的機(jī)會(huì)到了。
所以我們可以看到在很多領(lǐng)域,比如識(shí)別、醫(yī)療、券商、互聯(lián)網(wǎng)大數(shù)據(jù)、教育、銀行保險(xiǎn)等各個(gè)領(lǐng)域。其實(shí)機(jī)器學(xué)習(xí)今天我們不是說(shuō)簡(jiǎn)單的提高效率,我們甚至可以改變整個(gè)行業(yè)。我們一般會(huì)需要速記,但是以后不需要了,因?yàn)榻裉斓闹v話會(huì)實(shí)時(shí)生成文字,那么意味著速記這個(gè)行業(yè)被顛覆了。還有很多領(lǐng)域,比如把機(jī)器學(xué)習(xí)用在金融和投資方面,它可能取得比我們交易員更好的一個(gè)交易結(jié)果。
一個(gè)很有意思的事情,我們今天都知道深度學(xué)習(xí)有一個(gè)大神,就是Hinton教授。我想說(shuō)一個(gè)點(diǎn),云知聲我們?cè)?012年12月底的時(shí)候,我們把基于深度學(xué)習(xí)的引擎上線,我們做了第一個(gè)插件,上線一周激活用戶超過(guò)五萬(wàn),可能很多用戶當(dāng)年用過(guò)深度學(xué)習(xí),你們感覺到了嗎?沒有。到Alphago事件之后我們看到很多大學(xué)很多機(jī)構(gòu)都在說(shuō)深度學(xué)習(xí),其實(shí)深度學(xué)習(xí)對(duì)我們的改變,就是從2006年Hinton教授開始做深度學(xué)習(xí),微軟第一次把深度學(xué)習(xí)用在工業(yè)領(lǐng)域里,我們還是領(lǐng)先的,我們2012年把深度學(xué)習(xí)工業(yè)化上線。直到今天深度學(xué)習(xí)幾乎改變我們所有行業(yè)。
我希望今天讓大家明白什么是人工智能,什么是感知認(rèn)知和表達(dá)決策。什么感知?圖像識(shí)別是把圖像IP化。認(rèn)知,比如自然語(yǔ)言,還有決策、推理,這些都是和人的思維和接近,但是又很難做的。還有一點(diǎn)是表達(dá),我們用例子來(lái)舉例。比如語(yǔ)音識(shí)別,感知就是從識(shí)別開始的。認(rèn)知就是我來(lái)理解你文字里面到底什么意思?表達(dá)是什么?我通過(guò)推理讓機(jī)器自己組織語(yǔ)言然后把這個(gè)表達(dá)出來(lái)。
視覺方面是什么?比如攝像頭,我監(jiān)控這個(gè)區(qū)域,我通過(guò)感知技術(shù)來(lái)識(shí)別每個(gè)人的面孔,然后把它ID化,如果ID跟黑名單匹配,那么說(shuō)明這個(gè)人是一個(gè)嫌疑犯,這時(shí)候表達(dá)是什么?公安局來(lái)抓人,這就是表達(dá),其實(shí)就是這么一個(gè)過(guò)程。當(dāng)然這里包含的點(diǎn)非常非常多。這是我們?cè)谶^(guò)去幾年里面我們的技術(shù)框架的大概進(jìn)展,我們剛成立之后第一代版本用的并不是深度學(xué)習(xí),是統(tǒng)計(jì)學(xué)習(xí)。就是非常傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí),當(dāng)時(shí)我們比較好的一點(diǎn),幾乎當(dāng)時(shí)在國(guó)內(nèi),基于統(tǒng)計(jì)我們把性能做好極致,我們用友商四分之一過(guò)程五分之一的數(shù)據(jù)量,達(dá)到比對(duì)方更好的性能指標(biāo)。統(tǒng)計(jì)學(xué)習(xí)是一個(gè)環(huán)節(jié)一個(gè)環(huán)節(jié)套一起,我學(xué)生時(shí)代就是做語(yǔ)音識(shí)別,所以以前的經(jīng)驗(yàn)起了很多幫助。深度學(xué)習(xí)就是你有數(shù)據(jù)有GPU,可以得到很好的數(shù)據(jù)。
我們當(dāng)時(shí)應(yīng)該是基本上國(guó)內(nèi)領(lǐng)先這個(gè)行業(yè),我們率先開發(fā)出一個(gè)基于深度學(xué)習(xí)的引擎。今天我們已經(jīng)3.0版本,不光是感知層面而且是認(rèn)知層面,識(shí)別精度、識(shí)別速度都比過(guò)去有非常大的提升。那么這就是算法層面。另外就是計(jì)算能力,其實(shí)技術(shù)的PK,某種意義也是一個(gè)競(jìng)賽。你不可能指望一個(gè)團(tuán)隊(duì)用非常少的數(shù)據(jù)非常少的計(jì)算單元能得到和巨頭能夠匹配的性能,這是不可能的。所以說(shuō)在過(guò)去五年里,其實(shí)我們不光在算法方面,在優(yōu)化迭代和超算能力,在數(shù)據(jù)量方面做了很多儲(chǔ)備。比如說(shuō)在2015年我們發(fā)布了我們的操作平臺(tái),在當(dāng)時(shí)那個(gè)時(shí)間我們鏈接接近兩百個(gè)GPU,這個(gè)數(shù)量級(jí)可以跟國(guó)內(nèi)行業(yè)巨頭去PK的,去年9月份我們發(fā)布了分布式操作系統(tǒng),一個(gè)是硬件一個(gè)是軟件,可以非常好的結(jié)合在一起。
另外一點(diǎn)是作為一家創(chuàng)業(yè)公司,我們很早意識(shí)到數(shù)據(jù)的價(jià)值,公司成立三個(gè)月我們發(fā)布完全免費(fèi)的開放語(yǔ)音平臺(tái)。到今天云知聲的語(yǔ)音云服務(wù)已經(jīng)接入超過(guò)一億臺(tái)設(shè)備,這個(gè)為云知聲往后面的發(fā)展做了非常好的數(shù)據(jù)方面的儲(chǔ)備。那么人工智能和商業(yè)是良性循環(huán),人工智能一定跟行業(yè)需求結(jié)合,一定打通數(shù)據(jù)和應(yīng)用的閉環(huán),只有這樣數(shù)據(jù)和技術(shù)才能形成雙輪驅(qū)動(dòng)。這是為什么我們先從行業(yè)切入的主要原因。
人工智能其實(shí)是一個(gè)很炫的東西,很虛,它是一種能力,是一種賦能,和行業(yè)結(jié)合,它一定需要一個(gè)載體。我們當(dāng)時(shí)在國(guó)內(nèi)提出云端芯的概念,今天看到幾乎所有大公司小公司都接觸這種概念都這么做,我們通過(guò)一種芯片的能力提供給大家。這是我們的商業(yè)邏輯,一縱一橫,一縱就是我們一定在一個(gè)領(lǐng)域里面,從技術(shù)層面,無(wú)論是云端服務(wù)、終端服務(wù)還是芯片,從軟件到硬件打通,形成技術(shù)壁壘。一橫,我們希望把準(zhǔn)化的技術(shù)和服務(wù)能夠同時(shí)覆蓋若干領(lǐng)域。今天我們主要是兩大方向,一個(gè)是智慧生活一個(gè)是智慧服務(wù)。智慧生活我們是以智能家居、車載為主,智慧服務(wù)是以教育、醫(yī)療為主。
我們從2014年底開始切入后方車載,車載就是AI服務(wù)+AIUI,在后端云知聲的方案有接近70%的市場(chǎng)份額。第一段是空調(diào)控制,大家看到很簡(jiǎn)單,但是實(shí)際上很難。為什么很難?因?yàn)閯偛蓬愃朴贓cho的識(shí)別,只是用現(xiàn)有的芯片,這是今天在工業(yè)界的最高標(biāo)準(zhǔn)。后面是類似Echo,比如多輪對(duì)話、打斷對(duì)話。我再?gòu)?qiáng)調(diào)一下AI和產(chǎn)業(yè)結(jié)合,成本是你必須考慮的問(wèn)題。比如做一個(gè)特別復(fù)雜的云端系統(tǒng),我只要拼數(shù)據(jù)拼資源,這是比較容易做到的。但是有限資源的情況下面達(dá)到這樣的效果是必須難的。
另外是智慧生活,我們首先從醫(yī)療切入。我們?nèi)ツ旰蛥f(xié)和醫(yī)院我們把語(yǔ)音技術(shù)應(yīng)用在醫(yī)院的病歷錄入里面。目前為止云知聲是國(guó)內(nèi)唯一一家把語(yǔ)音系統(tǒng)在醫(yī)療行業(yè)里面實(shí)際落地,今天我們從去年7月份之后,我們目前在國(guó)內(nèi)已經(jīng)落地了30多家三甲醫(yī)院,今年國(guó)內(nèi)有一百多家醫(yī)院使用云知聲的系統(tǒng)。這個(gè)系統(tǒng)第一極大的提升醫(yī)生效率,使得協(xié)和醫(yī)院病人錄入時(shí)間從三個(gè)小時(shí)節(jié)約到一個(gè)小時(shí)之內(nèi)。
我們以前很多是用復(fù)制的方式,但是這樣會(huì)產(chǎn)生大量的錯(cuò)誤,有80%是來(lái)自拷貝。我們講醫(yī)療大數(shù)據(jù),哪兒來(lái)的數(shù)據(jù)?一個(gè)醫(yī)院今天有一萬(wàn)病人,9800都是復(fù)制過(guò)來(lái)的,我們有大數(shù)據(jù)嗎?沒有,但是通過(guò)這種方式我們每天可以產(chǎn)生大量的真實(shí)數(shù)據(jù)。協(xié)和醫(yī)院已經(jīng)全面部署,大家可以看到很多科室協(xié)和醫(yī)院用這種方式給大家錄病歷了。
我們?cè)趺从眉夹g(shù)和行業(yè)結(jié)合,讓社會(huì)看到人工智能的威力,另外一點(diǎn)通過(guò)技術(shù)和商業(yè)結(jié)合,使得數(shù)據(jù)和技術(shù)之間能夠形成一個(gè)正向反饋?,F(xiàn)在我們每天可以源源不斷的獲得大量醫(yī)學(xué)上面的數(shù)據(jù),一方面使得云知聲在這個(gè)領(lǐng)域技術(shù)門檻越來(lái)越高,另外一方面使我們可以給用戶提供更好的服務(wù)。
我們今天做的所有工作使得每個(gè)設(shè)備變得更加智能化,類似我們從09、2010年我們將功能機(jī)向智能機(jī)過(guò)渡,但這個(gè)單機(jī)智能到最后一定會(huì)過(guò)渡到點(diǎn)滴智能,每個(gè)設(shè)備有感知能力有認(rèn)知能力,而且設(shè)備之間有互相學(xué)習(xí)能力,只有這樣才是真正的萬(wàn)物互聯(lián)。這是今天我們從業(yè)者我們努力的方向我們想做的事情,我覺得這些方向如果我們真的能夠,不是在云端我們每天去講故事,而是我們真正把它落地,這個(gè)方面我們可以腳踏實(shí)地的往下走。
更多資訊請(qǐng)關(guān)注工業(yè)機(jī)器人頻道