科大訊飛副總裁于繼棟
年初,2018深圳機(jī)器人創(chuàng)新與發(fā)展論壇在深圳威尼斯睿途酒店隆重舉辦,本次論壇以“創(chuàng)新驅(qū)動(dòng)灣區(qū)智造”為主題,來(lái)自全國(guó)機(jī)器人及人工智能領(lǐng)域產(chǎn)業(yè)上下游的精英大咖、專家學(xué)者齊聚一堂,共同探討推動(dòng)新的一年機(jī)器人產(chǎn)業(yè)在技術(shù)、應(yīng)用、金融和服務(wù)等方面的創(chuàng)新應(yīng)用。論壇上,科大訊飛副總裁于繼棟以《智慧AI,智享未來(lái)》為題演講,現(xiàn)將全文發(fā)布,以饗讀者。
經(jīng)過(guò)2015年到2018年三年時(shí)間,從數(shù)據(jù)上能夠看出整個(gè)機(jī)器人產(chǎn)業(yè)已經(jīng)進(jìn)入了高速發(fā)展的狀態(tài),未來(lái)三到五年內(nèi),機(jī)器人非常有可能達(dá)到萬(wàn)億級(jí)規(guī)模。智能機(jī)器人是人工智能一個(gè)非常重要的載體,因?yàn)樘岬饺斯ぶ悄?,所有人的第一反?yīng)就是有各種各樣的人形機(jī)器人,所以機(jī)器人本身就是一個(gè)AI在物理世界的載體,機(jī)器人時(shí)代可能凝聚了這樣四種不同層面的智能,包括運(yùn)動(dòng)智能、感知智能、運(yùn)算智能、認(rèn)知智能,現(xiàn)在人類比機(jī)器人厲害很多的地方在于認(rèn)知這一塊,但是認(rèn)知智能最近幾年一直在快速地發(fā)展,相信很快就會(huì)取得成果。
現(xiàn)在業(yè)界有兩個(gè)通用的方向,第一類是用現(xiàn)在DNN算法加上大數(shù)據(jù),加上一些專家知識(shí),從而形成一些在不同行業(yè)不同場(chǎng)景下快速應(yīng)用的人工智能方案,第二類是如何運(yùn)用算法去模擬人的大腦,使得AI完全像人一樣的去思考和決策。各個(gè)企業(yè)和機(jī)構(gòu)還有科研單位都在不同的方向探索,科大訊飛其實(shí)也在這兩個(gè)方向都有各自的布局。
人工智能有三級(jí)推進(jìn)體系,第一層是基礎(chǔ)算法,就是過(guò)去DNN到CNN、到現(xiàn)在的JNA、RNA的算法,第二層被稱之為技術(shù)體系,是把通用的算法通過(guò)數(shù)據(jù)、結(jié)構(gòu)化、決策組合成的一套技術(shù)體系,第三層是應(yīng)用體系,是技術(shù)的落地場(chǎng)景應(yīng)用??拼笥嶏w在過(guò)去十幾年建立了非常行之有效的算法、技術(shù)、應(yīng)用推進(jìn)體系,在最近幾年整個(gè)AI的發(fā)展中也獲得非常多的成績(jī),包括科大訊飛在去年參加的最權(quán)威的語(yǔ)音遠(yuǎn)場(chǎng)識(shí)別技術(shù)比賽,獲得了全球第一的成績(jī)。
現(xiàn)在深圳機(jī)器人廠家?guī)缀?0%以上都在用訊飛的遠(yuǎn)場(chǎng)識(shí)別方案,其中六麥克風(fēng)陣列方案去年已經(jīng)發(fā)布,現(xiàn)在有很多的合作伙伴在用這樣的方案了。另外,科大訊飛在語(yǔ)音合成、語(yǔ)音識(shí)別、圖象識(shí)別、自動(dòng)駕駛圖像識(shí)別技術(shù)上也紛紛取得了世界第一的成績(jī)。AI通過(guò)現(xiàn)在的算法已經(jīng)達(dá)到了普通人的說(shuō)話自然度,未來(lái)可能做得比普通人還要更好。
另一方面,科大訊飛在認(rèn)知方面也獲得了很大的進(jìn)步,但全世界范圍內(nèi)人工智能的認(rèn)知領(lǐng)域還是遠(yuǎn)弱于正常人。認(rèn)知技術(shù)非常難,也是人工智能取得突破的非常關(guān)鍵一點(diǎn),所以現(xiàn)在各個(gè)領(lǐng)域也都在嘗試這樣的一些技術(shù),相信隨著技術(shù)的進(jìn)步,這一突破很快會(huì)產(chǎn)生,從此可以讓機(jī)器人真正地自我學(xué)習(xí)、進(jìn)步。
實(shí)際上,在認(rèn)知學(xué)習(xí)的一些領(lǐng)域,尤其在特定的一些專家領(lǐng)域,人工智能已經(jīng)獲得很大的進(jìn)步。例如科大訊飛在國(guó)家醫(yī)師資格考試領(lǐng)域?qū)崿F(xiàn)了機(jī)器人可以通過(guò)學(xué)習(xí)試卷、書籍上的知識(shí)后,和人一樣參加考試,并且取得了前一百名這樣優(yōu)異的成績(jī)。同時(shí),科大訊飛也成為首批國(guó)家新一代人工智能開放創(chuàng)新平臺(tái),這得益于訊飛從2010年開始到現(xiàn)在為止將近七年半時(shí)間,持續(xù)地把最先進(jìn)的技術(shù)開放給合作伙伴。
從數(shù)據(jù)上來(lái)看,2017年年底該開放平臺(tái)上的合作伙伴達(dá)到了五十萬(wàn)家,在深圳這樣創(chuàng)新聚集的地方已經(jīng)超過(guò)了三萬(wàn)家合作伙伴在使用科大訊飛的技術(shù);另外活躍的終端也達(dá)到十五億,每天的語(yǔ)音交互次數(shù)達(dá)到四十億。
以科大訊飛輸入法為例,去年平均每個(gè)人每天在訊飛輸入法上使用的次數(shù)達(dá)到15.2次,這個(gè)數(shù)據(jù)在前年大概只有7次??梢钥吹诫S著語(yǔ)音能力的提升,大家用語(yǔ)音的頻次也在快速地增長(zhǎng)。而以機(jī)器人終端,每天平均交互次數(shù)達(dá)到了53次之多,機(jī)器人已將成為人工智能典型的載體,它在未來(lái)還可能成為人機(jī)交互最主要的智能終端。人類90%的信息來(lái)源于視覺(jué),但是80%的信息輸出都是靠語(yǔ)音。所以機(jī)器人需要非常強(qiáng)的語(yǔ)音交互能力才能夠?qū)崿F(xiàn)跟人類自然地交流,幫助人們解決問(wèn)題,或者創(chuàng)造新的生活方式。
科大訊飛開放平臺(tái)對(duì)開發(fā)者的支持也是業(yè)界最豐富的。從軟件,到芯片,到軟硬一體化,包括一站式整體解決方案,包括在2017年6月發(fā)布的成品級(jí)解決方案MORFEI,使得開發(fā)應(yīng)用的門檻大大地降低,開發(fā)速度大幅度提升。2017年10月科大訊飛發(fā)布了新一代AIUI開放平臺(tái)2.0,解決了開發(fā)者很多的“痛點(diǎn)”,包括開發(fā)升級(jí)、輸入輸出多樣化、語(yǔ)義聯(lián)系、個(gè)性化等,現(xiàn)在平臺(tái)已把一百多個(gè)技能、六十多個(gè)內(nèi)容開放給合作伙伴。
科大訊飛希望將開發(fā)分成兩類,一是原來(lái)的應(yīng)用開發(fā),二是通過(guò)他們的能力去創(chuàng)造一些新的技能和新的內(nèi)容發(fā)布在科大訊飛的平臺(tái)上,然后共建一個(gè)開發(fā)者生態(tài)。未來(lái)每個(gè)應(yīng)用開發(fā)者都能夠獲取到遠(yuǎn)不止一百個(gè)的內(nèi)容,甚至是幾千、幾萬(wàn)乃至更多的內(nèi)容。
科大訊飛希望開發(fā)者能夠快速地構(gòu)建自己的應(yīng)用,并且成品級(jí)解決方案MORFEI已經(jīng)有快速集成的案例。為此,科大訊飛在云端增加了一些能力,希望通過(guò)云端框架,實(shí)現(xiàn)云和端的聯(lián)系,讓開發(fā)者能夠快速的接入。AIUI把過(guò)去的所有的單點(diǎn)能力組合在了一起,科大訊飛希望AIUI通過(guò)持續(xù)地迭代、集成,讓開發(fā)者未來(lái)只要集中關(guān)注他們的工作就可以了,而不用去關(guān)注如何使用單點(diǎn)技術(shù)。
過(guò)去叫極客時(shí)代,現(xiàn)在則進(jìn)入產(chǎn)業(yè)時(shí)代,包括科大訊飛也發(fā)布了芯片方案,2麥DSP就是其中最新推出的方案,它只有芝麻粒大小,卻能夠?qū)崿F(xiàn)3米距離95%左右的識(shí)別率,并且功耗非常低,科大訊飛希望這樣的芯片能夠應(yīng)用到越來(lái)越多的終端上去。
科大訊飛整體的思路就是希望把算法軟核跟開源硬件結(jié)合在一起,促進(jìn)整個(gè)行業(yè)的快速發(fā)展。例如MORFEI麥克風(fēng),它是業(yè)界第一個(gè)實(shí)現(xiàn)全方位拾音功能的,把它放置在桌面上、墻上、天花板上都可以,這樣的拾音性能可以促進(jìn)一些智能家居上的應(yīng)用。此外,MORFEI還提供了遠(yuǎn)場(chǎng)精準(zhǔn)識(shí)別、多合成發(fā)音人自由切換等能力,未來(lái)還會(huì)有分布式的拾音能力??紤]到大部分開發(fā)者沒(méi)有聲學(xué)結(jié)構(gòu)設(shè)計(jì)經(jīng)驗(yàn),科大訊飛推出聲學(xué)評(píng)估服務(wù),可以幫用戶檢驗(yàn)產(chǎn)品的遠(yuǎn)場(chǎng)交互性能是否達(dá)到標(biāo)準(zhǔn)。
另外科大訊飛最新的一個(gè)機(jī)器人解決方案RAIBOO主要應(yīng)用在商場(chǎng)的智能導(dǎo)購(gòu)、客服營(yíng)銷??拼笥嶏w希望機(jī)器人服務(wù)合作伙伴能夠一起接入線上,融入線下,把機(jī)器人輸送到各種各樣應(yīng)用場(chǎng)景中去??拼笥嶏w不光為合作伙伴提供技術(shù),在后臺(tái)還是一套大數(shù)據(jù)的營(yíng)銷平臺(tái),通過(guò)線上跟線下數(shù)據(jù)的整合,為所有的企業(yè)提供營(yíng)銷服務(wù),這樣才能發(fā)揮機(jī)器人更大的應(yīng)用價(jià)值。