商湯科技香港公司總裁尚海龍
年初,2018深圳機器人創(chuàng)新與發(fā)展論壇在深圳威尼斯睿途酒店隆重舉辦,本次論壇以“創(chuàng)新驅(qū)動灣區(qū)智造”為主題,來自全國機器人及人工智能領域產(chǎn)業(yè)上下游的精英大咖、專家學者齊聚一堂,共同探討推動新的一年機器人產(chǎn)業(yè)在技術、應用、金融和服務等方面的創(chuàng)新應用。論壇上,商湯科技香港公司總裁尚海龍以《“未來已來”,服務機器人飛“閱”世界》為題演講,現(xiàn)將全文發(fā)布,以饗讀者。
未來已來——人工智能時代來臨
未來我們的服務機器人大概會是什么樣子?我們先看一段電影,我們給AI視覺一個任務,這個任務是說如果AI看到電影橋段當中是浪漫的,就將紅色的曲線向上揚一下,如果覺得看到的場景是悲情的或者是糟糕的,那就將綠色的曲線向上揚一下,AI看完這個電影以后畫了類似股票這樣的曲線出來,我們跟它做了一個對話,看看AI是否真的看懂了這部電影。結(jié)果是,它說:它看了電影情節(jié)是這樣的,大概劇情是這樣的,而且很智能地能把所有的演員幫我們分出來,杰克分別出現(xiàn)在什么場景里面,露絲分別出現(xiàn)在什么場景里面,并判斷出浪漫或者糟糕、悲情的情節(jié)。由此,很多行業(yè)馬上就能看到使用場景了,公安行業(yè)說“我需要這個來抓罪犯”,零售行業(yè)說“我需要它找我的VIP”,機器人行業(yè)說“我需要它看懂場景”,這就是人工智能和機器人結(jié)合的最后一公里。
我們往下看,如果你覺得電影是這樣的,那我們放電視劇。如果我們有一臺電視機,電視機有AI智能的芯片,就是我們和高通合作一款芯片植入到電視機里,我們和電視機之間就可以做互動了,你告訴我這個演員是誰,她的扮演者是誰,她曾經(jīng)演過其他什么樣的電視劇或者電影嗎?其中她身上穿的這件衣服我想找類似的但是不要撞衫,馬上就可以聯(lián)到唯品會、京東各類平臺幫我找出來,這就是我們未來的生活,如果機器人能夠做到這樣的耳聰目明,心靈手巧,我認為這就是未來服務機器人能夠令大家滿意度提升的一個必然要求。
我們商湯科技是做技術的,我們認為技術才能稱之為一個時代,而模式是不可以的。前些年有很多模式出現(xiàn)了,比如說P2P、O2O,無論是什么to什么,它都是模式的創(chuàng)新,模式的創(chuàng)新帶有它的短暫性,模式創(chuàng)新不帶來GDP的提升,模式創(chuàng)新不能夠真正產(chǎn)生價值的增量,它只是將一部分的消費場景或者價值轉(zhuǎn)移到了另外的一個平臺上,比如由線下轉(zhuǎn)到了線上,而只有技術的創(chuàng)新才能夠真正帶來價值的飛躍,所以我們說現(xiàn)在是人工智能時代,它和過去的蒸汽機時代、電力時代、信息時代一樣,將會為我們打開一個新時代的大門。
從1956年人工智能的概念興起到現(xiàn)在,62年以來,人工智能三起兩落,我們認為第三個人工智能浪潮的元年應該定義在2011年,這62年以來發(fā)展了很多種的嘗試,誕生了很多的國際級大公司,都是在當時時代背景下最強者,這個過程中,如果說第三撥人工智能的浪潮里面哪些應用能率先落地、變現(xiàn)、突破呢?我們認為會先從語音識別的突破,再到語言認證、無人駕駛的應用以及醫(yī)療等各個行業(yè)的應用,都非常快去做到變現(xiàn)。
現(xiàn)在是一個大好的時代,人工智能已經(jīng)成了中國的一項發(fā)展國策,一些調(diào)查數(shù)據(jù)顯示,到2030年之前國家要舉全國之力建設成為人工智能的強國,商湯在這個背景下發(fā)展是非常迅速的,我們有二十余年科研經(jīng)驗的沉淀,目前有一千五百多位同事,超過八百人都是研發(fā)人員。商湯科技和其他的人工智能應用企業(yè)有一些區(qū)別,區(qū)別就在于我們是一家深度學習的平臺公司。平臺就好比安卓系統(tǒng),而應用則是APP,平臺公司是具有原創(chuàng)性的,平臺公司也具有可擴展性,所以我們創(chuàng)立以后在多個行業(yè)發(fā)力,目前已在十四個行業(yè)全球首創(chuàng)使用深度學習方法,這樣也使得我們專利技術的積累速度非常迅速。
解決機器人的應用“痛點”——缺乏和實體交互的敏銳度
商湯科技于2014年底成立,2015年推出產(chǎn)品,2015年底到2016年開始銷售,2016年到2017年我們的發(fā)展速度迅猛,每一天都可以簽到一家大型的合作伙伴。我們研發(fā)出了自己的框架平臺,有了這個平臺以后我們多項人工智能的核心技術就能夠填補最后一公里的空白,多項視覺技術率先落地之后賦能于十四個大行業(yè)。我們主要進入算法技術層和應用層,算法技術層是非常深壁壘的層面;在應用層面,我們在圖象識別、自動駕駛、IoT物聯(lián)網(wǎng)、機器人和云計算等方面都有一些建樹。我們的創(chuàng)始人湯曉鷗教授也是中國科學院深圳先進技術研究院的副院長,他是人工智能機器視覺領域最高學術會議的主席,也是國際頂級機器視覺期刊的主編,這個使得我們現(xiàn)在的技術能夠和世界最頂尖的成員同步。
我們自建平臺的最大優(yōu)勢是擁有百分之百的自主知識產(chǎn)權(quán),其次,我們依托于香港中文大學以及清華大學、中山大學、上海交大還有浙江大學這幾個聯(lián)合實驗室,使得我們的論文數(shù)量一直保持著世界的領先位置。
目前,商湯進入了十四個行業(yè)應用領域,這十四個行業(yè)驅(qū)動了巨大的產(chǎn)值,所以說在這個大產(chǎn)值背景下,商湯科技也獲得了高速的速度。現(xiàn)在,我們有多家戰(zhàn)略級合作伙伴,在人工智能+互聯(lián)網(wǎng)領域我們也有一批合作伙伴。在機器人應用上,我們已經(jīng)和二十多家機器人廠商形成了比較緊密的合作,其中有國際機器人四大家族,也有國內(nèi)的一些機器人老牌企業(yè)以及新秀。
現(xiàn)階段服務機器人的應用存在一個“痛點”,那就是缺乏和實體交互的敏銳度,這也是服務機器人之所以還沒有完全落地的主要原因所在。此外,工業(yè)機器人現(xiàn)在適應意外和變化的能力還比較弱,一些機器人廠商的良品率很好,準確度非常好,但是遇到偏差的時候它馬上要報警,需要人來處理,這種高度的自主智能和淺層次的智能之間是有一些區(qū)別的。過去的自動化設備只是把這個物體拿到這兒,能夠準確地去做這個動作,但是如果一旦中間有道擋板,怎么樣繞過擋板去到規(guī)定的動作,這就需要高度自主智能的能力,今后無論是服務型機器人還是工業(yè)機器人都需要能夠達到PILM狀態(tài):即感知(Perception)、交互(Interaction)、移動(Locomotion)、操作(Manipulation)。例如利用單目攝像頭肢體動作識別系統(tǒng),讓機器人馬上根據(jù)這個狀態(tài)去跳一段舞蹈,是我們未來要達到的狀態(tài);還有指間跟蹤、肢體識別、手勢指令和人體的追蹤,都是一些非常成熟的技術,馬上可以應用于機器人行業(yè)。
在工業(yè)機器人方面,物體自行抓取動作是非常多的,如果未知這個物體的狀態(tài),那怎么來做自主的抓取?這個概念從自動化設備、到智能型的機器人都是需要去實現(xiàn)的。我們經(jīng)過自主學習以后,用數(shù)據(jù)訓練集的方法,使得我們的機器手成為了自主智能的設備。我們希望把SLAM應用于機器人當中,用這個方法現(xiàn)在已經(jīng)廣泛采用于包括無人駕駛汽車的這類應用中。例如在某一個地方用SLAM的方法建立一個虛擬現(xiàn)實的場景,讓無人駕駛汽車自主地適應環(huán)境,或是應用于服務機器人里頭,在救送傷員、老人看護方面都能夠找到最佳的捷徑,都能夠用最好的選擇幫助到人。
另外在協(xié)作機器人方面,我們希望組裝工業(yè)的元件能夠在很大程度上實現(xiàn)高度智能化的自主決定,如通過視覺方式去達到高度的智能化。
人工智能技術來得如此兇猛澎湃,技術發(fā)展替代人包括替代簡單重復工作,是大勢所趨。商湯的目標是要把民族品牌技術放到顯眼的位置,我們認為人工智能帶來了人類文明的新篇章,文字的出現(xiàn)是人類文明的開啟,甲骨文誕生于商湯時代,我們選擇商湯作為公司名字,也意味著中華文明再次開啟的一個新時代的到來。人工智能的技術競爭非常激烈,我們還很年輕,成長必然會經(jīng)歷艱苦,但是我們的態(tài)度是非常堅決的。