AI是風口,終須落地。一款讓大眾可用的AI產(chǎn)品,哪里是最好切入口?上周,百度AI開發(fā)者大會氣勢洶洶,但焦點被無人駕駛吸睛,就在同一天,阿里巴巴也拿出首款消費級AI產(chǎn)品天貓精靈,背后AliGenie的露面,讓人豁然領會百度也在推介同級別的DuerOS——從智能手機為載體的觸屏,到智能硬件萬物互聯(lián)的語音,下一代人機交互底層智能語音操作系統(tǒng),才是巨頭直接對壘的舞臺。
01技術必然
移動互聯(lián)網(wǎng)在便捷民眾生活,卻又在制造麻煩。年輕人每天離開家之前,都要囑咐年長的媽媽,電視這么多的按紐別按錯了,因為智能電視通常按錯了一個按鍵,一天都可能看不了電視。
智能手機因為觸屏而變得操作簡單,但在電視、空調(diào)、洗衣機??更多的硬件家居,仍然是按鈕為王,一旦加上智能聯(lián)網(wǎng)屬性,操作反而更加復雜。即便是智能手機,對未曾接受系統(tǒng)互聯(lián)網(wǎng)教育的“50后”、“60后”老年人,依舊是個復雜的事情。
阿里巴巴人工智能實驗室負責人淺雪坦言,“雖然今天手機這么普及,但是我的父母用手機的時候主要用手機的交流功能,而手機之外,80%的App老年人不會使用。這說明我們的交互方式可能還不是最好的,觸屏發(fā)展到今天,一定還有更好的替代方法”。
在百度度秘事業(yè)部總經(jīng)理景鯤看來,這樣的需求不僅存留在老年人心中,也存留在每一個人心中。每個人都曾幻想過著動口不動手的生活,每天回家對電視說,電視打開調(diào)到上次看的節(jié)目,睡覺前想放松一下,想和床頭的智能音響說,能不能播放舒緩的音樂。冬天很冷,想對電燈說,電燈關燈。
人和設備自由溝通是科技進步的重要標志,在多數(shù)產(chǎn)業(yè)人士看來,如同Windows圖形界面取代DOS命令系統(tǒng),蘋果觸屏交互取代鼠標鍵盤輸入。巨頭瞄準了下一代人機交互方式就是語音交互。在國外,亞馬遜、谷歌、蘋果、微軟都已經(jīng)投入巨大的人力來推動這個時代的變革,來自eMarketer的數(shù)據(jù)顯示,在今年一季度美國語音助手市場中,AmazonEcho的市場份額達到70.6%,GoogleHome則占到23.8%,而其他廠商(包括蘋果、聯(lián)想、LG等)分食剩下的市場份額,為5.6%。自2014年發(fā)售以來,亞馬遜Echo音箱及另外兩種語音產(chǎn)品累計銷售量接近1000萬-1100萬臺,銷售額達到8億-10億美元。市場研究機構(gòu)StrategyAnalytics預計,到2022年,北美1/3的家庭會配備智能音箱。
在中國,京東2015年聯(lián)合科大訊飛研發(fā)推出叮咚音箱,小米2016年聯(lián)合科大訊飛推出小米音箱。而現(xiàn)在阿里巴巴的天貓精靈X1來了,背后則是智能語音操作系統(tǒng)AliGenie對壘百度DuerOS的更大野心。
02巨頭對壘
天貓精靈X1,面向家庭用戶,定價只有499元。在多數(shù)業(yè)內(nèi)人看來,一臺硬件設備并不是最終目的,阿里的想法在于支撐天貓精靈的中文人機交流系統(tǒng)AliGenie。
阿里巴巴人工智能實驗室介紹,AliGenie目前涵蓋包括音樂音頻、家居控制、購物充值、兒童教育、技能市場的功能??梢曰蛘谕卣沟男袠I(yè)解決方案包括兒童領域、酒店領域、家庭場景下、toB其他商業(yè)場景、線下零售場景與其他顯示設備結(jié)合的場景。
這看起來與App或者操作系統(tǒng)所謂的開放平臺并無太大區(qū)別,蘋果iOS和安卓皆成名于此,微信甚至也想用小程序,打造輕模式的開放生態(tài)。區(qū)別的重點依舊是語音,這是阿里能夠掌握的“核心科技”。按照淺雪的構(gòu)想,依靠阿里云的機器學習技術和計算能力,AliGenie能夠不斷進化成長,越用越聰明,成為人類貼心的智能助手。
淺雪說,語言是人與人之間最主要的溝通方式,也應該是人與另外一種智能進行交流的主要方式。云端一體化帶來的趨勢是高度智能化,智能終端需要一個比手機觸屏更強大的人機交互方式。
競爭門檻在細節(jié)處,阿里表示,針對聲音環(huán)境的多變性,X1還具備一定的自我學習功能,可以根據(jù)環(huán)境噪音進行優(yōu)化,適應不同家庭環(huán)境噪音。經(jīng)過一周左右的使用,X1會更加適應所在環(huán)境,語音識別準確率達到業(yè)界最高水平。
據(jù)悉,考慮到中文語義環(huán)境的復雜性,阿里人工智能實驗室通過眾包平臺等方式,針對生活中的各種生活場景所需要用到的語義問法進行了征集,僅天氣預報就能夠理解786種中文問法,通過深度機器學習,天貓精靈X1已覆蓋20個領域的中文自然語義理解,能夠理解人類80%的意圖。
百度DuerOS不遑多讓。讓一個只會說英文的音箱學會說中國話需要多久?答案是1分鐘。在百度AI開發(fā)者大會上,百度工程師僅用17行代碼,1分鐘時間,就讓搭載了Alexa系統(tǒng)的Anker音箱,從只會講英文變成聽得懂且說得好中國話。
景鯤認為,喚醒萬物最核心的三要素是聽清、聽懂、滿足。百度的語音識別率達到97%以上,百度的DeepSpeech是2016年MIT十大突破性技術之一。
“只做好這些還不夠,人工智能時代要與場景結(jié)合,放在家庭條件、家庭小房間,放在車上,把技術真正放在場景里解決問題。所以我們研發(fā)了遠場相關的語音技術包括麥克風陣列、回聲消除、波束成形、語音喚醒、遠場識別。”景鯤說。
03合縱連橫
是操作系統(tǒng),就不是一個人在戰(zhàn)斗。阿里人工智能實驗室借著發(fā)布天貓精靈公布了首個硬件開放合作伙伴——將與國際玩具巨頭美泰合作探索其旗下主要核心IP如費雪、芭比、托馬斯和朋友等智能玩具的合作開發(fā)機會。
北京商報記者了解到,目前AliGenie支持100多個品牌,包括接入阿里智能聯(lián)盟、涂鴉科技、broadlink等智能家居方案的產(chǎn)品,更多智能家電也正在接入中。
百度DuerOS則與中信國安廣視、聯(lián)想、美的、海爾、HTC、小魚在家等合作伙伴展開廣泛合作。景鯤稱,依托三款DuerOS開發(fā)套件和一款硬件參考設計,“只要接一個電源,接一個麥克風,就可以讓你身邊的家電設備‘說話’了?!?/p>
而面對巨頭遞出的橄欖枝,中小企業(yè)做出了兩手準備。喜馬拉雅是百度DuerOS的合作伙伴,該公司副總裁、硬件事業(yè)部總經(jīng)理李海波認為,喜馬拉雅擁有非常優(yōu)質(zhì)的互聯(lián)網(wǎng)音頻內(nèi)容資源,極大地豐富了DuerOS的內(nèi)容體系。同時,音頻內(nèi)容與智能語音技術有著天然的相似點,雙方都希望通過聲音的形式與人進行互動。
就在不久前,喜馬拉雅不久前剛剛聯(lián)合獵戶天空(獵豹移動投資的語音人工智能公司)推出了智能音箱小雅。
TCL多媒體科技控股有限公司也是DuerOS的合作伙伴,該公司副總裁李昕認為,DuerOS在人工智能領域的優(yōu)勢與TCL在電視領域的積累相結(jié)合,一定會打造出與眾不同的電視產(chǎn)品,聯(lián)合DuerOS一起共建TV生態(tài)。
7月3日,TCL公告稱,旗下互聯(lián)網(wǎng)品牌雷鳥與騰訊簽訂股權合作合同,騰訊4.5億元投資互聯(lián)網(wǎng)電視雷鳥,獲得16.67%的股權,成為雷鳥第二大股東。
分析人士指出,互聯(lián)網(wǎng)企業(yè)和硬件企業(yè)的關系已經(jīng)不能單純用“站隊”來描述,作為產(chǎn)業(yè)鏈的上下游,互聯(lián)網(wǎng)企業(yè)逐漸成為底層平臺方,提供多種接口,而硬件企業(yè)依賴制造和供應鏈優(yōu)勢,可以在多個平臺做出選擇,甚至可以不同型號不同選擇。
更多資訊請關注工業(yè)機器人頻道