【中國(guó)傳動(dòng)網(wǎng) 行業(yè)動(dòng)態(tài)】在以智能音箱“百箱大戰(zhàn)”為代表的AIoT市場(chǎng)火熱的背后,實(shí)則是“帶著鐐銬跳舞”,作為業(yè)界翹楚,云知聲給到產(chǎn)業(yè)五把鑰匙。
1“百箱大戰(zhàn)”下的智能音箱市場(chǎng)滯脹
近日,人工智能算法公司云知聲發(fā)布了基于首款A(yù)IoT芯片“雨燕”的智能音箱和智能家居解決方案,并宣布將該方案開源。
今年5月,云知聲推出全球首款面向IoT的AI芯片UniOne,在一系列芯片設(shè)計(jì)中,雨燕是第一代產(chǎn)品,也是第一款面向物聯(lián)網(wǎng)人機(jī)交互場(chǎng)景的AI芯片,適用于智能家居和智能音箱領(lǐng)域;在“雨燕”之后,公司表示還將推出面向智能車載領(lǐng)域的第二代芯片“雪豹”,以及用于構(gòu)建智慧城市的第三代“旗魚”,兩款產(chǎn)品預(yù)計(jì)將分別于明、后年面世。
“UniOne雨燕”發(fā)布現(xiàn)場(chǎng)
作為初代,“雨燕”所處的智能家居語音交互市場(chǎng)異?;馃帷4舜伟l(fā)布會(huì)上,云知聲副總裁康恒博士這樣描述當(dāng)前的智能音箱格局:“從2017年開始,有一個(gè)現(xiàn)象叫‘百箱大戰(zhàn)’,與之相應(yīng)的,音箱的解決方案在今年出現(xiàn)了‘百家爭(zhēng)鳴’?!?/p>
商戰(zhàn)本為利,AIoT的戰(zhàn)爭(zhēng)也不例外。據(jù)相關(guān)數(shù)據(jù)顯示,僅是中國(guó),2018年智能家居的產(chǎn)業(yè)規(guī)模將達(dá)到1800億,兩年之后,這一數(shù)據(jù)很可能翻倍,而在2021年,將會(huì)達(dá)到5000億元。
然而,市場(chǎng)利得并不是那么容易收入囊中。
春秋、戰(zhàn)國(guó)可以決出五霸、七雄,但在當(dāng)今市場(chǎng)經(jīng)濟(jì)和世界貿(mào)易的生存規(guī)則下,如果不掌握真正的武功秘籍,那AIoT領(lǐng)域勝出的更有可能是亞馬遜、谷歌、蘋果這些無論端、云、芯都居于世界頂尖的科技巨頭。
在國(guó)內(nèi)智能音箱市場(chǎng)上,“天貓精靈”和“小愛同學(xué)”在價(jià)格戰(zhàn)上打的火熱,但不知道是否賠本賺吆喝;百度的戰(zhàn)略最初是想收購渡鴉進(jìn)入高端市場(chǎng),但在沒有商業(yè)模式的支撐,最終也只能以帶屏的小度在家略顯差異化的進(jìn)入戰(zhàn)局;作為BAT最后一家,“騰訊聽聽”在千呼萬喚中于今年4月始出來,沒有太多亮點(diǎn),主打設(shè)計(jì)和性能,也得到了一些死忠粉的支持。
總體來看,無論是“百箱大戰(zhàn)”還是BAT入局,行業(yè)整體還是呈現(xiàn)出雷聲大、雨點(diǎn)小,并不能讓市場(chǎng)形成消費(fèi)習(xí)慣的滯脹狀態(tài)。
自2012年成立以來持續(xù)在語音交互領(lǐng)域深耕的云知聲,面對(duì)如上的市場(chǎng)問題,提出了他們的幾點(diǎn)思考,以及解決方案。
康恒博士整體介紹基于雨燕AIoT芯片的開源方案
2定制芯片,用語音交互邏輯解決終端碎片化困境
為什么智能音箱、或者智能家居的概念屬性高于實(shí)際價(jià)值表現(xiàn)?
康恒首先從IoT的終端呈現(xiàn)出非常明顯的碎片化困境做出解釋:
“物聯(lián)網(wǎng)和傳統(tǒng)互聯(lián)網(wǎng)相比,產(chǎn)品形態(tài)和使用方式都呈現(xiàn)出高度多樣化。在互聯(lián)網(wǎng)時(shí)代,終端只有電腦、手機(jī),或者平板。進(jìn)入IoT時(shí)代,產(chǎn)品形態(tài)包括車機(jī)、電視、智能音箱、機(jī)器人,甚至空調(diào)、冰箱、洗衣機(jī)、廚電、小家電,所有的設(shè)備都可以連接到物聯(lián)網(wǎng)上,產(chǎn)品形態(tài)是高度碎片化和多樣化的?!?/p>
在碎片化的終端形態(tài)下,真正能夠體現(xiàn)出產(chǎn)品價(jià)值的,除了產(chǎn)品性能,更重要的是連接的性能。簡(jiǎn)單說,就是面要大、接口要廣、邏輯要強(qiáng)。
但說起來容易,做起來難。如何能夠讓終端如人腦的神經(jīng)網(wǎng)絡(luò)一般連接?這是一個(gè)追求極高速率,但又異常復(fù)雜的操作,在康恒看來,唯有芯片可以完成。
“我們把語音交互的邏輯在芯片上得到實(shí)現(xiàn)。”
目前,云知聲有專門面向AI的加速器DeepNet,包括面向語音交互、麥克風(fēng)陣列降噪和處理的數(shù)字信號(hào)處理器DSP,以及內(nèi)置通用ARM核。同時(shí),也在通用CPU上實(shí)現(xiàn)了8倍的性能提升。
在專門針對(duì)AI的性能設(shè)計(jì)方面,TTS實(shí)現(xiàn)了16倍的速度提升,深度神經(jīng)網(wǎng)絡(luò)則實(shí)現(xiàn)了50倍的提升。
在硬件加強(qiáng)和性能提升的基礎(chǔ)上,所有硬件設(shè)備實(shí)現(xiàn)了感知、表達(dá)、思考三個(gè)核心方面的增強(qiáng)賦能,同時(shí),將語音交互邏輯放在芯片上得到實(shí)現(xiàn)。
技術(shù)、產(chǎn)品、服務(wù)全棧應(yīng)對(duì)分散供應(yīng)鏈下的風(fēng)險(xiǎn)
其次,多元化的需求和碎片化的終端,導(dǎo)致了分散的供應(yīng)鏈。
對(duì)此,康恒舉例說明:
“以前,在手機(jī)行業(yè)做應(yīng)用方案,合作的供應(yīng)鏈除了常規(guī)之外,最重要的只有兩個(gè),一是主控芯片CPU,二是安卓的源代碼和谷歌合作。但對(duì)于AIoT來說,則除了芯片、硬件和操作系統(tǒng),還需要增加AI算法、云端,甚至需要把它們打包成應(yīng)用程序。所以,架構(gòu)的復(fù)雜程度完全不同?!?/p>
在應(yīng)對(duì)方式上,云知聲給出的建議是,讓方案商選擇包括技術(shù)、產(chǎn)品和服務(wù)的全棧式解決方案。
事實(shí)上,一個(gè)完整的語音交互過程需要前期的語音喚醒、聲紋識(shí)別、麥克風(fēng)陣列、回聲消除等步驟,之后才是語音識(shí)別。文字所表達(dá)的意圖,則需要由廣義自然語言理解來處理。如果將自然語言理解拓展開來,還要涉及到對(duì)話、內(nèi)容的推介,知識(shí)圖譜等非常深厚的技術(shù)框架。
在對(duì)語音交互技術(shù)的復(fù)雜性存在普遍的認(rèn)知盲區(qū)下,康恒指出了一個(gè)非常常見的謬誤:“業(yè)界有不少產(chǎn)品商會(huì)覺得產(chǎn)品可以自己做,算法公司只需要提供算法,或者引擎就可以。一般這種情況,都是低估了技術(shù)架構(gòu)的復(fù)雜度?!?/p>
然而,并不是技術(shù)全棧之后就可以完全避免風(fēng)險(xiǎn)。
最穩(wěn)妥的方式,還是進(jìn)一步達(dá)成產(chǎn)品和服務(wù)的全棧。在達(dá)成技術(shù)全?;A(chǔ)上,產(chǎn)品的全棧要考慮交互、能否量產(chǎn)等問題。而服務(wù)的全棧之所以重要,原因在于它可以把技術(shù)元素、硬件和生產(chǎn)等元素結(jié)合起來,這中間有很多需要協(xié)助客戶完成的工作。
3優(yōu)化產(chǎn)品體驗(yàn)需運(yùn)用工具和SOP提升測(cè)試規(guī)范
第三個(gè)問題是難以把控的產(chǎn)品體驗(yàn)。
和考試不一樣,在AIoT領(lǐng)域,即使產(chǎn)品的每個(gè)零部件都是高分性能,它的最終表現(xiàn)有可能是非常低分,這里牽涉屬性沖突的問題。
“真正的好產(chǎn)品不是紙面設(shè)計(jì)的高大上,而是極佳體驗(yàn)。各部分零部件的性能磨合非常重要?!笨岛惚硎菊f。
而性能磨合需要的是不斷的試驗(yàn)和測(cè)試,目前在產(chǎn)業(yè)界,這點(diǎn)做的并不好。不少欠成熟的企業(yè)還是粗放式驗(yàn)收,“把生產(chǎn)出的音箱擺在測(cè)試工位上,然后讓測(cè)試員不斷重復(fù)歡迎詞和查天氣,類似的驗(yàn)收方式都是很不正規(guī)的。”
對(duì)于如何為客戶提升測(cè)試的標(biāo)準(zhǔn)化從而提升產(chǎn)品體驗(yàn),云知聲提供了一系列工具,以及SOP,可以把控客戶在測(cè)試環(huán)節(jié)的規(guī)范運(yùn)作。
“比如說,麥克風(fēng)是否有不良,一致性是不是夠好,裝配之后,結(jié)構(gòu)是否有密封或者振動(dòng)問題?我們有一系列的工具來幫助大家,無論是IQC或者最后的產(chǎn)測(cè),甚至有一些是自動(dòng)化的工具?!笨岛阏f。
產(chǎn)品本身性能和團(tuán)隊(duì)協(xié)作決定了產(chǎn)品周期
產(chǎn)品周期對(duì)于廠商來說也是一個(gè)極大的考驗(yàn)。
其中,最常見的問題是盲目樂觀,不少廠商自認(rèn)為做硬件經(jīng)驗(yàn)很豐富,做音箱、或智能家居就可以得心應(yīng)手。
但這個(gè)邏輯,在康恒看來是不成立的。
在他看來,實(shí)際與產(chǎn)品周期緊密相關(guān)的,不是做硬件是否有經(jīng)驗(yàn),或者說企業(yè)的規(guī)模、實(shí)力、人數(shù),這些都是邊緣因素。真正起決定性的,一是上述產(chǎn)品本身的性能體驗(yàn)可以在多長(zhǎng)時(shí)間內(nèi)做到極致,二是團(tuán)隊(duì)協(xié)作,在新品的架構(gòu)上,AI、硬件、軟件和云端服務(wù)都需要不斷磨合。
在如何縮短產(chǎn)品周期的問題上,康恒表示云知聲會(huì)根據(jù)具體服務(wù)公司的業(yè)務(wù)提供方案。
4開源代碼設(shè)計(jì)促進(jìn)產(chǎn)品實(shí)現(xiàn)快速復(fù)制
最后一點(diǎn),是如何能夠在不同的產(chǎn)品之間實(shí)現(xiàn)快速復(fù)制。
產(chǎn)品形態(tài)的碎片化,導(dǎo)致了方案商在獲得收益方面不能靠單一的產(chǎn)品形態(tài)或者方案獲得滿足,需要考慮不同的應(yīng)用場(chǎng)景。那么,一個(gè)產(chǎn)品的開發(fā)能否用到之前積累的代碼和設(shè)計(jì),能否將成功經(jīng)驗(yàn)復(fù)制到新的產(chǎn)品項(xiàng)目中,對(duì)方案公司來說至關(guān)重要。
“有時(shí)候,這點(diǎn)甚至事關(guān)方案公司的生死?!笨岛銖?qiáng)調(diào)說,如果產(chǎn)品之間可以實(shí)現(xiàn)快速復(fù)制,投入將可以極大減少。
在如何優(yōu)化提升產(chǎn)品復(fù)制的問題上,云知聲采用了代碼開源和根據(jù)客戶需求完成定制兩種方式。據(jù)康恒介紹說,云知聲目前都是開源代碼設(shè)計(jì),方案商可以根據(jù)需求修改代碼,在云端服務(wù)層,會(huì)根據(jù)客戶的需求,或者具體產(chǎn)品的需求來完成定制的工作。
結(jié)語
無論是“百箱大戰(zhàn)”還是“百家爭(zhēng)鳴”,在AIoT大火的背后,終端碎片化、供應(yīng)鏈分散、產(chǎn)品體驗(yàn)難提升、產(chǎn)品周期難把控、產(chǎn)品經(jīng)驗(yàn)難復(fù)制,這五大暗流成為影響產(chǎn)業(yè)良性發(fā)展的重要風(fēng)險(xiǎn)因子,定制芯片,技術(shù)、產(chǎn)品、服務(wù)全棧,運(yùn)用工具和SOP,優(yōu)化團(tuán)隊(duì)協(xié)作,開源代碼設(shè)計(jì)是云知聲給到行業(yè)的五大對(duì)策。
雨燕AIoT芯片的開源方案現(xiàn)場(chǎng)展示
對(duì)于云知聲來說,“雨燕”在智能音箱和智能家居中的應(yīng)用讓其邁出了馳騁在AIoT領(lǐng)域的第一步,其后的“雪豹”和“旗魚”還將致力于智能汽車和智慧城市。在產(chǎn)業(yè)界,優(yōu)秀的公司會(huì)擔(dān)綱領(lǐng)導(dǎo)者的角色,它們未來會(huì)有怎樣的建樹,“機(jī)器人文明”將與您一起持續(xù)關(guān)注!