報道蘋果公司時記者總是這樣類比:世界銀行追蹤研究的199個國家中,有183個國家的2015年國內(nèi)生產(chǎn)總值(GDP)低于蘋果市值。蘋果市值幾乎是伊朗和奧地利GDP的總和。從這個角度看,蘋果、谷歌、亞馬遜這樣的巨無霸之間的競爭很像一場國戰(zhàn)。國戰(zhàn)的根本特征是不管你喜歡不喜歡最終都會被卷入,那怕你與此看似毫不相關(guān),恰如互聯(lián)網(wǎng)與傳統(tǒng)零售行業(yè)。
終極生態(tài)與即將白熱化的競爭
到現(xiàn)在為止我們在IT行業(yè)看到了三類性質(zhì)迥異的成功:
一類是硬科技型公司,比如Intel和高通,這類硬科技項目雖然其上也有生態(tài),但技術(shù)壁壘仍然在商業(yè)模式中占據(jù)較大權(quán)重;
一類是工具平臺型公司,在這點上集大成的是操作系統(tǒng),典型公司則是微軟。對于操作系統(tǒng)而言技術(shù)、工程等很關(guān)鍵,但更關(guān)鍵的則是其上的應(yīng)用生態(tài)系。所以雖然Linux免費,但也沒可能在PC這種終端上撼動微軟的地位。
一類是互聯(lián)網(wǎng)生態(tài)公司,這點大家會比較熟悉,比如我們常說的BAT。和上一類的核心差異在于Windows根本不是數(shù)據(jù)驅(qū)動,而互聯(lián)網(wǎng)生態(tài)公司大多時候其生態(tài)依賴于其里面的數(shù)據(jù)和內(nèi)容。社交時關(guān)系鏈是其核心內(nèi)容,搜索時爬到的東西是其內(nèi)容,電商時商品是其內(nèi)容。
這種行業(yè)分工內(nèi)置了足夠的技術(shù)合理性,不太會發(fā)生實質(zhì)性變化。但可能會變化的是公司在其中扮演的角色,比如Google最終同時控制操作系統(tǒng)和搜索引擎,這會影響最終競爭的走勢。在最終格局中實際扮演那種角色影響控制權(quán),而控制權(quán)影響商業(yè)模式和利潤空間。
以控制力大小而論,中間層非數(shù)據(jù)驅(qū)動的OS影響力最大,其次才是互聯(lián)網(wǎng)生態(tài)公司,最弱是硬科技型公司。這在近來蘋果PK騰訊一事中體現(xiàn)的特別清楚。因此我們也可以說直到Android,Google的商業(yè)模式其實并不穩(wěn)固,所以它才那么有動力在OS層突圍。
這樣一來國戰(zhàn)的焦點就在于誰能控制遠場語音交互下的OS。這點上結(jié)局很可能和過去不同,因為這些公司都實在太大了。
蘋果不用說一定還會是自己的封閉生態(tài)系,Google,亞馬遜和微軟則一定會在各自的勢力版圖上排斥對方。短期看,Google和亞馬遜不太可能分出勝負,也不太可能使用對方的系統(tǒng)。這是非常有意思的一種局面,過去在行業(yè)早期巨頭就同時關(guān)注某一行業(yè)的先例不是沒有但并不能形成相對勢均力敵的競爭,比如Windows+Nokia與Android陣營的競爭。但這次在行業(yè)早期所有的巨頭都關(guān)注這個點,每家背后都近乎擁有無盡的資源。所以戰(zhàn)況一定會比想的還要激烈。
作為結(jié)果我們可能會在較長的時間內(nèi)面臨多OS并存的局面。
高通這樣的芯片公司位置在哪里
每次人機交互的變革必會引起OS的變革,這至少在過去兩次產(chǎn)品大升級中得到了驗證。從命令行到圖形用戶界面促成了Windows這樣的操作系統(tǒng),而從鍵盤鼠標(biāo)到觸屏則促成了iOS和Android。所以我們有理由相信這次遠場語音交互一樣會引起OS層面的變更。在這背景下看高通這類芯片公司的角色和行為就特別有意思。
高通最近推出了一款SoC,讓IPQ40x8/9支持陣列算法,從各方報道來看應(yīng)該是通過DSP來實現(xiàn)的。高級副總裁RahulPatel則說:有可能Echo的語音功能都會被整合進AP,這是新的趨勢。這樣一來有些傳統(tǒng)廠商比如科勝訊確實會難過,因為過去一般是它們搭著高通等來實現(xiàn)一組功能,這下高通把事情全干了,相當(dāng)于它們不太好找到自己的位置了。
但高通干的事其實并不對路,放在整個人機交互變革的背景下看就相當(dāng)于需要回答:OS適合放到芯片里面嗎?
OS顯然不能放芯片里,算法是可以放芯片里的,但算法是遠場語音交互的一個部分,并且不太適合切割出來。
這可以拿喚醒做例子進行說明,實現(xiàn)喚醒的時候通常需要與最終產(chǎn)品的亮燈相關(guān)聯(lián)。這樣一來首先要有降噪算法提高喚醒率,然后訓(xùn)練過的喚醒模型監(jiān)測周圍的聲音,一旦檢測到喚醒詞時,要反饋出特定的角度,這個角度信息再傳遞給系統(tǒng),系統(tǒng)才知道Echo上面那一圈燈究竟應(yīng)該亮那個。顯然的在這個場景下,算法、消息、硬件控制彼此交織在一起,這是OS的范疇,但并不是芯片的范疇。
一般來講這類彼此間的消息越多,OS對外呈現(xiàn)出的功能也就越強大。這樣的一種系統(tǒng)顯然不可能放芯片里。唯有部分算法是可以放芯片里的,但在行業(yè)早期這樣其實并沒太大價值,一是算法并未穩(wěn)定仍然需要持續(xù)提高,一是這種芯片集成算法的方式反倒會降低整個系統(tǒng)的靈活程度。假設(shè)A公司想做一款叫X的產(chǎn)品,其未來衍生產(chǎn)品為Y,那當(dāng)然它希望用統(tǒng)一架構(gòu)實現(xiàn)這兩者,而A公司顯然也不希望這種實現(xiàn)只能用高通的某幾款芯片,而希望在更寬的范圍內(nèi)進行靈活選擇。
微信上很多人看到高通干這事會很震驚等等,覺得會對行業(yè)產(chǎn)生如何如何的影響,但實際上并沒有意識到高通其實選了條歪路。高通在語音交互這事上應(yīng)該是一直沒太想清楚,它并不是第一次干與語音交互相關(guān)的事(JAN6,2016就做過類似的發(fā)布),但似乎每次最終都會無疾而終。
這樣一來芯片公司的角色就非常清楚:芯片公司在遠場語音交互這場PK中會是受益者,但顯然不能發(fā)揮主導(dǎo)作用。這與PC或手機剛啟動的時候狀態(tài)非常不一樣。那個時候如果沒有Intel、高通一代代賦能,PC或手機這樣的產(chǎn)品是沒辦法一代代升級的。也就是說芯片公司是在關(guān)鍵路徑上。但眼下已有各種芯片其計算能力是足夠的,而交互方式本身與操作系統(tǒng)融合更緊。
高通與蘋果會給遠場語音交互帶來什么
雖然蘋果的產(chǎn)品不一定立刻就大賣,高通的SoC估計也掀不起什么浪花,但他們確實會為這個賽道注入更多的信心。
就像觸屏影響了所有的設(shè)備一樣,遠場語音交互也一定會影響所有設(shè)備。這就為市場提供了足夠多的新機會。
在巨頭的帶動下,已有產(chǎn)品品類會普遍進行升級,汽車、手機、PAD、筆記本、電視、玩具、攝像頭、耳機等。而新的產(chǎn)品品類也會持續(xù)出現(xiàn),比如訊飛經(jīng)常展示的翻譯機、電話會議系統(tǒng)等。
產(chǎn)品大升級的同時也會催生方案提供商上的需求。聲音的冷僻程度要遠比當(dāng)年做手機時的系統(tǒng)定制為甚,復(fù)雜程度也會遠超此前的手機。在有的場景它可能對功耗提出極高的要求,在有的場景,它可能更多的是挑戰(zhàn)性價比。這點通過了解聲智科技推出的各種方案可以獲得更為直觀的體驗。不再一線的人很難理解這種復(fù)雜度是如何導(dǎo)入的,因為理論上似乎像高通那樣把算法與芯片相結(jié)合,所有的問題就應(yīng)該解決了。但實際上這樣是不行的,因為從算法和芯片到具體能落地的產(chǎn)品中間還有著很大的距離:麥克風(fēng)數(shù)產(chǎn)生距離、陣型產(chǎn)生距離、計算結(jié)構(gòu)也產(chǎn)生距離、新需求的持續(xù)發(fā)生等也會導(dǎo)入類似的問題。
但這個層次確實具有高度不確定性,是會出現(xiàn)MTK那種提供Turnkey方案的公司,還是會出現(xiàn)新的OS,或者OS會有什么新的變種,亦或者會長期多OS并存?
小結(jié)
短期來看高通、蘋果的入局實質(zhì)影響不大,更多的是在信心層面。兩個顯然的后果里:一個是高度確定的,那就是遠場語音交互必成;一個則具有高度不確定性,傳統(tǒng)的OS一層上到底會發(fā)生什么?
更多資訊請關(guān)注電力電子頻道