互聯(lián)網(wǎng)發(fā)展至今,面對(duì)人工智能大時(shí)代的到來(lái),智慧、高效、便捷的人工智能研發(fā)應(yīng)用,發(fā)展智能產(chǎn)業(yè)成為科技行業(yè)工作的重中之重。協(xié)會(huì)特派記者走進(jìn)深圳海岸語(yǔ)音技術(shù)有限公司,對(duì)石偉總經(jīng)理進(jìn)行了智能語(yǔ)音行業(yè)相關(guān)專訪。
記者:智能語(yǔ)音作為人工智能應(yīng)用最成熟的技術(shù)之一,科技巨頭、初創(chuàng)公司紛紛布局,海岸語(yǔ)音是怎樣定位與布局?
石偉:從人機(jī)交互形式出發(fā),語(yǔ)音識(shí)別無(wú)疑是人工智能產(chǎn)品與用戶之間,最便捷有效的交流形式。語(yǔ)音交互技術(shù)鏈條較長(zhǎng),包括語(yǔ)音識(shí)別前端處理、語(yǔ)音識(shí)別、語(yǔ)義理解、語(yǔ)音合成等環(huán)節(jié)。在語(yǔ)音識(shí)別方面,百度、科大訊飛、谷歌等技術(shù)領(lǐng)先。我們主要做語(yǔ)音識(shí)別前端處理的技術(shù),是一家專注于智能聽覺感知技術(shù)的人工智能初創(chuàng)企業(yè),面向物聯(lián)網(wǎng)和人工智能時(shí)代,提供軟、硬件結(jié)合加云端引擎的一體化智能聽覺感知技術(shù)解決方案。
記者:海岸語(yǔ)音的產(chǎn)品及應(yīng)用有哪些?
石偉:有別于傳統(tǒng)的標(biāo)量麥克風(fēng)技術(shù),我們產(chǎn)品所采用的是聲學(xué)矢量傳感技術(shù),可同時(shí)測(cè)量聲場(chǎng)的聲壓信息和方向信息,該技術(shù)最早源于潛艇的矢量水聽器,在空氣中的應(yīng)用極少。我們團(tuán)隊(duì)歷經(jīng)8年研發(fā),打造出AI時(shí)代必不可少的機(jī)器耳朵:VecSense?智能聲矢量傳感器。該傳感器是世界首款消費(fèi)級(jí)聲矢量傳感器,可以應(yīng)用在機(jī)器人、智能音箱、家電等諸多領(lǐng)域。
記者:海岸語(yǔ)音的核心競(jìng)爭(zhēng)力體現(xiàn)在哪些方面?
石偉:把產(chǎn)品做小、成本做低(幾美元)左右,是我們研發(fā)的方向。目前VecSense?智能聲矢量傳感器比一毛錢硬幣還小三分之一,性能高、成本低、體積小的特性,使其在智能語(yǔ)音、機(jī)器人、智能家居、無(wú)人機(jī)、穿戴式設(shè)備以及智能車載等領(lǐng)域都有廣闊的應(yīng)用前景。
作為AI時(shí)代機(jī)器必備的器件之一,“機(jī)器耳朵”需要更多的信息實(shí)現(xiàn)其智能的特性,這是傳統(tǒng)的標(biāo)量麥克風(fēng)所面臨的局限性。雖然在聲學(xué)傳感器的發(fā)展史上,各大研究機(jī)構(gòu)嘗試了多種不同的方式獲取除了聲壓信息以外的聲音方向信息,但這些技術(shù)都具有各類不同的缺陷使其無(wú)法在消費(fèi)級(jí)產(chǎn)品中使用。我們?cè)谛〕叽绲膯晤w傳感器封裝內(nèi)實(shí)現(xiàn)平面360°聲音定向,并內(nèi)置多種語(yǔ)言/音頻智能算法。不僅在聽音辨位、抑制干擾、遠(yuǎn)場(chǎng)拾音方面表現(xiàn)出超強(qiáng)的性能,因其獨(dú)特的信號(hào)特性還能做到出色語(yǔ)音分離,讓智能機(jī)器同時(shí)聽懂多個(gè)說(shuō)話人的指令。
在數(shù)量、尺寸、功耗和成本方面,一顆VecSense?傳感器對(duì)應(yīng)四至八顆傳感器組成的麥克風(fēng)陣列,顯然具有突出的優(yōu)勢(shì):尺寸減少70%,功耗降低90%,同時(shí)本成可降低90%。
深圳海岸語(yǔ)音技術(shù)有限公司創(chuàng)始人、總經(jīng)理 石偉
記者:海岸語(yǔ)音發(fā)展過(guò)程中有遇到哪些困難?
石偉:目前我們產(chǎn)品還未正式推向市場(chǎng),產(chǎn)品還在不斷優(yōu)化,找到行業(yè)典型應(yīng)用是將要面臨的一大挑戰(zhàn)。在未來(lái)推向市場(chǎng)的時(shí)候,產(chǎn)品的正式落地希望能夠找到知名度較高的產(chǎn)品或廠商背書,進(jìn)一步打開市場(chǎng)。
記者:石總怎么看待科技巨頭與初創(chuàng)公司在智能語(yǔ)音領(lǐng)域的發(fā)展模式?
石偉:科技巨頭主要打造開發(fā)者生態(tài)系統(tǒng),使用算法平臺(tái)吸引開發(fā)者,實(shí)現(xiàn)數(shù)據(jù)的快速積累、產(chǎn)品的快速迭代。在智能語(yǔ)音領(lǐng)域國(guó)內(nèi)目前科大訊飛是做的比較完善,一整條產(chǎn)業(yè)鏈相關(guān)技術(shù)產(chǎn)品都有涉及,將自身語(yǔ)音技術(shù)植入相關(guān)合作伙伴的產(chǎn)品中,以推動(dòng)智能語(yǔ)音和人工智能技術(shù)在家居、車載、可穿戴等領(lǐng)域的落地。
初創(chuàng)公司目前以垂直領(lǐng)域和細(xì)分場(chǎng)景為突破口,切入產(chǎn)品場(chǎng)景應(yīng)用。初創(chuàng)企業(yè)不求大求全,而是結(jié)合自身優(yōu)勢(shì)做最“性感”的技術(shù)和產(chǎn)品。
記者:海岸語(yǔ)音未來(lái)有些什么規(guī)劃?
石偉:海岸語(yǔ)音目前專注語(yǔ)音識(shí)別前端處理,未來(lái)將從前端向一整條語(yǔ)音技術(shù)鏈條進(jìn)行滲透,實(shí)現(xiàn)音頻和視頻融合的人機(jī)交互。我們會(huì)將底層的技術(shù)打包為完整的交互解決方案,服務(wù)B端客戶。