將聲矢量技術(shù)帶入消費級市場
文:深圳市機器人協(xié)會 楊小彬2018年第三期
互聯(lián)網(wǎng)發(fā)展至今,面對人工智能大時代的到來,智慧、高效、便捷的人工智能研發(fā)應(yīng)用,發(fā)展智能產(chǎn)業(yè)成為科技行業(yè)工作的重中之重。協(xié)會特派記者走進深圳海岸語音技術(shù)有限公司,對石偉總經(jīng)理進行了智能語音行業(yè)相關(guān)專訪。
記者:智能語音作為人工智能應(yīng)用最成熟的技術(shù)之一,科技巨頭、初創(chuàng)公司紛紛布局,海岸語音是怎樣定位與布局?
石偉:從人機交互形式出發(fā),語音識別無疑是人工智能產(chǎn)品與用戶之間,最便捷有效的交流形式。語音交互技術(shù)鏈條較長,包括語音識別前端處理、語音識別、語義理解、語音合成等環(huán)節(jié)。在語音識別方面,百度、科大訊飛、谷歌等技術(shù)領(lǐng)先。我們主要做語音識別前端處理的技術(shù),是一家專注于智能聽覺感知技術(shù)的人工智能初創(chuàng)企業(yè),面向物聯(lián)網(wǎng)和人工智能時代,提供軟、硬件結(jié)合加云端引擎的一體化智能聽覺感知技術(shù)解決方案。
記者:海岸語音的產(chǎn)品及應(yīng)用有哪些?
石偉:有別于傳統(tǒng)的標量麥克風(fēng)技術(shù),我們產(chǎn)品所采用的是聲學(xué)矢量傳感技術(shù),可同時測量聲場的聲壓信息和方向信息,該技術(shù)最早源于潛艇的矢量水聽器,在空氣中的應(yīng)用極少。我們團隊歷經(jīng)8年研發(fā),打造出AI時代必不可少的機器耳朵:VecSense™智能聲矢量傳感器。該傳感器是世界首款消費級聲矢量傳感器,可以應(yīng)用在機器人、智能音箱、家電等諸多領(lǐng)域。
記者:海岸語音的核心競爭力體現(xiàn)在哪些方面?
石偉:把產(chǎn)品做小、成本做低(幾美元)左右,是我們研發(fā)的方向。目前VecSense™智能聲矢量傳感器比一毛錢硬幣還小三分之一,性能高、成本低、體積小的特性,使其在智能語音、機器人、智能家居、無人機、穿戴式設(shè)備以及智能車載等領(lǐng)域都有廣闊的應(yīng)用前景。
作為AI時代機器必備的器件之一,“機器耳朵”需要更多的信息實現(xiàn)其智能的特性,這是傳統(tǒng)的標量麥克風(fēng)所面臨的局限性。雖然在聲學(xué)傳感器的發(fā)展史上,各大研究機構(gòu)嘗試了多種不同的方式獲取除了聲壓信息以外的聲音方向信息,但這些技術(shù)都具有各類不同的缺陷使其無法在消費級產(chǎn)品中使用。我們在小尺寸的單顆傳感器封裝內(nèi)實現(xiàn)平面360°聲音定向,并內(nèi)置多種語言/音頻智能算法。不僅在聽音辨位、抑制干擾、遠場拾音方面表現(xiàn)出超強的性能,因其獨特的信號特性還能做到出色語音分離,讓智能機器同時聽懂多個說話人的指令。
在數(shù)量、尺寸、功耗和成本方面,一顆VecSense™傳感器對應(yīng)四至八顆傳感器組成的麥克風(fēng)陣列,顯然具有突出的優(yōu)勢:尺寸減少70%,功耗降低90%,同時本成可降低90%。
深圳海岸語音技術(shù)有限公司創(chuàng)始人、總經(jīng)理 石偉
記者:海岸語音發(fā)展過程中有遇到哪些困難?
石偉:目前我們產(chǎn)品還未正式推向市場,產(chǎn)品還在不斷優(yōu)化,找到行業(yè)典型應(yīng)用是將要面臨的一大挑戰(zhàn)。在未來推向市場的時候,產(chǎn)品的正式落地希望能夠找到知名度較高的產(chǎn)品或廠商背書,進一步打開市場。
記者:石總怎么看待科技巨頭與初創(chuàng)公司在智能語音領(lǐng)域的發(fā)展模式?
石偉:科技巨頭主要打造開發(fā)者生態(tài)系統(tǒng),使用算法平臺吸引開發(fā)者,實現(xiàn)數(shù)據(jù)的快速積累、產(chǎn)品的快速迭代。在智能語音領(lǐng)域國內(nèi)目前科大訊飛是做的比較完善,一整條產(chǎn)業(yè)鏈相關(guān)技術(shù)產(chǎn)品都有涉及,將自身語音技術(shù)植入相關(guān)合作伙伴的產(chǎn)品中,以推動智能語音和人工智能技術(shù)在家居、車載、可穿戴等領(lǐng)域的落地。
初創(chuàng)公司目前以垂直領(lǐng)域和細分場景為突破口,切入產(chǎn)品場景應(yīng)用。初創(chuàng)企業(yè)不求大求全,而是結(jié)合自身優(yōu)勢做最“性感”的技術(shù)和產(chǎn)品。
記者:海岸語音未來有些什么規(guī)劃?
石偉:海岸語音目前專注語音識別前端處理,未來將從前端向一整條語音技術(shù)鏈條進行滲透,實現(xiàn)音頻和視頻融合的人機交互。我們會將底層的技術(shù)打包為完整的交互解決方案,服務(wù)B端客戶。
中傳動網(wǎng)版權(quán)與免責(zé)聲明:
凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(m.u63ivq3.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
關(guān)注伺服與運動控制公眾號獲取更多資訊
關(guān)注直驅(qū)與傳動公眾號獲取更多資訊
關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊
掃碼關(guān)注小程序
時刻關(guān)注行業(yè)動態(tài)
填寫郵件地址,訂閱更多資訊:
撥打電話咨詢:13751143319 余女士
郵箱:chuandong@chuandong.cn
- 運動控制
- 伺服系統(tǒng)
- 機器視覺
- 機械傳動
- 編碼器
- 直驅(qū)系統(tǒng)
- 工業(yè)電源
- 電力電子
- 工業(yè)互聯(lián)
- 高壓變頻器
- 中低壓變頻器
- 傳感器
- 人機界面
- PLC
- 電氣聯(lián)接
- 工業(yè)機器人
- 低壓電器
- 機柜