Learning soft mask with DNN and DNN-SVM for multi-speaker DOA estimation using an acoustic vector sensor

文:2017年第三期

語音聲源到達(dá)角(DirectionofArrival,DOA)估計是服務(wù)機(jī)器人聽覺感知系統(tǒng)的關(guān)鍵技術(shù)之一,其功能是為服務(wù)機(jī)器人提供準(zhǔn)確的語音聲源所在方向估計。在真實復(fù)雜的聲學(xué)環(huán)境中,遠(yuǎn)場語音聲源的DOA估計易受到噪聲、混響和干擾的影響,一直是學(xué)術(shù)界的研究熱點。為了提高對語音聲源DOA估計的精度和魯棒性,同時考慮到陣列尺寸和易搭載需求,本文創(chuàng)新地提出采用聲學(xué)矢量傳感器(AcousticVectorSensor,AVS)拾取語音聲源,在保持傳感器物理體積小的前提下獲取多路語音信號,其次,在本團(tuán)隊前期工作基礎(chǔ)上,創(chuàng)新地提出了一種基于有監(jiān)督學(xué)習(xí)的語音信號主導(dǎo)時頻點魯棒提取方法,同時實現(xiàn)了語音聲源DOA估計的魯棒性和準(zhǔn)確性。具體內(nèi)容為:(1)根據(jù)人耳基于局部時頻區(qū)域?qū)崿F(xiàn)語音感知與分離的生理學(xué)機(jī)制,提出了一種新的級聯(lián)局部語譜塊(TandemLocalSpectrogramBlock,TLSB)特征,該特征能夠有效區(qū)分語音信號主導(dǎo)時頻點和干擾信號主導(dǎo)時頻點;(2)通過構(gòu)造大量不同噪聲和混響環(huán)境下的TLSB數(shù)據(jù)集,訓(xùn)練一個深度神經(jīng)網(wǎng)絡(luò)(DeepNeuralNetwork,DNN)語音信號主導(dǎo)時頻點軟膜估計器,用于提取目標(biāo)主導(dǎo)時頻點;(3)為了減少人為設(shè)定閾值,提升算法可擴(kuò)展性,提出采用DNN模型最后一層隱含層特征表示,訓(xùn)練支持向量機(jī)(SupportVectorMachine,SVM)實現(xiàn)軟膜估計;(4)利用提取出的語音主導(dǎo)時頻點計算傳感器間數(shù)據(jù)比(Inter-SensorDataRatio,ISDR),采用核密度聚類方法對ISDR進(jìn)行聚類可實現(xiàn)多聲源的DOA估計。通過大量實驗證明,驗證了本文提出的方法在不同的噪聲和混響環(huán)境中都具有更高的DOA估計精度和魯棒性。

 

 

 

 

 

 

 

中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(m.u63ivq3.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

伺服與運(yùn)動控制

關(guān)注伺服與運(yùn)動控制公眾號獲取更多資訊

直驅(qū)與傳動

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

中國傳動網(wǎng)

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

2017年第三期

2017年第三期

圖片閱讀

掃碼關(guān)注小程序

時刻關(guān)注行業(yè)動態(tài)

雜志訂閱

填寫郵件地址,訂閱更多資訊:

撥打電話咨詢:13751143319 余女士
郵箱:chuandong@chuandong.cn

熱搜詞
  • 運(yùn)動控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點贊 0
取消 0
往期雜志
  • 2024年第1期

    2024年第1期

    伺服與運(yùn)動控制

    2024年第1期

  • 2023年第4期

    2023年第4期

    伺服與運(yùn)動控制

    2023年第4期

  • 2023年第3期

    2023年第3期

    伺服與運(yùn)動控制

    2023年第3期

  • 2023年第2期

    2023年第2期

    伺服與運(yùn)動控制

    2023年第2期

  • 2023年第1期

    2023年第1期

    伺服與運(yùn)動控制

    2023年第1期