√天堂资源最新版中文资源,中文字幕无码一级二级,女人与拘做受AAAAA片

Learning soft mask with DNN and DNN-SVM for multi-speaker DOA estimation using an acoustic vector sensor

文：2017年第三期

語音聲源到達(dá)角（DirectionofArrival，DOA）估計是服務(wù)機(jī)器人聽覺感知系統(tǒng)的關(guān)鍵技術(shù)之一，其功能是為服務(wù)機(jī)器人提供準(zhǔn)確的語音聲源所在方向估計。在真實復(fù)雜的聲學(xué)環(huán)境中，遠(yuǎn)場語音聲源的DOA估計易受到噪聲、混響和干擾的影響，一直是學(xué)術(shù)界的研究熱點。為了提高對語音聲源DOA估計的精度和魯棒性，同時考慮到陣列尺寸和易搭載需求，本文創(chuàng)新地提出采用聲學(xué)矢量傳感器（AcousticVectorSensor，AVS）拾取語音聲源，在保持傳感器物理體積小的前提下獲取多路語音信號，其次，在本團(tuán)隊前期工作基礎(chǔ)上，創(chuàng)新地提出了一種基于有監(jiān)督學(xué)習(xí)的語音信號主導(dǎo)時頻點魯棒提取方法，同時實現(xiàn)了語音聲源DOA估計的魯棒性和準(zhǔn)確性。具體內(nèi)容為:（1）根據(jù)人耳基于局部時頻區(qū)域?qū)崿F(xiàn)語音感知與分離的生理學(xué)機(jī)制，提出了一種新的級聯(lián)局部語譜塊（TandemLocalSpectrogramBlock，TLSB）特征，該特征能夠有效區(qū)分語音信號主導(dǎo)時頻點和干擾信號主導(dǎo)時頻點；（2）通過構(gòu)造大量不同噪聲和混響環(huán)境下的TLSB數(shù)據(jù)集，訓(xùn)練一個深度神經(jīng)網(wǎng)絡(luò)（DeepNeuralNetwork，DNN）語音信號主導(dǎo)時頻點軟膜估計器，用于提取目標(biāo)主導(dǎo)時頻點；（3）為了減少人為設(shè)定閾值，提升算法可擴(kuò)展性，提出采用DNN模型最后一層隱含層特征表示，訓(xùn)練支持向量機(jī)（SupportVectorMachine，SVM）實現(xiàn)軟膜估計；（4）利用提取出的語音主導(dǎo)時頻點計算傳感器間數(shù)據(jù)比（Inter-SensorDataRatio，ISDR），采用核密度聚類方法對ISDR進(jìn)行聚類可實現(xiàn)多聲源的DOA估計。通過大量實驗證明，驗證了本文提出的方法在不同的噪聲和混響環(huán)境中都具有更高的DOA估計精度和魯棒性。

傳感器

中傳動網(wǎng)版權(quán)與免責(zé)聲明：

凡本網(wǎng)注明[來源：中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件，版權(quán)均為中國傳動網(wǎng)(m.u63ivq3.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”，違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件，均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士，版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者，禁止擅自篡改，違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題，請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系，否則視為放棄相關(guān)權(quán)利。