在實際的語音系統(tǒng)中雙聲道立體聲是一項應(yīng)用最為普遍的技術(shù),他是利用人們的聽覺錯覺,通過改變兩個揚聲器的聲級差,能使聆聽者前方產(chǎn)生一定角度的聲音方向信息,從而使人們在聆聽時有“身臨其境”的聽覺感受。然而目前較為簡單的語音錄放系統(tǒng)多數(shù)采用單聲道,當(dāng)需要實現(xiàn)雙聲道語音系統(tǒng)時,往往采用復(fù)雜的硬件電路才能構(gòu)成一個雙聲道語音系統(tǒng),使得雙聲道語音系統(tǒng)的制作成本大大提高。因此用一個較為簡單的電路來實現(xiàn)雙聲道語音系統(tǒng)就顯得很有實用價值。
本文正是基于這個思想,應(yīng)用美國ISD公司制造的語音芯片ISD4004來實現(xiàn)簡單的雙聲道立體聲語音錄放系統(tǒng),并采用ATMEL公司的AVR系列單片機MEGA8L作為微控制器。該單片機的工作電壓和ISD4004的工作電壓相同,均為3 V供電,并且該單片機集成了系統(tǒng)所需要的大部分外圍器件,包括8 kB系統(tǒng)內(nèi)可編程FLASH程序存儲器,1 kB SRAM,512 B E2PROM,WATCHDOG以及晶振等,從而大大簡化了系統(tǒng)的構(gòu)成。
1、ISD4004芯片簡介
ISD4004芯片采用CMOS技術(shù),內(nèi)含振蕩器、防混淆濾波器、平滑濾波器、音頻放大器、自動降噪及高密度多電平閃爍存貯陣列。引腳包括電源、時鐘、語音信號模擬輸入/輸出端及MCU接口(SPI接口)幾部分。芯片采用多級存儲技術(shù),即聲音無須A/D轉(zhuǎn)換和D/A轉(zhuǎn)換,采用模擬量直接存儲技術(shù),因此能夠真實、自然地再現(xiàn)聲音。ISD4004系列單片錄放時間根據(jù)不同的采樣頻率可有8~16 min不等,采樣頻率可為4.0 kHz,5.3 kHz,6.4 kHz,8.0 kHz,采樣頻率越低,錄放時間越長,但音質(zhì)有所下降。芯片的所有操作必須由微控制器控制,操作命令可通過串行通信接口(SPI)送入。SPI協(xié)議是一個同步串行數(shù)據(jù)傳輸協(xié)議,協(xié)議假定微控制器的SPI移位寄存器在SCLK的下降沿動作,因此對ISD4004而言,在時鐘上升沿鎖存MOSI引腳的數(shù)據(jù),在時鐘下降沿將數(shù)據(jù)送至MISO引腳。ISD4004詳細(xì)參數(shù)可參考文獻(xiàn)[3]。
2、立體聲錄放原理
雖然ISD4004采用的是模擬量直接存儲技術(shù),能夠真實、自然地再現(xiàn)聲音,但是要想不失真地再現(xiàn)原始語音信號,其采樣頻率也必須滿足采樣定理:當(dāng)采樣頻率Fs大于信號最高頻率Fm的2倍時,在采樣過程中就不會丟失信息,并且可以用采樣后的信號重構(gòu)原始信號。即:Fs>2Fm(2Fm為最小采樣頻率,亦為“奈奎斯特頻率”)
實際的語音信號常有一些低能量的頻率分量超過采樣頻率的一半,如濁音的頻譜超過4 kHz的分量比其峰值要低40 dB以上;而對于清音,即使超過8 kHz,頻率分量也沒有下降,因此語音信號所占的頻率范圍可以到達(dá)10 kHz以上。然而對語音清晰度有明顯影響部分的最高頻率為5.7 kHz左右。CCITT(國際電報電話咨詢委員會)提出的G.711標(biāo)準(zhǔn)建議采用采樣頻率為8 kHz。
ISD4004-8M的采樣率為8.0 kHz,滿足采樣定理的頻率標(biāo)準(zhǔn),雖然錄放時間較短但是音質(zhì)較好,甚至可滿足播放簡單背景音樂的需求。立體聲錄放的實現(xiàn)采用兩片ISD4004-8M芯片構(gòu)成,如圖1所示。
工作原理為:將輸入的雙聲道語音信號分為左右聲道分別接入兩片ISD4004-8M芯片信號輸入端,錄音時由單片機發(fā)出讓兩片芯片同時錄音的指令,進(jìn)行同步錄音,使得輸入的信號在存儲的時候就能保證其原有的聲級差,從而達(dá)到了雙聲道錄音的目的。放音時由單片機同時發(fā)出放音指令,兩片芯片同時放音,因存儲時信號原有聲級差已經(jīng)保存,所以放音時可再現(xiàn)原始的立體聲,也可以在放音時對兩個芯片發(fā)送放音指令的時間間隔進(jìn)行操作,可達(dá)到調(diào)整立體聲的效果。
3、具有接近功能的立體聲系統(tǒng)的硬件原理
該系統(tǒng)的硬件原理如圖2所示,本系統(tǒng)的硬件主要由單片機MEGA8L,語音芯片ISD4004-8M,被動式紅外傳感器等構(gòu)成。圖中PIR(SENSOR)為兩元被動紅外熱釋電傳感器,其輸出信號連接到CPU的中斷1的輸入端,當(dāng)有人接近時該傳感器輸出一個高電平信號,使得CPU進(jìn)入中斷,然后CPU再對ISD4004進(jìn)行放音操作,使ISD4004輸出已錄制好的音頻信號,再經(jīng)過功率放大器放大后送入揚聲器。兩個按鍵TAPE,PALY是進(jìn)行錄音和放音的人工操作按鍵,相應(yīng)有兩個指示燈進(jìn)行狀態(tài)指示。MEGA8L還通過控制繼電器K1來控制音頻信號功率放大器的供電,在長時間沒有放音時將自動切斷其供電,這樣降低了系統(tǒng)的功耗,避免了功率放大器長時間通電。
由于該系統(tǒng)的硬件設(shè)計針對的是語音模擬信號,所以在設(shè)計的時候應(yīng)該注意模擬地和數(shù)字地的隔離,特別是在ISD4004芯片的引腳上,須注意不同的接地引腳接相應(yīng)的地。錄音時的輸入信號如果是單聲道的信號,應(yīng)在錄音時使得左右聲道的輸入端均接入該信號,并在對兩個語音芯片發(fā)送錄音指令時中間應(yīng)有短時的時間間隔,可使得單聲道產(chǎn)生一定的聲級差,從而達(dá)到非立體聲轉(zhuǎn)換為立體聲的效果。
4、軟件設(shè)計
軟件流程圖如圖3所示。
系統(tǒng)上電后先進(jìn)行初始化,軟件實現(xiàn)的基本操作有:
(1)TAPE為錄音按鍵,PLAY為放音測試按鍵,當(dāng)TAPE鍵按下后,CPU操作ISD4004進(jìn)行錄音,同時相應(yīng)的LED燈亮表示正在錄音,此時當(dāng)TAPE鍵再次按下時,錄音停止,相應(yīng)的LED燈滅表示錄音停止。PIAY鍵為錄音后的放音測試按鍵,按鍵后相當(dāng)于紅外傳感器信號有效,CPU操作ISD4004進(jìn)行放音,相應(yīng)的LED燈亮表示正在放音,從而實現(xiàn)了語音在線錄放;
(2)每次錄音時CPU將錄音時間的長度記錄到其內(nèi)部的E2PROM中,以便在放音的過程中適時對ISD4004進(jìn)行相應(yīng)的啟停操作;
(3)CPU通過控制繼電器來控制功率放大器的供電,若5 min沒有人接近紅外傳感器,CPU自動切斷功率放大器供電,從而減少了功率放大器的通電時間,延長了其使用壽命,減小了整個系統(tǒng)的功耗。
該程序采用的編譯環(huán)境為:晶士電子Atmanavr C IDEV4.4;
程序燒制軟件為:雙龍電子的SLISP V1.1;
編譯語言:C語言;
對ISD4004操作的例程如下:
5、結(jié) 語
本文介紹了由兩片ISD4004語音芯片構(gòu)成的具有接近功能的立體聲語音系統(tǒng),該系統(tǒng)已經(jīng)成功應(yīng)用于一個醫(yī)療產(chǎn)品展覽會,滿足自動語音立體聲講解的需求,且可以播放較為簡單的背景音樂,能夠可靠穩(wěn)定地工作。該系統(tǒng)亦可應(yīng)用于多煤體語音教學(xué),語音導(dǎo)向系統(tǒng)等,為立體聲語音錄放電路設(shè)計開辟了一個新的途徑。