freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計基于dsp的語音信號處理系統(tǒng)設(shè)計-在線瀏覽

2025-08-06 19:16本頁面
  

【正文】 分析,包括語音信號的調(diào)制、疊加和濾波。利用這個特點,可以用一個防混迭的帶通濾波器將此范圍內(nèi)的語音信號頻率分量取出,然后按8kHz的采樣率對語音信號進行采樣,就可以得到離散的語音信號。在濁音段表現(xiàn)出周期信號的特征,在清音段表現(xiàn)出隨機噪聲的特征。 圖21語音信號時域波形圖 圖22語音信號頻域波形圖在將語音信號進行數(shù)字化前,必須先進行防混疊預(yù)濾波,預(yù)濾波的目的有兩個:抑制輸入信導(dǎo)各領(lǐng)域分量中頻率超出fs/2的所有分量(fs為采樣頻率),以防止混疊干擾。這樣,預(yù)濾波器必須是一個帶通濾波器,設(shè)其上、下截止頻率分別是fH和fL,則對于絕大多數(shù)語音編譯碼器,fH=3400Hz、fL=60~100Hz、采樣率為fs=8kHz;而對丁語音識別而言,當(dāng)用于電話用戶時,指標(biāo)與語音編譯碼器相同。為了將原始模擬語音信號變?yōu)閿?shù)字信號,必須經(jīng)過采樣和量化兩個步驟,從而得到時間和幅度上均為離散的數(shù)字語音信號。采樣時必須要注意滿足奈奎斯特定理,即采樣頻率fs必須以高于受測信號的最高頻率兩倍以上的速度進行取樣,才能正確地重建波形,它是通過采樣脈沖和模擬信號相乘來實現(xiàn)的。 圖24抽取后的信號時域波形圖和頻域波形圖對上述信號進行1/80采樣頻率抽取,即采樣頻率變?yōu)閷⒔?00Hz時,由于采樣頻率比較小,所以采樣點數(shù)就稀疏,所得離散信號就越偏離于原信號,頻譜也發(fā)生了混疊。如何合理選擇△t涉及到許多需要考慮的技術(shù)因素。但過高的采樣頻率并不可取,對固定長度(T)的信號,采集到過大的數(shù)據(jù)量(N=T/△t),給計算機增加不必要的計算工作量和存儲空間;若數(shù)據(jù)量(N)限定,則采樣時間過短,會導(dǎo)致一些數(shù)據(jù)信息被排斥在外。根據(jù)采樣定理,當(dāng)采樣頻率大于信號的兩倍帶寬時,采樣過程不會丟失信息,利用理想濾波器可從采樣信號中不失真地重構(gòu)原始信號波形。量化電平按級數(shù)變化,實際的振動值是連續(xù)的物理量。 語音信號經(jīng)過預(yù)濾波和采樣后,由A/D變換器變換為二進制數(shù)字碼。市面上購買到的普通聲卡在這方面做的都很好,語音聲波通過話筒輸入到聲卡后直接獲得的是經(jīng)過防混疊濾波、A/D變換、量化處理的離散的數(shù)字信號。調(diào)節(jié)錄音機保存界面的“更改”選項,可以存儲各種格式的WAVE文件。3 語音信號的分析語音信號分析是語音信號處理的前提和基礎(chǔ),只有分析出可表示語音信號本質(zhì)特征的參數(shù),才有可能利用這些參數(shù)進行高效的語音通信、語音合成和語音識別等處理。因此語音信號分析在語音信號處理應(yīng)用中具有舉足輕重的地位。因為,語音信號從整體來看其特性及表征其本質(zhì)特征的參數(shù)均是隨時間而變化的,所以它是一個非平穩(wěn)態(tài)過程,不能用處理平穩(wěn)信號的數(shù)字信號處理技術(shù)對其進行分析處理。所以任何語音信號的分析和處理必須建立在“短時”的基礎(chǔ)上.即進行“短時分析”,將語音信號分為一段一段來分析其特征參數(shù),其中每一段稱為一“幀”,幀長一般取為10~30ms。根據(jù)所分析出的參數(shù)的性質(zhì)的不同,可將語音信號分析分為時域分析、頻域分析、倒頻域分析等;時域分析方法具有簡單、計算量小、物理意義明確等優(yōu)點,但由于語音信號最重要的感知特性反映在功率譜中,而相位變化只起著很小的作用,所以相對于時域分析來說頻域分析更為重要。 語音信號的時域分析語音信號的時域分析就是分析和提取語音信號的時域參數(shù)。語音信號本身就是時域信號,因而時域分析是最早使用,也是應(yīng)用最廣泛的一種分析方法,這種方法直接利用語音信號的時域波形。這種分析方法的特點是:表示語音信號比較直觀、物理意義明確??梢缘玫秸Z音的一些重要的參數(shù)。語音信號的時域參數(shù)有短時能量、短時過零率、短時自相關(guān)函數(shù)和短時平均幅度差函數(shù)等,這是語音信號的一組最基本的短時參數(shù),在各種語音信號數(shù)字處理技術(shù)中都要應(yīng)用。 短時能量及短時平均幅度分析設(shè)語音波形時域信號為x(l)、加密分幀處理后得到的第n幀語音信號為 Xn(m),則Xn(m)滿足下式: 其中,n=0,1T,2T,…,并且N為幀長,T為幀移長度。為此可采用另一個度量語音信號幅度值變化的函數(shù).即短時平均幅度函數(shù)Mn,它定義為: Mn也是一幀語音信號能量大小的表征,它與En的區(qū)別在于計算時小取樣值和大取樣值不會因取平方而造成較大差異,在某些應(yīng)用領(lǐng)域也會帶來一些好處。②可以用來區(qū)分聲母與韻母的分界,無聲與有聲的分界,連字(指字之間無間隙)的分界等。短時過零率表示一幀語音中語音信號波形穿過橫軸(零電平)的次數(shù)。對于連續(xù)語音信號,過零即意味著時域波形通過時間軸;而對于離散信號,如果相鄰的取樣值改變符號則稱為過零。定義語音信號Xn(m)的短時過零率Zn為:式中,sgn[ ]是符號函數(shù),即:在實際中求過零率參數(shù)時,需要十分注意的一個問題是如果輸入信號中包含有50Hz的工頻干擾或者A/D變換器的工作點有偏移(這等效于輸入信號有直流偏移),往往會使計算的過零率參數(shù)很不準(zhǔn)確。對于后一個問題除了可以采用低直流漂移器件外,也可以在軟件上加以解決,這就是算出每一幀的直流分量并予以濾除。而發(fā)清音時,多數(shù)能量出現(xiàn)在較高頻率上。當(dāng)然,這種高低僅是相對而言,并沒有精確的數(shù)值關(guān)系。在孤立詞的語音識別中,必須要在一連串連續(xù)的語音信號中進行適當(dāng)分割,用以確定一個一個單詞的語音信號,即找出每一個單詞的開始和終止位置,這在語音處理中是一個基本問題。但是研究表明,在以某些音為開始或結(jié)尾時。只用其中一個參量來判別語音的起點和終點是有困難的,必須同時使用這兩個參數(shù)。 圖31語音信號的短時能量和短時平均過零率 語音信號的頻域分析語音信號的頻域分析就是分析語音信號的頻域持征。本文介紹的是語音信號的傅里葉分析法。對第n幀語音信號Xn(m)進行傅里葉變換(離散時域傅里葉變換,DTFT),可得到短時傅里葉變換,其定義如下: (31)由定義可知,短時傅里葉變換實際就是窗選語音信號的標(biāo)準(zhǔn)傅里葉變換。由于窗口是有限長度的,滿足絕對可和條件,所以這個變換是存在的。我們還可以將式(3—1)寫成另一種形式。當(dāng)n取固定值時,w(nm)的傅里葉變換為: (32)根據(jù)卷積定理,有: (33)因為上式右邊兩個卷積項均為關(guān)于角頻率w的以2π為周期的連續(xù)函數(shù),所以也可將其寫成以下的卷積積分形式: (34)即,假設(shè)x(m)的DTFT是,且的DTFT是,那么是和的周期卷積。由式(34)可知,為了使忠實再現(xiàn)的特性。所以為了使,需;但是N值太大時,信號的分幀又失去了意義。因此,應(yīng)折衷選擇窗的寬度N。而漢明窗在頻率范圍中的分辨率較高,而且旁辯的衰減大,具有頻譜泄漏少的優(yōu)點。與離散傅里葉變換和連續(xù)博里葉變換的關(guān)系一樣,如令角頻率w=2πk/N,則得離散的短時傅里葉變換(DFT)。當(dāng)然,這時窗長N必須是2的倍數(shù)(L是整數(shù))。另外,為了使具有較高的頻率分辨率,所取的DFT以及相應(yīng)的FFT點數(shù)應(yīng)該足夠多,但有時的長度N要受到采樣率和短時性的限制,例如,在通常采樣率為8kHz且?guī)L為20ms時,N=例如、在10kHz的范圍內(nèi)采樣求頻譜,并要求頻率分辨率在30Hz以下。FFT的計算可以在通用計算機上由相應(yīng)的算法軟件來完成,這種方式一般只能實現(xiàn)非實時運算。為了完成1024點的FFT,這些專用芯片所需的運算時間是幾十毫秒至幾毫秒,甚至可以降至1ms以下。往往都是利用語音信號的功率譜。并且功率譜是短時自相關(guān)函數(shù)的傅里葉變換。 圖32同一人兩次說同一詞的功率譜比較可以看出功率譜圖比較好地反映出聲音的個人特征:在低頻部分(頻率低于6000Hz),同一人說同一詞,其功率譜圖中的各個波峰所對應(yīng)的頻率基本相同;不同人說同一詞,其功率譜圖的出現(xiàn)波峰的頻率比較接近;同一人說不同詞時功率譜的形狀差別較大。 語音信號的語譜圖語音的時域分析和頻域分析是語音分析的兩種重要方法。但是由于語音信號隨時間變化是很緩慢的,因而在一段短時間內(nèi)(如10~30ms之間,即所謂的一幀之內(nèi))可以認為其頻譜是固定不變的,這種頻譜又稱為短時譜。因此,人們致力于研究語音的時頻分析特性。語譜圖是一種三維頻譜,它是表示語音頻譜隨時間變化的圖形,其縱軸為頻率,橫軸為時間,任一給定頻率成分在給定時刻的強弱用相應(yīng)點的灰度或色調(diào)的濃淡來表示。語譜圖中顯示了大量的與語音的語句特性有關(guān)的信息,它綜合了頻譜圖和時域波形的特點,明顯地顯示出語音頻譜隨時間的變化情況,或者說是一種動態(tài)的頻譜;記錄這種頻譜的儀器就是語譜儀。帶通濾波器有兩種帶寬可供選擇:窄帶為45Hz,寬帶為300Hz。寬帶語譜圖能給出語音的共振峰頻率及清輔音的能量匯集區(qū),在語譜圖里共振峰呈現(xiàn)為黑色的條紋。語語圖的實際應(yīng)用是用于確定出講話人的本性。因而可以利用聲紋鑒別不同的講話人。雖然對采用語譜圖的講活人識別技術(shù)的可靠性存在相當(dāng)?shù)膽岩桑壳斑@一技術(shù)已在司法法庭得到某些認可及采用。同時給出了相應(yīng)的語音的時域波形。橫杠是與時間軸平行的幾條深黑色帶紋,它們相應(yīng)于短時譜中的幾個凸出點,也就是共振峰。在一個語音段的語譜圖中,有沒有橫扛出現(xiàn)是判斷它是否是濁音的重要標(biāo)志。每個豎直條相當(dāng)于一個基音,條紋的起點相當(dāng)于聲門脈沖的起點,條紋之間的距離表示基音周期。4 語音信號的綜合仿真分析
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1