freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音信號端點檢測技術的研究畢業(yè)論文(編輯修改稿)

2025-07-21 18:14 本頁面
 

【文章內(nèi)容簡介】 波器輸出為具有一定頻帶的中心頻率為的信號。圖23 濾波器示意圖傅里葉頻譜變換是語音信號頻域分析中廣泛使用的方法,對分幀加窗后的語音信號,進行傅里葉變換和逆傅里葉變換,可以相應的得到頻譜,功率譜,倒譜距離,熵等特征。由于語音信號的特性是隨著時間緩慢變化,所以采用短時傅里葉變換,相應的求得特征為短時頻域特征,這里的窗函數(shù)都使用漢明窗。1. 短時頻譜和短時功率譜設信號經(jīng)過傅里葉變換后在頻域記為則與的關系見公式(29)。 (29)語音的頻譜為的幅度,則有 (210)語音的短時功率譜的是幅度的平方,所以短時功率譜的計算方法為 (211)語音信號的倒譜分析是通過同態(tài)處理來實現(xiàn)的。同態(tài)信號處理也稱為同態(tài)濾波,就是將非線性問題轉化為線性問題的處理方法。由于語音信號可視為聲門激勵信號和聲道沖擊響應的卷積,可以對語音信號進行解卷。倒譜能很好表示語音的特征,在強噪聲環(huán)境下,可通過倒譜系數(shù)求得倒譜距離,使用倒譜距離來作為端點檢測的特征。信號的倒譜也可以定義為信號的能量譜密度函數(shù)的對數(shù)的傅里葉級數(shù)展開式的系數(shù),見式(212)。 (212)即為倒譜系數(shù),通過倒譜系數(shù)求得倒譜距離為 (213)熵(用H表示)是物質(zhì)的復雜程度的一種反映。熵H代表x的信息量,當x的分布概率相等時,熵取最大值,也就是說,的概率分布越模糊,越難判斷,H值也越大。設X是取有限個值的隨機變量,則X取的概率函數(shù)表示為 (214)則X的熵為 (215)基于特征的語音端點檢測其操作主要包括以下幾個部分:預處理,特征提取,確定門限,端點檢測。(l)預處理:包括濾波,預加重,分幀,加窗等,這里要考慮濾波器參數(shù)的選擇,分幀時幀長長度的選擇,加窗窗函數(shù)的選擇。(2)特征提取:在時域或者頻域提取能反映語音本質(zhì)特征的聲學參數(shù),如短時能量,短時過零率等。特征提取目的是將輸入信號轉化為特征參數(shù),然后利特征參數(shù)進行語音段與無聲段的區(qū)分。特征提取是語音端點檢測的關鍵問題,特征參數(shù)選擇的好壞直接影響到語音端點檢測的準確率的高低。(3)確定門限:語音段最開始的幾幀一般為無聲段,根據(jù)無聲段的特征值大小確定門限值,一般選擇較大和較小兩個門限值Tmin和Tmax,且TminTmax,Tmin很容易被超過,數(shù)值較小,對信號變化很敏感,Tmax數(shù)值較大,語音信號要一定的強度才能超過。(4)端點檢測:確定門限后就可以進行端點檢測,根據(jù)門限值來區(qū)分有語音段和噪聲段,得出檢測結果。 影響語音端點檢測的原因及噪聲分類 影響語音端點檢測的原因?qū)嶋H環(huán)境中,影響語音端點檢測性能的因素主要有:(1)噪聲的影響實際環(huán)境中噪聲無處不在,甚至在安靜的實驗室中,敲打鍵盤聲!咳嗽都是噪聲,環(huán)境中的噪聲是復雜多變的,噪聲是非平穩(wěn)的隨機過程,其能量無法精確估計。(2)信道影響如果輸入信號中有50Hz工頻干擾或變換點的工作點偏移時,選用某些短時特征進行噪聲和清音的區(qū)分就顯得不可靠。信號取樣時,由于電平的變化,難于設置對各次實驗都適用的門限值。取樣數(shù)據(jù)中,有時存在突發(fā)性干擾,使短時參數(shù)變得很大,持續(xù)很短時間后又恢復,應該記入噪聲段而非語音段。(3)人的動作的影響發(fā)音時,人的順嘴聲或其他某些雜音會使語音波形產(chǎn)生一個很小的尖鋒,并可能超過所設計的門限值,此時人呼吸的氣流也會產(chǎn)生較高電平。(4)語音本身的結構說話時一次發(fā)出的,具有一個響亮的中心,并被明顯感覺到的語音片段叫音節(jié),一個音節(jié)可以由一個音素組成,也可以由多個音素組成。任何語言都有元音和輔音兩種音素,元音是當聲帶振動時發(fā)出的聲音,而后者是呼出的聲流,由于通路的某一部分封閉起來,氣流被阻,不能暢通。根據(jù)發(fā)音時聲帶是否振動,語音分為清音和濁音,發(fā)濁音時聲帶振動,發(fā)清音時聲帶不振動,清音的波形類似噪聲,很難區(qū)別清音和噪聲。起點處是弱摩擦音時或終點處是鼻音時,語音的特性與噪聲極其相似,其中鼻韻還拖得很長。 噪聲分類噪聲是指不期望接收到的信號(相對于期望接收到的信號而言)。噪聲有加性噪聲和乘性噪聲[19]加性噪聲一般指熱噪聲、散彈噪聲等,它們與信號的關系是相加,不管有沒有信號,噪聲都存在,而乘性噪聲一般由信道不理想引起,它與信號的關系是相乘,信號在它在,信號不在它也就不在。一般通信中把加性噪聲看成是系統(tǒng)的背景噪聲,而乘性噪聲看成系統(tǒng)的時變性(如衰落或者多普勒),但它卻始終存在,干擾有用信號,因而不可避免地對通信造成危害。乘性噪聲可以通過解卷積處理轉化為加性噪聲,所以一般只對加性噪聲加以討論。加性噪聲的來源很多,它們表現(xiàn)的形式也多種多樣。這些噪聲可能源于背景,例如汽車噪聲房間反射、街道講話、背景談話等,也可能由通信系統(tǒng)產(chǎn)生,如編碼、傳輸?shù)萚20]目前自動語音識別技術在車載電話通信、免提式語音識別等方面的應用逐漸廣泛,研究背景噪聲下的魯棒性語音端點檢測算法尤為重要。根據(jù)噪聲能量變化的特點,一般可以粗略地將它分為五類[21]。(1)穩(wěn)定噪聲:能量分布基本不隨時間改變的噪聲,例如,熱噪聲,機器穩(wěn)定轟鳴等,穩(wěn)定噪聲的能量序列是各態(tài)歷經(jīng)的平穩(wěn)高斯隨機序列。(2)緩變噪聲:能量分布隨時間緩慢變化的噪聲,例如逐漸增大的火車聲,遠處緩慢開來的汽車聲等,緩變噪聲在短時間內(nèi)可近似為穩(wěn)定噪聲。(3)脈沖噪聲:能量迅速升高并降低的噪聲,例如敲擊,撞擊,開門等,脈沖噪聲的能量只在短時間內(nèi)非零。(4)波動噪聲:能量持續(xù)升降變化但不短促的噪聲,例如不斷開過的汽車聲,含糊的混雜語音等。(5)階躍噪聲:能量分布呈臺階式陡變的噪聲,例如電信信道的突變,機器的開啟或關閉等,在階躍點后可歸類為穩(wěn)定、緩變或波動噪聲。這幾種噪聲相互疊加,共同組成系統(tǒng)的輸入噪聲,下面簡單介紹幾種常見的噪聲。所有頻率具有相同能量的隨機噪聲稱為白噪聲,即功率譜密度在整個頻域內(nèi)均勻分布的噪聲,是一種功率頻譜密度為常數(shù)的隨機信號或隨機過程從耳朵的頻率響應聽起來它是非常明亮的“絲”聲(每高一個八度,頻率就升高一倍,因此高頻率區(qū)的能量也顯著增強)。白噪聲在各個頻段上的功率是一樣的,由于白光是由各種頻率(顏色)的單色光混合而成,因而此信號的這種具有平坦功率譜的性質(zhì)被稱作是“白色的”。相對的,其他不具有這一性質(zhì)的噪聲信號被稱為有色噪聲。理想的白噪聲具有無限帶寬,因而其能量是無限大,這在現(xiàn)實世界是不可能存在的。實際上,常常將有限帶寬的平整訊號視為白噪音,這樣在數(shù)學分析上更加方便。一般,只要一個噪聲過程所具有的頻譜寬度遠遠大于它所作用系統(tǒng)的帶寬,并且在該帶寬中其頻譜密度基本上可以作為常數(shù)來考慮,就可以把它作為白噪聲來處理。例如,熱噪聲和散彈噪聲在很寬的頻率范圍內(nèi)具有均勻的功率譜密度,通??梢哉J為它們是白噪聲。高斯噪聲是指概率密度函數(shù)服從高斯分布的一類噪聲。高斯分布,也稱正態(tài)分布,記為,其中和為分布的參數(shù),分別為高斯分布的期望和方差。特別當=0,=1時,X的分布為標準正態(tài)分布。如果一個噪聲,它的幅度分布服從高斯分布,而它的功率譜密度又是均勻分布的,則稱它為高斯白噪聲。其特點是通信信道上的信號分布在很寬的頻帶范圍內(nèi)。本章首先介紹了語音信號產(chǎn)生的數(shù)學模型,并簡單介紹了語音激勵產(chǎn)生的過程,接下來詳細的介紹了語音端點檢測加窗分幀等一些預處理,以及時域和頻域的一些基本特征,最后介紹了端點檢測的主要步驟和影響檢測效果的主要因素,為后面部分的研究提供了便利。 第3章 語音端點檢測的相關算法 第3章 語音端點檢測的相關算法傳統(tǒng)語音端點檢測研究者認為,語音和噪聲的主要區(qū)別在它們的能量上,所以能量是經(jīng)常使用的音頻特征參數(shù),是對語音信號最直觀的表示[22,23]語音信號一般可分為無聲段(靜音段)、清音段和濁音段。由于語音是不穩(wěn)定的,所以,我們采用“短時能量”所謂短時能量,就是先對語音信號進行分幀處理,然后對每一幀分別求其能量。短時能量是隨機參數(shù),在無聲段,清音段和濁音段,它們分別具有不同的概率密度函數(shù),圖31給出了短時能量在清音、無聲和濁音三種情況下的條件概率密度函數(shù)。圖31 短時能量在清音無聲和濁音三種情況下條件概率密度函數(shù)示意圖從圖31中可以看出,在三種情況中,濁音的短時能量最大,清音的短時能量次之,無聲的短時能量最小。由于我們主要以加性噪聲作代表進行研究,帶噪語音的短時能量為干凈語音的能量再加上噪聲的能量,因此,語音段的能量大于噪聲段的能量,可根據(jù)此特性來區(qū)別語音和噪聲。語音信號第i幀的短時能量可以用下面三種方法得到。 (31) (32) (33)由第二章可知,公式(32)計算短時能量時是求信號的平方,這樣得到的短時能量對高電頻比較敏感,所以,在通常情況下,用公式(31)求短時能量,公式(31)求得的短時能量又叫短時幅度。短時能量的計算相對于提取語音信號其它特征而言,要簡單快捷得多。首先,對語音信號進行預處理,然后計算每幀信號的能量,根據(jù)經(jīng)驗設定一個合適的門限,當信號的幅度超過該門限的時候,就認為語音開始,當幅度降低到該門限以下就認為語音結束。基于短時能量的語音端點檢測方法只適用于非常純凈的語音信號,在信噪比很高時,噪聲很小,背景噪聲對應的短時能量較小,接近于零,語音的能
點擊復制文檔內(nèi)容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1