freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

語音信號端點檢測技術的研究畢業(yè)論文-文庫吧資料

2025-06-30 18:14本頁面
  

【正文】 3)由第二章可知,公式(32)計算短時能量時是求信號的平方,這樣得到的短時能量對高電頻比較敏感,所以,在通常情況下,用公式(31)求短時能量,公式(31)求得的短時能量又叫短時幅度。由于我們主要以加性噪聲作代表進行研究,帶噪語音的短時能量為干凈語音的能量再加上噪聲的能量,因此,語音段的能量大于噪聲段的能量,可根據(jù)此特性來區(qū)別語音和噪聲。短時能量是隨機參數(shù),在無聲段,清音段和濁音段,它們分別具有不同的概率密度函數(shù),圖31給出了短時能量在清音、無聲和濁音三種情況下的條件概率密度函數(shù)。 第3章 語音端點檢測的相關算法 第3章 語音端點檢測的相關算法傳統(tǒng)語音端點檢測研究者認為,語音和噪聲的主要區(qū)別在它們的能量上,所以能量是經常使用的音頻特征參數(shù),是對語音信號最直觀的表示[22,23]語音信號一般可分為無聲段(靜音段)、清音段和濁音段。其特點是通信信道上的信號分布在很寬的頻帶范圍內。特別當=0,=1時,X的分布為標準正態(tài)分布。高斯噪聲是指概率密度函數(shù)服從高斯分布的一類噪聲。一般,只要一個噪聲過程所具有的頻譜寬度遠遠大于它所作用系統(tǒng)的帶寬,并且在該帶寬中其頻譜密度基本上可以作為常數(shù)來考慮,就可以把它作為白噪聲來處理。理想的白噪聲具有無限帶寬,因而其能量是無限大,這在現(xiàn)實世界是不可能存在的。白噪聲在各個頻段上的功率是一樣的,由于白光是由各種頻率(顏色)的單色光混合而成,因而此信號的這種具有平坦功率譜的性質被稱作是“白色的”。這幾種噪聲相互疊加,共同組成系統(tǒng)的輸入噪聲,下面簡單介紹幾種常見的噪聲。(4)波動噪聲:能量持續(xù)升降變化但不短促的噪聲,例如不斷開過的汽車聲,含糊的混雜語音等。(2)緩變噪聲:能量分布隨時間緩慢變化的噪聲,例如逐漸增大的火車聲,遠處緩慢開來的汽車聲等,緩變噪聲在短時間內可近似為穩(wěn)定噪聲。根據(jù)噪聲能量變化的特點,一般可以粗略地將它分為五類[21]。加性噪聲的來源很多,它們表現(xiàn)的形式也多種多樣。一般通信中把加性噪聲看成是系統(tǒng)的背景噪聲,而乘性噪聲看成系統(tǒng)的時變性(如衰落或者多普勒),但它卻始終存在,干擾有用信號,因而不可避免地對通信造成危害。 噪聲分類噪聲是指不期望接收到的信號(相對于期望接收到的信號而言)。根據(jù)發(fā)音時聲帶是否振動,語音分為清音和濁音,發(fā)濁音時聲帶振動,發(fā)清音時聲帶不振動,清音的波形類似噪聲,很難區(qū)別清音和噪聲。(4)語音本身的結構說話時一次發(fā)出的,具有一個響亮的中心,并被明顯感覺到的語音片段叫音節(jié),一個音節(jié)可以由一個音素組成,也可以由多個音素組成。取樣數(shù)據(jù)中,有時存在突發(fā)性干擾,使短時參數(shù)變得很大,持續(xù)很短時間后又恢復,應該記入噪聲段而非語音段。(2)信道影響如果輸入信號中有50Hz工頻干擾或變換點的工作點偏移時,選用某些短時特征進行噪聲和清音的區(qū)分就顯得不可靠。(4)端點檢測:確定門限后就可以進行端點檢測,根據(jù)門限值來區(qū)分有語音段和噪聲段,得出檢測結果。特征提取是語音端點檢測的關鍵問題,特征參數(shù)選擇的好壞直接影響到語音端點檢測的準確率的高低。(2)特征提取:在時域或者頻域提取能反映語音本質特征的聲學參數(shù),如短時能量,短時過零率等。設X是取有限個值的隨機變量,則X取的概率函數(shù)表示為 (214)則X的熵為 (215)基于特征的語音端點檢測其操作主要包括以下幾個部分:預處理,特征提取,確定門限,端點檢測。 (212)即為倒譜系數(shù),通過倒譜系數(shù)求得倒譜距離為 (213)熵(用H表示)是物質的復雜程度的一種反映。倒譜能很好表示語音的特征,在強噪聲環(huán)境下,可通過倒譜系數(shù)求得倒譜距離,使用倒譜距離來作為端點檢測的特征。同態(tài)信號處理也稱為同態(tài)濾波,就是將非線性問題轉化為線性問題的處理方法。1. 短時頻譜和短時功率譜設信號經過傅里葉變換后在頻域記為則與的關系見公式(29)。圖23 濾波器示意圖傅里葉頻譜變換是語音信號頻域分析中廣泛使用的方法,對分幀加窗后的語音信號,進行傅里葉變換和逆傅里葉變換,可以相應的得到頻譜,功率譜,倒譜距離,熵等特征。濾波器組法所用的濾波器組可以用寬帶帶通濾波器,也可以用窄帶帶通濾波器,寬帶帶通濾波器具有平坦特性,可以粗略地求取語音的頻譜,其頻率分辨率降低,使用窄帶帶通濾波器,頻率分辨率提高。 (28)語音信號從時域變換成頻域,常用的頻域分析方法有帶通濾波器組法,傅里葉變換法。對于連續(xù)語音信號,過率零即時域波形通過時間軸的次數(shù),對于離散信號,如果相鄰的取樣值改變符號則過零率增加1。(3)作為一種超音段信息,用于語音識別中。對語音信號進行分幀!加窗處理后,則可得到第幀語音信號為: (25)為幀長,則第n幀語音信號的短時能量En為: (26)短時能量和短時幅度的主要用途有:(l)可以有效區(qū)分濁音段和清音段,因為濁音的En比清音大的多。語音信號分析主要從時域和頻域兩方面進行,語音信號的時域分析就是分析和提取語音信號的時域參數(shù)。當采樣周期一定時,頻率分辨率隨著窗長的增加而減少,即頻率分辨率得到提高,但時間分辨率降低,如果窗口過短,頻率分辨率降低,時間分辨率提高。在頻域要有較寬的帶寬以及較小的邊帶最大值。不同的短時分析方法以及求取不同的語音特征參數(shù)對窗函數(shù)的要求不同,可以根據(jù)實際需要選擇合適的窗函數(shù)和窗長度。加窗前確定窗長N,用一定的窗函數(shù)w(n)乘以信號s(n)從而形成加窗語音信號sw(n)。因為直接分幀相當于對語音信號加了一個矩形窗,由于時域相乘對應頻域卷積,而矩形窗的旁瓣較大,會因為在時域將信號截斷而在頻域引起頻譜泄漏,即由于頻域卷積而使能量泄漏到其它頻率處,并且分幀的長度越短這種效應越明顯。一般每秒的幀數(shù)約為33~100幀,幀移一般取幀長的1/3~2/3。為了使幀與幀之間平滑,保持連續(xù)性,一般采用交疊分幀的方法,使前一幀和后一幀具有相交部分,相交部分稱為幀移,如圖22,分幀時要對幀長和幀移的長度進行選擇,如果采用較大的幀長,則幀數(shù)太少,計算量會小,系統(tǒng)處理的速度快,但容易增加端點檢測的誤差。語音信號從整體來看其特性及表征其本質特征的參數(shù)均是隨時間變化的,但是它又具有短時平穩(wěn)特性,在短時間內(一般為10ms~30ms內)可以看作是一個近似不變的平穩(wěn)過程。預加重是通過具有6dB/倍頻程的提升高頻特性的數(shù)字濾波器來實現(xiàn),它一般是一階數(shù)字濾波器。由于語音信號的平均功率受聲門激勵和口鼻輻射的影響,高頻端大約在80Hz以上按6dB倍頻程跌落,所以當求語音信號頻譜時,頻率越高相應的成分越小,高頻部分的頻譜比低頻部分難求,因此要對語音信號進行預加重(Preemphasis)處理。發(fā)濁音時聲道受到聲帶振動的激勵引起共振,產生間歇的類斜三角形脈沖,發(fā)清音時聲道被阻礙形成湍流,可以把清音激勵模擬成隨機噪聲[17]完整的語音信號的數(shù)學模型可以用三個子模型:激勵模型、聲道模型、輻射模型的串聯(lián)來表示,如圖(21)所示: (21)圖21 語音識別系統(tǒng)圖預濾波可以達到兩個目標,第一,可以抑制輸入信號各頻域分量中頻率超過FS/2的所有分量(FS為采樣頻率),以防止混疊干擾。通常對聲道形狀和發(fā)音系統(tǒng)作某些假設,例如假設聲道是時變的具有不均勻截面積的聲管。語音生成系統(tǒng)分成三個部分,喉的部分稱為聲門,在聲門(聲帶)以下,稱為聲門子系統(tǒng),它負責產生激勵振動,是激勵系統(tǒng)。聲音是從肺部呼出的直氣流通過在喉至嘴唇的器官的各種作用而發(fā)出的。最后對本文工作進行總結,并展望了需要進一步研究的內容。包括短時能量及過零率,頻帶方差檢測法等,并分析了這幾種算法的優(yōu)缺點。第2章介紹了語音信號處理的一些基礎知識,包括語音信號的特點及語音產生的數(shù)學模型,語音端點檢測技術中的一些重要的預處理和語音在時域和頻域表現(xiàn)出來的幾個主要特征,簡單介紹了影響語音端點檢測的主要因素。論文組織結構如下所示。本課題主要研究噪聲環(huán)境下有用語音起點和終點的檢測,以提高噪聲環(huán)境下語音端點檢測的準確率為主要目的,借助已有的短時過零率和短時能量以及譜熵技術等,并以此為基礎,組合出魯棒性比較強的特征向量,從而提高噪聲環(huán)境下端點檢測的性能,使其能夠很好的應用在實際環(huán)境中。越來越多的學者對語音端點檢測技術進行研究,相繼提出許多新的語音端點檢測算法。隨著小波分析在信號處理領域的廣泛應用,也有不少基于小波分析的語音端點檢測算法被提出,例如,選擇小波部分子帶跟蹤信號的能量變化以實現(xiàn)端點檢測[16],小波變換模極大值應用于信號突變點的檢測等。文獻[13]對所有子帶的SNR進行融合,形成SAF(sum of activation function)函數(shù),此算法充分利用頻域特征,并減少對噪聲的頻域能量分布的依賴,當噪聲是非固定的時候,該方法也能可靠的執(zhí)行。近年來,通訊技術特別是移動通訊技術的飛速發(fā)展,對語音信號端點檢測方法研究提供了十分現(xiàn)實的動力。這種算法采用的不是短時能量而是短時能量的變化率,在信噪比較高的情況下,在噪聲和語音的區(qū)分點區(qū)域,由于信號幀的變化較劇烈,該方法選取的參數(shù)是一個小于1的正數(shù),而在噪聲區(qū)間或者語音區(qū)間由于信號不同,幀間的能量較平穩(wěn),變化不大,參數(shù)為0值。該算法是Rabiner等人[10]在解決信號輸出的語音很難用一般的算法來區(qū)分無語音
點擊復制文檔內容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1