freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音信號端點檢測技術(shù)的研究畢業(yè)論文-全文預(yù)覽

2025-07-15 18:14 上一頁面

下一頁面
  

【正文】 ,圖31給出了短時能量在清音、無聲和濁音三種情況下的條件概率密度函數(shù)。其特點是通信信道上的信號分布在很寬的頻帶范圍內(nèi)。高斯噪聲是指概率密度函數(shù)服從高斯分布的一類噪聲。理想的白噪聲具有無限帶寬,因而其能量是無限大,這在現(xiàn)實世界是不可能存在的。這幾種噪聲相互疊加,共同組成系統(tǒng)的輸入噪聲,下面簡單介紹幾種常見的噪聲。(2)緩變噪聲:能量分布隨時間緩慢變化的噪聲,例如逐漸增大的火車聲,遠(yuǎn)處緩慢開來的汽車聲等,緩變噪聲在短時間內(nèi)可近似為穩(wěn)定噪聲。加性噪聲的來源很多,它們表現(xiàn)的形式也多種多樣。 噪聲分類噪聲是指不期望接收到的信號(相對于期望接收到的信號而言)。(4)語音本身的結(jié)構(gòu)說話時一次發(fā)出的,具有一個響亮的中心,并被明顯感覺到的語音片段叫音節(jié),一個音節(jié)可以由一個音素組成,也可以由多個音素組成。(2)信道影響如果輸入信號中有50Hz工頻干擾或變換點的工作點偏移時,選用某些短時特征進行噪聲和清音的區(qū)分就顯得不可靠。特征提取是語音端點檢測的關(guān)鍵問題,特征參數(shù)選擇的好壞直接影響到語音端點檢測的準(zhǔn)確率的高低。設(shè)X是取有限個值的隨機變量,則X取的概率函數(shù)表示為 (214)則X的熵為 (215)基于特征的語音端點檢測其操作主要包括以下幾個部分:預(yù)處理,特征提取,確定門限,端點檢測。倒譜能很好表示語音的特征,在強噪聲環(huán)境下,可通過倒譜系數(shù)求得倒譜距離,使用倒譜距離來作為端點檢測的特征。1. 短時頻譜和短時功率譜設(shè)信號經(jīng)過傅里葉變換后在頻域記為則與的關(guān)系見公式(29)。濾波器組法所用的濾波器組可以用寬帶帶通濾波器,也可以用窄帶帶通濾波器,寬帶帶通濾波器具有平坦特性,可以粗略地求取語音的頻譜,其頻率分辨率降低,使用窄帶帶通濾波器,頻率分辨率提高。對于連續(xù)語音信號,過率零即時域波形通過時間軸的次數(shù),對于離散信號,如果相鄰的取樣值改變符號則過零率增加1。對語音信號進行分幀!加窗處理后,則可得到第幀語音信號為: (25)為幀長,則第n幀語音信號的短時能量En為: (26)短時能量和短時幅度的主要用途有:(l)可以有效區(qū)分濁音段和清音段,因為濁音的En比清音大的多。當(dāng)采樣周期一定時,頻率分辨率隨著窗長的增加而減少,即頻率分辨率得到提高,但時間分辨率降低,如果窗口過短,頻率分辨率降低,時間分辨率提高。不同的短時分析方法以及求取不同的語音特征參數(shù)對窗函數(shù)的要求不同,可以根據(jù)實際需要選擇合適的窗函數(shù)和窗長度。因為直接分幀相當(dāng)于對語音信號加了一個矩形窗,由于時域相乘對應(yīng)頻域卷積,而矩形窗的旁瓣較大,會因為在時域?qū)⑿盘柦財喽陬l域引起頻譜泄漏,即由于頻域卷積而使能量泄漏到其它頻率處,并且分幀的長度越短這種效應(yīng)越明顯。為了使幀與幀之間平滑,保持連續(xù)性,一般采用交疊分幀的方法,使前一幀和后一幀具有相交部分,相交部分稱為幀移,如圖22,分幀時要對幀長和幀移的長度進行選擇,如果采用較大的幀長,則幀數(shù)太少,計算量會小,系統(tǒng)處理的速度快,但容易增加端點檢測的誤差。預(yù)加重是通過具有6dB/倍頻程的提升高頻特性的數(shù)字濾波器來實現(xiàn),它一般是一階數(shù)字濾波器。發(fā)濁音時聲道受到聲帶振動的激勵引起共振,產(chǎn)生間歇的類斜三角形脈沖,發(fā)清音時聲道被阻礙形成湍流,可以把清音激勵模擬成隨機噪聲[17]完整的語音信號的數(shù)學(xué)模型可以用三個子模型:激勵模型、聲道模型、輻射模型的串聯(lián)來表示,如圖(21)所示: (21)圖21 語音識別系統(tǒng)圖預(yù)濾波可以達(dá)到兩個目標(biāo),第一,可以抑制輸入信號各頻域分量中頻率超過FS/2的所有分量(FS為采樣頻率),以防止混疊干擾。語音生成系統(tǒng)分成三個部分,喉的部分稱為聲門,在聲門(聲帶)以下,稱為聲門子系統(tǒng),它負(fù)責(zé)產(chǎn)生激勵振動,是激勵系統(tǒng)。最后對本文工作進行總結(jié),并展望了需要進一步研究的內(nèi)容。第2章介紹了語音信號處理的一些基礎(chǔ)知識,包括語音信號的特點及語音產(chǎn)生的數(shù)學(xué)模型,語音端點檢測技術(shù)中的一些重要的預(yù)處理和語音在時域和頻域表現(xiàn)出來的幾個主要特征,簡單介紹了影響語音端點檢測的主要因素。本課題主要研究噪聲環(huán)境下有用語音起點和終點的檢測,以提高噪聲環(huán)境下語音端點檢測的準(zhǔn)確率為主要目的,借助已有的短時過零率和短時能量以及譜熵技術(shù)等,并以此為基礎(chǔ),組合出魯棒性比較強的特征向量,從而提高噪聲環(huán)境下端點檢測的性能,使其能夠很好的應(yīng)用在實際環(huán)境中。隨著小波分析在信號處理領(lǐng)域的廣泛應(yīng)用,也有不少基于小波分析的語音端點檢測算法被提出,例如,選擇小波部分子帶跟蹤信號的能量變化以實現(xiàn)端點檢測[16],小波變換模極大值應(yīng)用于信號突變點的檢測等。近年來,通訊技術(shù)特別是移動通訊技術(shù)的飛速發(fā)展,對語音信號端點檢測方法研究提供了十分現(xiàn)實的動力。該算法是Rabiner等人[10]在解決信號輸出的語音很難用一般的算法來區(qū)分無語音、靜默音和語音而提出來的其主要思路是:先對這三種語音各自進行訓(xùn)練,得到各自的頻域特性,然后利用LPC的測度和能量的非線性組合來對這三種語音進行檢測。使用隱馬爾可夫模型進行語音端點檢測就是基于模型的檢測方法。傳統(tǒng)的語音端點檢測算法都是針對實驗室安靜環(huán)境,直到近年來,噪聲環(huán)境下的語音端點檢測才開始研究[9]。目前,語音端點檢測在高信噪比環(huán)境下已經(jīng)取得了較為滿意的檢測結(jié)果,能得出較高的準(zhǔn)確率,但在低信噪比環(huán)境下檢測的結(jié)果不夠理想,并且實際環(huán)境中的檢測性能急劇下降,實驗室的研究結(jié)果與復(fù)雜的實用環(huán)境下的語音端點檢測仍存在一定的差距,如何準(zhǔn)確地檢測出帶噪語音的端點至今仍是一個難題[8]。在科研領(lǐng)域,如3G手機等通訊產(chǎn)品的研發(fā)上,這一技術(shù)是不容回避的問題,要求在不影響接收語音信號質(zhì)量的前提下,盡可能地降低靜音段的數(shù)據(jù)傳輸率,此時精確的端點檢測就非常必要。對于語音編解碼技術(shù),降低比特率是其不斷發(fā)展的目標(biāo)和動力,因為比特率的降低不僅可以提高已經(jīng)很擁擠的信道的利用率,而且能使同樣的存儲芯片存儲更多的信息,減少手持設(shè)備的平均能量消耗,延長電池壽命。 語音端點檢測最早的應(yīng)用是在貝爾實驗室開發(fā)的電話傳輸和轉(zhuǎn)換系統(tǒng)中,用于通信信道的時間分配,通過語音端點檢測實現(xiàn)在空閑的信道插入其它的話音信息,之后,各種各樣的語音端點檢測算法在自動語音識別,說話人確認(rèn),回聲消除,語音編碼和其他方面的應(yīng)用中被提出來[4]。例如,神經(jīng)網(wǎng)絡(luò)理論、模糊集理論、小波理論是當(dāng)前熱門的研究領(lǐng)域,這些領(lǐng)域的研究常常把語音處理任務(wù)作為一個應(yīng)用實例,而語音處理研究者也從這些領(lǐng)域的研究進展中找到突破口,使語音處理技術(shù)研究取得進展。在電子計算機和人工智能機器的廣泛應(yīng)用中,人們發(fā)現(xiàn),人和機器之間最好的通訊方式是直接進行語言通訊,實現(xiàn)人機自由對話,賦予機器以聽覺,辨別話音的內(nèi)容或者辨別說話人的身份,使機器能夠按照人的意志進行各種操作,把人類從繁重或危險的勞動中解脫出來。隨著現(xiàn)代科學(xué)的蓬勃發(fā)展,人類社會越來越顯示出信息社會的特點,猶如衣、食、住、行對于人類是必要的一樣,通信和信息交換也成為了人類社會存在的必要條件,不但在人與人之間,而且在人與機器之間每時每刻都需要進行大量的信息交換,讓計算機聽懂人類的語言,是人類自計算機誕生以來夢寐以求的想法,計算機越來越向便攜化方向發(fā)展,計算環(huán)境的日趨復(fù)雜化,人們越來越迫切要求擺脫鍵盤的束縛。語音處理內(nèi)容涉及到計算機科學(xué),模式識別,信號處理,生理學(xué),語音學(xué),心理學(xué)等學(xué)科,還涉及到信號和信息處理系統(tǒng),通信和電子系統(tǒng)等具體應(yīng)用領(lǐng)域,多媒體技術(shù)的發(fā)展,使語音技術(shù)逐漸在越來越多的場合中推廣使用,語音信號處理技術(shù)發(fā)展迅速,其研究成果具有重要的學(xué)術(shù)及應(yīng)用價值,涉及一系列前沿課題,語音信號處理與信息科學(xué)中最活躍的前沿科學(xué)密切聯(lián)系,并且共同發(fā)展。例如,辦公室環(huán)境下,電腦風(fēng)扇轉(zhuǎn)動的聲音,鍵盤敲打的聲音等都是噪聲,而語音信號處理系統(tǒng)的處理對象是有效語音信號,即排除了純噪聲段的語音信號段,語音端點檢測的任務(wù)就是判斷待處理信號是語音還是非語音,從輸入信號中找到語音部分的起止點,端點檢測是語音識別,語音增強以及語音編碼等中的一個重要環(huán)節(jié)[3]。圖11 語音識別系統(tǒng)圖在語音增強中,語音端點檢測主要應(yīng)用于基于單聲道的語音增強技術(shù)中,此時,噪聲源是不可接近的,背景噪聲的特性只能從帶噪語音中獲得,使用有音無音檢測技術(shù)分離出無音段,這時無音段主要的表現(xiàn)為噪聲特性,然后再通過某種統(tǒng)計方法,即可獲得對背景噪聲特性的近似估計[6]。在現(xiàn)代通信技術(shù)中,凡是涉及到語音通信的,都需要應(yīng)用到語音端點檢測這一技術(shù),并且這一技術(shù)的重要性不僅體現(xiàn)在日常語音通信中,更體現(xiàn)在科研和國防建設(shè)上。由上面的分析可知,在有噪聲的背景下,語音端點的檢測非常重要,準(zhǔn)確的端點檢測可以提高識別的準(zhǔn)確率,并且提高系統(tǒng)的處理速度,用于語音增強中,可以進行準(zhǔn)確的噪聲模型估計,在語音編碼中,可以降低編碼的平均比特率并降低功耗。最近幾年,無線電話!免提式電話、IP電話越來越流行,這些通信設(shè)備大多工作于信噪比較低的環(huán)境中。例如,假設(shè)待檢測的語音幀為有用語音或者為噪聲的概率均為50%,如果在噪聲模型下計算出的概率為80%,而在語音模型下計算出的概率為20%,由于噪聲模型下計算出的概率大于語音模型下計算得出的概率,則可得出,所檢測的語音幀為噪聲,反之,如果在噪聲模型下計算出的概率為20%,而在語音模型下計算出的概率為80%,則可得出該幀為有用語音幀。例如,Rabiner等人在1977年提出了一種基于LPC歐氏距離測度
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1