freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音端點(diǎn)檢測(cè)算法的研究及matla程序仿真與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)-文庫吧資料

2025-06-28 08:21本頁面
  

【正文】 量,利用前幾幀倒譜矢量的平均值可估計(jì)背景噪聲的倒譜矢量,噪聲倒譜矢量的近似值可按規(guī)則311進(jìn)行更新,即當(dāng)前幀被認(rèn)為是非語音幀: (311),ct為當(dāng)前測(cè)試幀的倒譜矢量, p為調(diào)節(jié)參數(shù)。實(shí)際上,由于c0包含信號(hào)能量信息,基于能量的端點(diǎn)檢測(cè)可以看作倒譜距離的一個(gè)特例。 倒譜距離設(shè)信號(hào)s(n) ,其倒譜變換為c(n)。噪聲環(huán)境下,短時(shí)能量和短時(shí)過零率顯得無能為力,而倒譜則能夠忽略噪聲大小的影響而直接從本質(zhì)上把語音信號(hào)和噪聲信號(hào)給區(qū)分開來。 基于倒譜特征的語音端點(diǎn)檢測(cè) 倒譜特征在語音識(shí)別系統(tǒng)中,不管是語音識(shí)別還是語音檢測(cè),倒譜這個(gè)特征參數(shù)要比短時(shí)能量和過零率含有更高的信息量,也更容易與噪聲信號(hào)區(qū)分開來,因此有許多端點(diǎn)檢測(cè)的方法都是基于倒譜特征來進(jìn)行的。圖36是對(duì)語音進(jìn)行加噪,即通過matlab加1序列的白噪聲。如圖所示:圖35 高信噪比能零率的語音端點(diǎn)檢測(cè)圖36 低信噪比能零率的語音端點(diǎn)檢測(cè)因?yàn)槭窃诒容^安靜的環(huán)境的情況下錄得語音,所以信噪比比較高。首先先在比較安靜的環(huán)境下進(jìn)行錄音,以模擬高信噪比的環(huán)境。文中加Hmmaing窗,通過特性為()的濾波器預(yù)加重。文中語音信號(hào)樣本是自己采用麥克風(fēng)錄得語音“啊”,以wav格式存儲(chǔ)為較純凈的語音樣本。兩個(gè)語音字之間發(fā)音是有一定的時(shí)間間隔,因此也需設(shè)定最短靜音,如果處于靜音段,而其長(zhǎng)度小于最短靜音,則認(rèn)為語音還沒結(jié)束,繼續(xù)語音段的檢測(cè)。因此可以根據(jù)突發(fā)噪聲短時(shí)間性質(zhì),對(duì)語音長(zhǎng)度設(shè)置一定的門限。我們所設(shè)置的最短語音和最短靜音就是為了防止一些突發(fā)性的噪聲。在靜音時(shí),超過門限,則進(jìn)入語音段,低于門限,進(jìn)入結(jié)束。從步驟上來看,可以把一個(gè)語音信號(hào)分成四個(gè)階段,靜音、開始過渡結(jié)束四個(gè)階段。語音的開始和結(jié)束由于時(shí)間上的差異,信噪比也會(huì)有差異,這樣決定著門限選擇的復(fù)雜性。如果低于這個(gè)門限,則語音信號(hào)有可能進(jìn)入語音結(jié)束,再往后搜索,如果繼續(xù)降低且低于較低的門限,則語音信號(hào)進(jìn)入無聲階段。(3)當(dāng)進(jìn)入語音階段時(shí),就開始判決語音信號(hào)的終止點(diǎn)。(2)由特征參數(shù)值,先選一個(gè)比較低一點(diǎn)的門限,進(jìn)行最先的預(yù)判,如果低于這個(gè)門限肯定不是語音信號(hào)。隨后的幾幀一直大于這個(gè)值,而這幾幀大于最小語音值,則一定進(jìn)入語音階段。通常每一個(gè)參數(shù)設(shè)兩個(gè)門限。但隨著噪聲的增加,過零率占有稍微好點(diǎn)的優(yōu)勢(shì),等加到一定的程度后,這兩種方法都將失去檢測(cè)的效果?;诙虝r(shí)能量和短時(shí)過零率相結(jié)合語音端點(diǎn)檢測(cè)方法,充分利用能量和過零率的優(yōu)點(diǎn),使用過零率區(qū)分清音和靜音。當(dāng)然,這種高低僅是相對(duì)而言的,并沒有精確的數(shù)值關(guān)系。當(dāng)發(fā)清音時(shí),多數(shù)能量出現(xiàn)在較高頻率上,而高頻就意味著高的平均過零率。定義語音信號(hào)Xn(m)的短時(shí)過零率Zn為: (37)其中,sgn為符號(hào)函數(shù),即: (38)過零率有很重要的作用,如:用于粗略地描述信號(hào)的頻譜特性,就是用多帶濾波器將信號(hào)分為若干個(gè)通道,對(duì)各通道進(jìn)行短時(shí)平均過零率和短時(shí)能量的計(jì)算。由語音信號(hào)的波峰波谷之間的變化,然后對(duì)其進(jìn)行歸一化處理,波峰波谷之間的變化轉(zhuǎn)為穿過橫軸的次數(shù),也是穿過零軸的次數(shù),稱為短時(shí)過零率。對(duì)于高信噪比的語音信號(hào),無語音信號(hào)的噪聲能量很小,而有語音信號(hào)的能量很大,設(shè)定某一數(shù)值,就可可以區(qū)分語音信號(hào)的起點(diǎn)和終點(diǎn)。短時(shí)能量函數(shù)可用來區(qū)分清音段和濁音段。下面是通過windows錄的語音“5”,并通過matlab仿真來計(jì)算語音短時(shí)能量。語音信號(hào)的短時(shí)能量可用以下幾種算法得到: (34) (35) (36)在計(jì)算機(jī)上實(shí)現(xiàn)仿真時(shí),幅度表現(xiàn)為波形的高度,高能量的信號(hào)波峰高,而低能量的信號(hào)波峰比較低,進(jìn)行端點(diǎn)檢測(cè)時(shí),設(shè)置門限則根據(jù)波峰的高度來設(shè)置。濁音比起清音來,有較高的短時(shí)能量。明智的解決辦法就是每次取一段數(shù)據(jù),進(jìn)行分析,然后再取下一段數(shù)據(jù),再進(jìn)行分析,這樣通過語音信號(hào)與窗函數(shù)相乘等出一個(gè)類似窗的函數(shù)值,在此幀的前面幀和后面的幀都為零值,這樣是語音信號(hào)保持了短時(shí)性。為了處理語音信號(hào),我們要對(duì)語音信號(hào)進(jìn)行加窗,也就是一次僅處理窗中的數(shù)據(jù)。令,則有: (32)式中,h(n)為窗函數(shù),其有一定的長(zhǎng)度。經(jīng)實(shí)驗(yàn)發(fā)現(xiàn),濁音的短時(shí)能量最大,清音次之,靜音最小。語音信號(hào)不是穩(wěn)定的,所以要經(jīng)過分幀。因此通過兩種算法相結(jié)合的方法,在高信噪比下,進(jìn)行語音端點(diǎn)檢測(cè)能有很好的效果。由于清音能量比較小,會(huì)常常把其與無聲混淆。算法以短時(shí)能量檢測(cè)為主,短時(shí)過零率檢測(cè)為輔。流程圖如圖32所示: 噪聲估計(jì)信噪比估計(jì)端點(diǎn)檢測(cè)短時(shí)能量和過零率熵譜算法倒譜算法 高信噪比 低信噪比圖32 算法研究流程圖 基于短時(shí)能量和短時(shí)過零率的語音端點(diǎn)檢測(cè)傳統(tǒng)常用的短時(shí)能量和過零率相結(jié)合的算法通常利用用短時(shí)能量來檢測(cè)濁音、短時(shí)過零率來檢測(cè)清音,或者兩者相配合以便實(shí)現(xiàn)語音信號(hào)信噪比較大情況下的端點(diǎn)檢測(cè)。因此在低信噪比下將選擇熵值或者倒譜特征參數(shù)來進(jìn)行語音端點(diǎn)檢測(cè)。譜熵的大小取決的是功率譜的方差不是其大小,如果譜的分布保持不變,信號(hào)幅值的大小不會(huì)影響歸一化譜概率密度函數(shù),因而譜熵對(duì)于噪聲有一定的魯棒性。(4)距離和失真測(cè)度方法 最常用的是倒譜距離,由梅爾系數(shù)推出倒譜系數(shù),再得出梅爾倒譜距離,具有很好的語音檢測(cè);(5)人工神經(jīng)網(wǎng)絡(luò)方法 包括基于前饋網(wǎng)絡(luò)、徑向基函數(shù)網(wǎng)絡(luò)、多層感知器網(wǎng)絡(luò)、自組織循環(huán)自組織模糊推理神經(jīng)網(wǎng)絡(luò)和自適應(yīng)線性神經(jīng)元網(wǎng)絡(luò)等的方法;(6)統(tǒng)計(jì)模型和模式分類方法 主要是指基于HMM模型。此外,基于自適應(yīng)門限的方法也歸入這一類;(2)變換域參數(shù)方法 包括基于頻域參數(shù)、時(shí)頻域參數(shù)及小波域參數(shù)的方法。但我們可以按照實(shí)際應(yīng)用的范圍分類,當(dāng)然也可以按照所使用的特征參數(shù)準(zhǔn)則分類。以上特征分別是從語音端點(diǎn)檢測(cè)的自適應(yīng)性、準(zhǔn)確性、穩(wěn)定性、和運(yùn)算量上對(duì)算法提出要求。最初為單門限,后逐漸改為雙門限,隨著科技的發(fā)展,又轉(zhuǎn)變?yōu)槟:碚摶蛘叨嗵卣鲄?shù)相結(jié)合的方式。設(shè)定一定的門限后,當(dāng)超過設(shè)定值,而且超過最小語音段的幾幀也可以超過設(shè)定值,則會(huì)被認(rèn)為是語音信號(hào)。語音端點(diǎn)檢測(cè)流程如圖31所示:預(yù)處理參數(shù)提取端點(diǎn)判決是否信號(hào)最后一幀后處理 信號(hào)輸入 是 結(jié)果輸出圖31 語音端點(diǎn)檢測(cè)流程圖噪聲信號(hào)常常為說話人周圍的噪聲,不同環(huán)境下的噪聲信號(hào)也不同,所以特征參數(shù)會(huì)有變化。人的語音又可以分為清音和濁音兩類,其在能量上就可以分出來,而清音和濁音在短時(shí)過零率上可以分別出來。這兩者在頻率、能量上有很大的差別。語音是人體所發(fā)出的聲音,其物理原理是源于聲帶的振動(dòng)。參數(shù)提取意義在于提取的參數(shù)能夠分辨出語音和非語音信號(hào)。端點(diǎn)判決就是根據(jù)噪聲和語音特征參數(shù)的不同,設(shè)置一定的門限,再設(shè)置一些相應(yīng)的最短語音段以方便檢測(cè)。通常分幀時(shí)會(huì)有幀與幀之間的幀移,以防止信號(hào)的突變,影響端點(diǎn)檢測(cè)。得到一個(gè)語音信號(hào),先對(duì)其進(jìn)行預(yù)處理,使低頻和高頻在信噪比參數(shù)上表現(xiàn)的平滑,易于檢測(cè)。因此,語音端點(diǎn)檢測(cè)的速度和準(zhǔn)確率在語音處理系統(tǒng)中會(huì)非常重要,因此進(jìn)一步的對(duì)語音端點(diǎn)檢測(cè)算法的研究,有一定的現(xiàn)實(shí)意義。在語音識(shí)別系統(tǒng)中,正確的檢測(cè)出語音端點(diǎn),不僅能夠快速且準(zhǔn)確的進(jìn)行語音識(shí)別,而且能夠減小計(jì)算量,排除無聲段干擾,實(shí)驗(yàn)發(fā)現(xiàn),不管在什么環(huán)境或者什么樣信噪比的環(huán)境下,語音端點(diǎn)檢測(cè)的錯(cuò)誤將導(dǎo)致語音識(shí)別的錯(cuò)誤。 語音端點(diǎn)檢測(cè) 簡(jiǎn)述語音端點(diǎn)檢測(cè)是語音識(shí)別中的一個(gè)很重要的步驟,所謂語音端點(diǎn)檢測(cè)就是將輸入的語音信號(hào)從背景噪聲和環(huán)境噪聲中能夠準(zhǔn)確地判斷出語音信號(hào)中各種語音的起始點(diǎn)和結(jié)束點(diǎn)。語音信號(hào)為時(shí)域信號(hào),分幀則有助于計(jì)算語音信號(hào)的各個(gè)參數(shù)特征,可以對(duì)語音信號(hào)進(jìn)行平滑處理,是進(jìn)行語音端點(diǎn)檢測(cè)必不可少的步驟。介紹了語音信號(hào)前期處理的兩個(gè)步驟:預(yù)加重、加窗分幀。它們的定義如下: 矩形窗: (210)漢明窗: (211)漢寧窗: (212)式中N為窗長(zhǎng),窗函數(shù)的選取(形狀和長(zhǎng)度)對(duì)于短時(shí)分析參數(shù)的特性影響很大,為此應(yīng)該選擇合適的窗口,使其短時(shí)參數(shù)能更好地反映語音信號(hào)的特性變化。分幀用可移動(dòng)的窗口長(zhǎng)度進(jìn)行加權(quán)實(shí)現(xiàn),即用窗函數(shù)乘以語音信號(hào)s(n),從而形成加窗的語音信號(hào): (29)由于窗函數(shù)一般取為S(n)中間大兩頭小的光滑函數(shù),這樣的沖激響應(yīng)所對(duì)應(yīng)的濾波器具有低通特性,其帶寬和頻率取決于窗函數(shù)的選取。分幀一般采用交疊分段的方法,這就是為了使幀與幀之間能夠很好的平滑過渡,使其保持連續(xù)性。重疊是為了是語音信號(hào)各幀之間保持平滑,差別不至于太大,更符合人們的語音特征。通常將語音信號(hào)劃分為許多短時(shí)的語音時(shí)段,每個(gè)短時(shí)的語音段稱為一個(gè)幀。但至于選幀,則需要根據(jù)實(shí)時(shí)而定,不同的算法也會(huì)有不同的窗長(zhǎng)。如果采用小的窗長(zhǎng),則計(jì)算量增加,語音識(shí)別的速度可定會(huì)降低。 加窗分幀語音端點(diǎn)檢測(cè)首先要進(jìn)行加窗分幀處理,然后依次判斷每一幀的信號(hào)是否為語音的起點(diǎn)或終點(diǎn)。目的是提升高頻部分,使信號(hào)變得平坦、平滑,使之不僅在低頻而且在高頻的整個(gè)頻帶中,:采樣量化預(yù)加重加窗分幀參數(shù)提取語音信號(hào) 語音信號(hào)的預(yù)處理預(yù)加重是在語音信號(hào)數(shù)字量化之后,用具有6dB/倍頻程的提升高頻特性的預(yù)加重?cái)?shù)字濾波器來實(shí)現(xiàn),它通常是一階的數(shù)字濾波器: (28)式中的取值一般取1左右。平均來說,幅度較小的高頻分量產(chǎn)生的頻偏小得多。這就造成消息信號(hào)高頻端的信噪比可能降到不能容許的程度。語音信號(hào)的預(yù)處理應(yīng)保證處理后得到的信號(hào)更平滑、均勻,而且能提高語音的質(zhì)量。線性預(yù)測(cè)的原理與語音信號(hào)數(shù)字模型相關(guān)。這組預(yù)測(cè)系數(shù)就反應(yīng)了語音信號(hào)與噪聲不同的參數(shù)特征,根據(jù)這種參數(shù)特征,就可以進(jìn)行語音端點(diǎn)檢測(cè)和語音識(shí)別等一系列語音信號(hào)的處理。設(shè)是取有限個(gè)值的隨機(jī)變量則取的概率函數(shù)通常表示為: (26)則的熵為: (27) 線性預(yù)測(cè)法 線性預(yù)測(cè)分析的基本原理如下:語音信號(hào)分幀采樣后,各個(gè)語音樣點(diǎn)之間存在著聯(lián)系,可以用前幾幀的采樣點(diǎn)來預(yù)測(cè)當(dāng)前幀或者后幾幀的樣點(diǎn)值,即可以用先前的幀的參數(shù)值通過線性組合來近擬后面的幀的采樣值。信號(hào)的倒譜也可以定義為信號(hào)的能量譜密度函數(shù)的對(duì)數(shù)的傅里葉級(jí)數(shù)展開式的系數(shù),見式24: (24)即為倒譜系數(shù),通過倒譜系數(shù)求得倒譜距離為: (25)(3)熵 熵(用表示)是物質(zhì)的概率程度的一種反映。由于語音信號(hào)可以視為聲門激勵(lì)信號(hào)和聲道沖擊響應(yīng)進(jìn)行的卷積,隨后可以對(duì)語音信號(hào)進(jìn)行解卷。(1)短時(shí)頻譜和短時(shí)功率譜 設(shè)信號(hào)經(jīng)過傅里葉變換后在頻域記為,則與關(guān)系如公式(21): (21)語音的頻譜為的幅度,則有: (22)語音的短時(shí)功率譜的是幅度的平方,其公式為: (23)(2)倒譜距離 語音信號(hào)的倒譜分析是通過同態(tài)處理來實(shí)現(xiàn)的。對(duì)加窗分幀后的語音信號(hào),進(jìn)行傅里葉變換后再逆傅里葉變換,可以相應(yīng)的得到頻譜、功率譜、倒譜距離、熵譜等特征。 頻域分析語音信號(hào)頻域分析,主要是對(duì)一些頻域參數(shù)進(jìn)行分析,常用一些頻域參數(shù)的有頻譜、功率譜等等,最常用頻域分析的方法有傅立葉變換法、線性預(yù)測(cè)法等。這種分析方法的特點(diǎn)有:(1)表示語音信號(hào)比較直觀、物理意義明確;(2)實(shí)現(xiàn)起來比較簡(jiǎn)單、運(yùn)算量少;(3)可得到語音的一些重要參數(shù);(4)采用示波器通用設(shè)備進(jìn)行觀測(cè)等。進(jìn)行語音信號(hào)分析時(shí),先接觸到并且直觀的就是它的時(shí)域波形。 時(shí)域分析從一般的語音信號(hào)處理仿真來看,橫坐標(biāo)都是為時(shí)間,所以說,語音信號(hào)是時(shí)域信號(hào),經(jīng)常處理的語音信號(hào)也是基于時(shí)域來分析的,這種方法一般就是利用仿真的波形來處理。參數(shù)的提取,方法的創(chuàng)新,這都基于語音科技的發(fā)展。還有一類是無聲,而無聲是處于波谷。雖然中國(guó)與外國(guó)人的發(fā)音有所不同,但從音素上來說都是一樣的。語音信號(hào)還有一個(gè)比較簡(jiǎn)單的分類,是基于人類發(fā)音的音素所分類的。我們?cè)谶M(jìn)行語音處理過程中,所用到的參數(shù)都是短時(shí)內(nèi)的參數(shù)特征,因此在預(yù)處理過程,必須有使信號(hào)保持短時(shí)的過程,即分幀,就是分為一個(gè)一個(gè)的短時(shí)。因?yàn)檎Z音信號(hào)只有在短時(shí)內(nèi)才能保持它的穩(wěn)定和平滑。如果想要更為精準(zhǔn)的采樣或者更為完全的采樣域,我們可以相應(yīng)的提高采樣率或者提高采樣范圍,現(xiàn)在的語音檢測(cè)現(xiàn)狀都不在時(shí)傳統(tǒng)的采樣率,而是調(diào)整為自適應(yīng)。我們可以對(duì)語音通過帶通濾波器來得到我們所需要的頻譜,就可以得到相應(yīng)頻譜所對(duì)的語音。語音端點(diǎn)檢測(cè)是語音識(shí)別系統(tǒng)的前期處理,而語音信號(hào)的分析則是語音端點(diǎn)檢測(cè)的前期處理。對(duì)這種信號(hào)進(jìn)行Matlab進(jìn)行編程,對(duì)于不同信噪比的聲音片段,最后用前后的噪聲信號(hào)進(jìn)行對(duì)比以得出結(jié)論。分析了語音信號(hào)的時(shí)域和頻域,介紹了幾種語音端點(diǎn)檢測(cè)算法,簡(jiǎn)述了我的實(shí)施方案。這兩大問題將是以后研究的主要對(duì)象[18]。根據(jù)語音信號(hào)參數(shù)的特點(diǎn)可以從兩個(gè)較大方向入手。我們常常尋求新的方法,新的算法,或者在新算法上研究新的方法,更容易對(duì)人類聲音的識(shí)別,或者更適于人耳聽覺系統(tǒng)的算法。當(dāng)前,語音端點(diǎn)檢測(cè)技術(shù)還處于比較初級(jí)階段,許多領(lǐng)域還有待解決,還遠(yuǎn)遠(yuǎn)跟不上現(xiàn)
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1