freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語音信號的端點(diǎn)檢測畢業(yè)論文-文庫吧資料

2025-03-06 09:55本頁面
  

【正文】 Projection for Adaptive End Pointing of Continuous [14] 趙 力 . 語音信號處理 [M] . 北京 : 機(jī)械工業(yè)出版社 , 2021. [15]劉羽 . 語音端點(diǎn)檢測及其在 Matlab中的 實(shí)現(xiàn) [J]. 計(jì)算機(jī)時(shí)代 , 2021, (8): 2526. [16]張雄偉 , 陳亮 , 楊吉斌 . 現(xiàn)代語音處理技術(shù)及應(yīng)用 [ M] . 北京 : 機(jī)械工業(yè)出版社 , 2021: 3031. [17]聶敏 . 語音識別及其關(guān)鍵技術(shù) [J].微波與衛(wèi)星通信, 1999,4:5356 [18] C. Lee, D. hyun, C. feature extraction for speech recognition [J].IEEE Transactions on Speech and Audio Processing, 2021, 11(l):8086 Speechamp。 隨著語音相關(guān)學(xué)科的發(fā)展和新興技術(shù)的不斷出現(xiàn)必將使得未來的語音系統(tǒng)逐漸智能化,而作為關(guān)鍵技術(shù)之一的語音端點(diǎn)檢測也將隨之不斷提高。 4 分析總結(jié) 語音信號端點(diǎn)檢測是語音信號處理中非常重要的一項(xiàng)預(yù)處理技術(shù),因此是語音信號處理中不可缺少的一步。對其他參數(shù)進(jìn)行設(shè)置,如設(shè)置語音幀長度,幀移長度, FFT 取 512,門限閥值 設(shè) 置等。在語音端點(diǎn)檢測之前首先要對被測的語音信號進(jìn)行預(yù)處理等,包括分幀加窗等。 圖 雙門限檢測法原理示意圖 雙門限語音端點(diǎn)檢測實(shí)驗(yàn) 仿真及 分析 實(shí)驗(yàn)環(huán)境及參數(shù)設(shè)置 雙門限語音端點(diǎn)檢測是在 MATLAB 軟件環(huán)境下進(jìn)行仿真實(shí)驗(yàn)。接下來進(jìn)行第二級判 20 斷 , 由于語音的起點(diǎn)很可能是能量很弱的清音 , 此時(shí)還采用短時(shí)能量來區(qū)分清音和無聲顯然已不合適 , 應(yīng)采用過零率。根據(jù)語音短時(shí)能量設(shè)定一個(gè)較高的門限 T H , 若信號的能量大于 T H , 則可確定2 個(gè)端點(diǎn) A 、 B, 并可認(rèn)為這 2個(gè)端點(diǎn)之間是語音信號 , 這樣相當(dāng)于完成初判。 現(xiàn)以孤立 “檢” 字的發(fā)音為例 , 說明雙門限檢測法的原理 , 如圖 1 所示。這些都可以通過設(shè)定最短時(shí)間門限來判別。而如果在過渡段中兩個(gè)參 數(shù)中的任一個(gè)超過了高門限,就可以確信進(jìn)入語音段了。在靜音段,如果能量或過零率超越了低門限,就應(yīng)該開始標(biāo)記起始點(diǎn),進(jìn)入過渡段。 整個(gè)語音信號的端點(diǎn)檢測可以分為四段:靜音、過度段、語音段、結(jié)束。低 門 限被超過未必就是語音信號的開始,有可能是時(shí)間很短的噪聲引起的。 其端點(diǎn)檢測的流程如下所述:開始進(jìn)行端點(diǎn)檢測之前,首先為短時(shí)能量和過過零率分別確定兩個(gè)門限 amp amp zcr zcr2, 其中 amp zcr2 分別為短時(shí)能量和過零率比較低的門限,其數(shù)值比較小,對信號的變化比較敏感,很容易就會超過。 amp2=min(amp2,max(amp)/8)。 其關(guān) 鍵代 碼 為amp=sum(abs(enframe(filter([],1,x),FrameLen,FrameInc)),2)。過零率公式 [ 15]: ??? ??? 11 )1()()( Nn ii nxnxizc r ( 39) 計(jì)算 amp2 和 amp1 時(shí),首先計(jì)算最初 10 幀信號中每幀的短時(shí)平均能量或平均幅度 E ,最大值記為 max,最小值記為 min。 該算法的原理簡述如下 : 對上 述兩種特征作一個(gè)統(tǒng)計(jì)估計(jì),得到兩個(gè)門限值,利用短時(shí)能量檢測濁音,短時(shí)過零率檢測清音,兩者配合從而確定語音的端點(diǎn)。當(dāng)?shù)烷T限被超過時(shí),很有可能是由于很小的噪聲所引起的,未必是語音的開始,當(dāng)高門限被超過并且在接下來的時(shí)間段內(nèi)一直超過低門限時(shí),則意味著語音信號的開始。 基于短時(shí)能量和短時(shí)過零率的雙門限端點(diǎn)檢測原理 雙門限法是利用短時(shí)能量和過零率的 乘積進(jìn)行檢測的 。 基于短時(shí)能量和短時(shí)過零率的雙門限語音端點(diǎn)檢測方法充分利用能量和過零率的優(yōu)點(diǎn),使用過零率檢測清音,用短時(shí)能量檢測濁音,兩者配合來進(jìn)行語音端點(diǎn)檢測。另外,利用短時(shí)過零率還可以從背景噪聲中找出語音 信號,判斷寂靜無聲段和有聲段的起點(diǎn)和終點(diǎn)的位置。 圖 短時(shí)過 零率在清音無聲和濁音三種情況下條件概率密度函數(shù)示意圖 對于短時(shí)過零率,由于清音的多數(shù)能量出現(xiàn)在較高的頻率上,因此清音的過零率較高,而濁音語音具有高頻跌落的頻譜,所以濁音的過零率低,噪聲的過零率大小處于清音和濁音之間。 17 zcr=sum(signs.*diffs, 2)。 signs=(tmp1.*tmp2)0。 本文在 MATLAB 軟件 中實(shí)現(xiàn)求語音短時(shí)過零率的關(guān)鍵代碼為 %計(jì)算過零率 tmp1=enframe(x(l:length(x)l), FrameLen, Framelne)。高頻就意味著高的平均過零率,低頻就意味著低的平均過零率,所以可以認(rèn)為濁音時(shí)具有較低的過零率,而清音時(shí)具有較高的過零率。 第三,區(qū)分清音和濁音,對語音信號進(jìn)行分析,發(fā)現(xiàn)發(fā)濁音時(shí),盡管聲道有若干個(gè)共振峰,但由于聲門波引起譜的高頻跌落,所以其語音能量約集中在 3kHz 以下。定義語音信號 )(mXn 的短時(shí)過零率 nZ 為 : ? ? ? ???? ???10 )1(s g n)(s g n21 Nm nnn mxmxZ ( 37) 其中, sgn 為符號函數(shù),即: ? ? ??? ?? ?? 0)(,1 0)(,1)(s g n nxnxnx ( 38) 過零率有三類重要應(yīng)用 : 第一,用于 粗略地描述信號的頻譜特性,就是用多帶濾波器將信號分為若干個(gè)通道, 對各通道進(jìn)行短時(shí)平均過零率和短時(shí)能量的計(jì)算,即可粗略地估計(jì)頻譜特性。而對于離散信號,如果相鄰的取樣值改變符號則稱為過零。過零分析是語音時(shí)域分析中最簡單的一種。 對于高信噪比的語音信號,無語音信號的噪聲能量很小,而有語音信號的能量 nE 顯著增大到某一數(shù)值,由此可以區(qū)分語音信號的起始點(diǎn)和結(jié)束點(diǎn)。短時(shí)能量函數(shù)可用來區(qū)分清音段和濁音段。 語音信號的短時(shí)能量可用以下幾種算法得到: 1 ()NnniE x i??? ( 34) 21 ()NniiE x i??? ( 35) 21 log ( )NniiE x i??? ( 36) 它們分別為絕對值的累加、平方累加和平方的對數(shù)的累加 [12] [13],本文采用的是絕對值的累加進(jìn)行計(jì)算的, 本文在 MATLAB 軟件 中實(shí)現(xiàn)求語音短時(shí) 能量 的關(guān)鍵代碼為 %計(jì)算短時(shí)能量 amp = sum(abs(enframe(filter([1 ], 1, x), FrameLen, FrameInc)), 2)。在這些情況下,只依靠短時(shí)能量或短時(shí)平均幅度來檢測語音段的起止點(diǎn)常常會把語音信號起始和末尾的這些音素漏掉。 語音信號的短時(shí)平均幅度 [11]定義為 : ????? ??? mn mnmxM )()( ? ( 33) nE 和 nM 都反映語音信號的強(qiáng)度,但是其特性有所不同。 nE 值大的對應(yīng)于濁音段,而 nE 值小的對 應(yīng)于清音段。上式表明,經(jīng)過窗口加權(quán)的短時(shí)能量相當(dāng)于將“語音平方”信號通過一個(gè)線性濾波器的輸出,這個(gè)濾波器的取樣響應(yīng)為 )(nh 。 n 時(shí)刻某語音信號 {x(n)}的短時(shí)平均能量定義為 : ? ?2)()(????? ??? mn mnmxE ? ( 31) 式中, )(n? 為漢明窗。短時(shí)能量是隨機(jī)參數(shù),在無聲段,清音段和濁音段,它們分別具有不同的概率密度函數(shù),圖 給出了短時(shí)能量在清音、無聲和濁音三種情況下的條件概率密度函數(shù)。由于語音是不穩(wěn)定的,所以我們采用“短時(shí)能量” 。 短時(shí)平均能量 語音和噪聲的主要區(qū)別在它們的能量上,所以能量是經(jīng)常使用的音頻特征參數(shù),是對語音信號最直觀的表示。在這些情況下,只依靠短時(shí) 能量來檢測語音段的起止點(diǎn)常常會把語音信號起始和末尾的這些音素漏掉。 如圖 就是在比較純凈的內(nèi)容為“端點(diǎn)檢測” 的原始語音信號用傳統(tǒng)的短時(shí)能量和過零率的語音端點(diǎn)檢測,圖中可以很直觀的觀察到語音的短時(shí)能量的大小和其過零率的高低,如圖 所示: 圖 語音信號原始波形圖和其短時(shí)能量和過零率波形圖 短時(shí)能量函數(shù)可用來區(qū)分清音段和濁音段, nE 值大的對應(yīng)于濁音段,而 nE 值小的對應(yīng)于清音段。因此,語音段能量要大于噪聲段的能量。 ( 4)端點(diǎn)檢測:確定門限后就可以進(jìn)行端點(diǎn)檢測,根據(jù)門限值來區(qū)分有語音段和噪聲段,得出檢測結(jié)果。特征提取是語音端點(diǎn)檢測的關(guān)鍵問題,特征參數(shù)選擇的好壞直接影響到語音端點(diǎn)檢測的準(zhǔn)確率的高低。 ( 2)特征提?。涸跁r(shí)域或者頻域提取能反映語音本質(zhì)特征的聲學(xué)參數(shù),如短時(shí)能量,短時(shí)過零率等。本文采用 基于 短時(shí)能量和短時(shí)過零率結(jié)合的雙門限 法,該方法根據(jù)語音信號和噪聲信號的不同特征,提取每一段語音信號的特征,然后把這些特征值與設(shè)定的閾值進(jìn)行比較,從而達(dá)到語音端點(diǎn)檢測的目的 。通常不同的系統(tǒng)需要不同的算法以滿足在精度、復(fù)雜度、魯棒性、敏感性和響應(yīng)時(shí)間等方面的需求。 3 語音端點(diǎn)檢測算法原理及實(shí)驗(yàn)仿真分析 語音端點(diǎn)檢測算法原理 端點(diǎn)檢測最早的應(yīng)用是在貝爾實(shí)驗(yàn)室開發(fā)的電話傳輸和轉(zhuǎn)換系統(tǒng)中,用于通信信道的時(shí)間分配,通過語音檢測實(shí)現(xiàn)在空閑的信道中插入其他人的話音信息。 將線性預(yù)測應(yīng)用與語音信號處理,不僅是因?yàn)樗念A(yù)測功能,而且更重要的是因?yàn)樗芴峁┮粋€(gè)非常好的聲道模型及模型參數(shù)估計(jì)方法。通過使實(shí)際語音抽樣和線性預(yù)測抽樣之間的誤差在某個(gè)準(zhǔn)則下達(dá)到最小值來決定唯一的一組預(yù)測系數(shù)。 ( 1) 短時(shí)頻譜和短時(shí)功率譜 設(shè)信號 )(mxn 經(jīng)過傅里葉變換后在頻域記為 )( jwn eX ,則 )( jwn eX 與 )(mxn 的關(guān)系見公式 26。 10 傅立葉變換法 [8] 傅里葉頻譜變換是語音信號頻域分析中廣泛使用的方法, 是分析線性系統(tǒng)和平穩(wěn)信號穩(wěn)態(tài)特性強(qiáng)有力的手段, 對分幀加窗后的語音信號,進(jìn)行傅里葉變換和逆傅里葉變換,可以相應(yīng)的得到頻譜,功率譜,倒譜距離,嫡等特征。取樣之后要對信號進(jìn)行量化,而量化過程不可避免地會產(chǎn)生量化誤差,即量化后的信號 值與原信號之間的差值。時(shí)域分析通常用于最基本的參數(shù)分析,語音的分割、預(yù)處理和大分類。語音信 號的時(shí)域參數(shù)有短時(shí)能量、短時(shí)平均幅度、短時(shí)過零率、短時(shí)自相關(guān)函數(shù)等,這些是語音信號中一組最基本的短時(shí)參數(shù),在各種語音信號數(shù)字處理技術(shù)中都有重要應(yīng)用。 短時(shí)時(shí)域分析 語音信號本身就是時(shí)域信號,因此,時(shí)域分析方法是應(yīng)用最為廣泛的一種方法,這種方法直接利用語音信號的時(shí)域波形。只有將語音信號分析成表示其本質(zhì)特性的參數(shù),才有可能利用這些參數(shù)進(jìn)行高效的語音通信,以及建立用于識別的模板或知識庫。漢明窗旁瓣最低,可以有效地克服泄漏現(xiàn)象,具有更平滑的低通特性,因此,一般在語音信號預(yù)處理中,都選用漢明窗來進(jìn)行語音分幀處理。 表 21 1s長的各種窗的主瓣寬度和旁瓣高度 矩形 漢明 漢寧 主瓣寬度 旁瓣寬度 13dB 43dB 32dB 從表中可知:矩形窗的主瓣寬度最小,但其旁瓣高度最高;漢明窗的主瓣最寬,而旁瓣高度最低。用得最多的三種窗函數(shù)是矩形窗、漢明窗 (Hamming)和漢寧窗 (Hanning),它們的定義如下 : 矩形窗 : ??? ???? 其他 ,0 10 ,1)( Nnn? ( 23) 漢明窗: 0 . 5 4 0 . 4 6 c o s ( 2 /( 1 ) ) , 0 1() 0, n N n Nn ?? ? ? ? ? ??? ?? 其 他 ( 24) 漢寧窗: ? ???? ????? 其他,0 10,)/2c os ()( NnNnn ?? ( 25) 式中 N 為窗長,窗函數(shù) )(n? 的選取 (形狀和長度 )對于短時(shí)分析參數(shù)的特性影響很大,為此應(yīng)該選擇合適的窗口,使其短時(shí)參數(shù)能更好地反映語音信號的特性變化。前一幀和后一幀的交疊部分稱為幀移,幀移與幀長的比值一般取 為0~ 之間。另外,由于不同語音信號的基音周期不同,在女性兒童的 2ms 到老年男子的 14ms 之間變化, 為了兼顧男聲和女聲的最高和最低基音頻率,且能準(zhǔn)確地描述 語音能量自身的實(shí)際變化規(guī)律,通常將窗寬選為 10ms~20ms。將語音信號劃分為許多短時(shí)的語音段,每個(gè)短時(shí)的語音段稱為一個(gè)分析幀。我們可以在語音靜音段時(shí),采用較長的窗 ;在語音和靜音的過渡段時(shí)采用較小的窗 ,可以確切判斷語音的起始點(diǎn) ;一旦確定語音的起點(diǎn),就改用常規(guī)窗長。在端點(diǎn)檢測時(shí)如果采用較大的窗長 , 則幀長長,幀數(shù)少 , 這樣計(jì)算量會小些 , 而且進(jìn)行端點(diǎn)檢測時(shí)速度也會快些,但是這樣端點(diǎn)檢測 的誤差容易增加。 有時(shí)要恢復(fù)原信號,需要從做過預(yù)加重的信號頻譜來求實(shí)際的頻譜時(shí),要對測量值進(jìn)行去加重處理,即加上 6dB/倍頻程的下降的頻率特性來還原成原來的特性。目的是提升高頻部分,使信號變得平坦,保持在低頻到高頻的整個(gè)頻帶中,能用同樣的信噪比求頻譜,而且預(yù)加重零點(diǎn)與輻射零點(diǎn)將抵消聲門波的影響,使語音信號中
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1