【正文】
) 這兩種窗函數(shù)都有低通特性,通過分析這兩種窗的頻率響應(yīng)幅度特性可以發(fā)現(xiàn)(如圖 ):矩形窗的主瓣寬度小( 4*pi/N),具有較高的頻 率分辨率,旁瓣峰值大( ),會(huì)導(dǎo)致泄漏現(xiàn)象; 哈 明窗的主瓣寬 8*pi/N,旁瓣峰值低( ),可以有效的克服泄漏現(xiàn)象,具有更平滑的低通特性。因此在語音頻譜分析時(shí)常使用 哈 明窗,在計(jì)算短時(shí)能 第 頁 共 18 頁 量和平均幅度時(shí)通常用矩形窗。表 對(duì)比了這兩種窗函數(shù)的主瓣寬度和旁瓣峰值。 圖 矩形窗和 哈明 窗的頻率響應(yīng) 表 矩形窗和 哈明 窗的 主瓣寬度和旁瓣峰值 短時(shí)能量 短時(shí) 能量主要分析語音信號(hào)能量隨時(shí)間的變化,由于語音信號(hào)的清音和濁音之間能量有較大的差距,進(jìn)而可通過短時(shí)能量對(duì)語音的清濁音進(jìn)行分析。 定義短時(shí)能量為 : 221[ ( ) ( ) ] [ ( ) ( ) ]nn m m n NE x m w n m x m w n m?? ? ? ? ? ?? ? ? ??? ( ) 其中 N 為窗長(zhǎng),當(dāng)選用矩形窗時(shí)則有: 2 ()nmE x m????? ? ( ) 由式( )能量函數(shù)反應(yīng)語音信號(hào)的幅度,同時(shí)由圖 ~ 可知窗長(zhǎng)對(duì)能量函數(shù)起著決定性作用。窗長(zhǎng)太大,不能反應(yīng)能量 nE 的變化,窗長(zhǎng)太小 , 不能得到平滑的能量函數(shù)。 短時(shí)能量函數(shù)的應(yīng)用 :1)可用于區(qū)分清音段與濁音段。 nE 值大對(duì)應(yīng)于濁音段, nE 值窗函數(shù) 主瓣寬度 旁瓣峰值 矩形窗 4*pi/N 哈明窗 8*pi/N 第 頁 共 18 頁 小對(duì)應(yīng)于清音段。 2)可用于區(qū)分濁音變?yōu)榍逡艋蚯逡糇優(yōu)闈嵋舻臅r(shí)間(根據(jù) nE 值的變化趨勢(shì))。 3)對(duì)高信噪比的語音信號(hào),也可以用來區(qū)分有無語音(語音信號(hào)的開 始點(diǎn)或終止點(diǎn))。無信號(hào)(或僅有噪聲能量 )時(shí), nE 值很小,有語音信號(hào)時(shí),能量顯著增大。 圖 不同矩形窗長(zhǎng)的短時(shí)能量函數(shù) 圖 不同 哈明 窗長(zhǎng)的短時(shí)能量函數(shù) 短時(shí) 平均過零率 短時(shí)過零率可以粗略估計(jì)語音的頻譜特性。高頻率對(duì)應(yīng)著高過零率, 低頻率對(duì)應(yīng)著低過零率,那么過零率與語音的清濁音就存在著對(duì)應(yīng)關(guān)系 : 清音的過零率高,濁音的過零率低。 定義短時(shí)平均過零率: s g n [ [ ] s g n [ ( 1 ) ] ( )n mZ x m x m w n m?? ? ?? ? ? ?? ( ) 其中 sgn[] 為符號(hào)函數(shù) , ?1, ( ) 01, ( ) 0sg n ( ) xnxnxn ??? 。 在矩形窗條件下,可以簡(jiǎn)化為 : 11 s g n [ ( ) s g n [ ( 1 ) ]2 nnm n NZ x m x mN ? ? ?? ? ?? ( ) 第 頁 共 18 頁 圖 矩形窗 ( N=320) 條件下的短時(shí)平均過零率 由圖 為某一語音在矩形窗條件下求得的短時(shí)能量和短時(shí)平均過零率。分析可知:清音的短時(shí)能量較低,過零率高,濁音的短時(shí)能量較高,過零 率低。清音的過零率為 左右,濁音的過零率為 左右,兩但者分布之間有相互交疊的區(qū)域,所以單純依賴于平均過零率來準(zhǔn)確判斷清濁音是 不可能的,在實(shí)際應(yīng)用中往往是采用語音的多個(gè)特征參數(shù)進(jìn)行綜合判決 短時(shí)平均過零率的應(yīng)用: 1)區(qū)別清音和濁音。例如,清音的過零率高,濁音的過零率低。此外,清音和濁音的兩種過零分布都與高斯分布曲線比較吻合。 2)從背景噪聲中找出語音信號(hào)。語音處理領(lǐng)域中的一個(gè)基本問題是,如何將一串連續(xù)的語音信號(hào)進(jìn)行適當(dāng)?shù)姆指睿源_定每個(gè)單詞語音的信號(hào),亦即找出每個(gè)單詞的開始和終止位置。 3)在孤立詞 的語音識(shí)別中,可利用能量和過零作為有話無話的鑒別。 短時(shí) 自相關(guān)函數(shù) 自相關(guān)函數(shù)用于衡量信號(hào)自身時(shí)間波形的相似性。濁音的時(shí)間波形呈現(xiàn)出一定的周期性,波形之間相似性較好;清音的時(shí)間波形呈現(xiàn)出隨機(jī)噪聲的特性,樣點(diǎn)間的相似性較差。因此,我們用短時(shí)自相關(guān)函數(shù)來測(cè)定語音的相似特性。 短時(shí)自相關(guān)函數(shù)定義為: ( ) ( ) ( ) ( ) ( )n mR k x m w n m x m k w n m k?? ? ?? ? ? ? ?? ( ) 令 39。m n m??180。 ,并且 39。( ) ( )w m w m?? ,可以得到: 39。39。( ) [ ( ) ( ) ] [ ( ) ( ) ]nmR k x n m w m x n m k w m k?? ? ?? ? ? ? ?? ( ) 第 頁 共 18 頁 進(jìn)而則有: 1 39。39。0( ) [ ( ) ( ) ] [ ( ) ( ) ]Nkn mR k x n m w m x n m k w m k???? ? ? ? ?? ( ) 自相關(guān)函數(shù)常用來作以下兩種語音信號(hào)特征的估計(jì): 1) 區(qū)分語音是清音還是濁音 : 清音的短時(shí)自相關(guān)函數(shù)不具有周期性 , 濁音是周期信號(hào) 2)估計(jì)濁音語音信號(hào)的基音周期。 圖 語音信號(hào)的自相關(guān)函數(shù)與平均過零率 圖 ( ) 給出了 語音采集信號(hào) N=460 的短時(shí)自相關(guān)函數(shù)波形 和平均過零率。 短時(shí)自相關(guān) 函數(shù)波形分析可知:濁音是周期信號(hào),濁音的短時(shí)自相關(guān)函數(shù)呈現(xiàn)明顯的周期性,自相關(guān)函數(shù)的周期就是濁音信號(hào)的周期,根據(jù)這個(gè)性質(zhì)可以判斷一個(gè)語音信號(hào)是清音還是濁音,還可以判斷濁音的基音周期。濁音語音的周期可用自相關(guān)函數(shù)中第一個(gè)峰值的位置來估算。 反之, 清音接近于隨機(jī)噪聲,清音的短時(shí)自相關(guān)函數(shù)不具有周期性,也沒有明顯突起的峰值,且隨著延時(shí) k 的增大迅速減小 。 時(shí)域分析方法的應(yīng)用 1) 基音頻率的估計(jì) a) 可利用時(shí)域分析判定某一語音有效的清音和濁音段 。 b) 針對(duì)濁音段,可直接利用短時(shí)自相關(guān)函數(shù) 估計(jì)基音頻率 。 2) 語音端點(diǎn)的檢測(cè)與估計(jì) 可利用時(shí)域分析判定某一語音信號(hào)的端點(diǎn),