freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

-20xx0xx257-孤立詞語音識別技術(shù)研究-文庫吧

2025-06-13 06:51 本頁面


【正文】 員發(fā)現(xiàn)在極短的時間里它是較為穩(wěn)定。所以,在實際的語音信號處理過程中會把它分成很小的稱之為幀的時間段。幀移與幀長有一定的關(guān)系,通常情況下兩者之比在1/3到1/2的區(qū)間 [[2]王倩,吳國平,陳琳.特定人語音識別算法——DRW算法[J].中國地質(zhì)大學(xué)(武漢)通信工程學(xué)院,湖北 武漢 430074.]。此外,分幀的大小也會直接影響到語音信號信息情況,根據(jù)信號處理的需求可以確定不同的幀長,一般取幀長取20ms。 加窗的目的是使信號的主瓣帶寬更加尖銳,旁瓣更窄,加窗常常應(yīng)用的函數(shù)是矩形窗、海明窗以及漢寧窗,根據(jù)不同的需要我們可以選擇不一樣的類型。形式分別為:(1)矩形窗(Rectangular Window) (1)(2)海明窗(Hamming Window) (2)(3)漢寧窗(Hann Window) (3) 其中N是窗口的長度。下圖是三種窗函數(shù)的相關(guān)波形圖。 圖 4 三種窗的時域和頻域波形圖 海明窗和漢寧窗都屬于廣義升余弦函數(shù),經(jīng)過對兩者頻率特性的研究發(fā)現(xiàn),矩形窗的譜旁瓣比海明窗和漢寧窗都要高,可能會使其頻譜泄露,高頻成分不易保存;漢寧窗也有其自身的局限性,比如說頻譜衰減太快;因為海明窗的低通特性好和旁瓣低而被較多的運用。雖然上面三種窗函數(shù)存在一些異同點。但是為了很好的處理信號我們需要選擇一種比較好的方式。綜合而言在本文的研究中,要選用的函數(shù)是海明窗。 圖5 Hamming及頻譜特性對于語音信號而言其包括有聲、靜音以及噪聲等比較復(fù)雜的成分。我們需要將不一樣的時分段分開來獲取必要的部分。端點檢測就是通過一定的方法定位到某些詞匯的起止點以及排除無聲部分的干擾。端點檢測是語音識別中不可忽略的一部分,好的端點檢測技術(shù)不僅能提高識別的準確度,而且它在是在孤立詞語音識別中能將計算量較大的非實時系統(tǒng)加以簡化。端點檢測有許多的要求,這些要求能使我們更好的對信號進行處理。端點檢測的方法很多,我們可以對不同的方法進行不同的分類,幾種主要常見的端點檢測方法和特征參量如下:(1)根據(jù)語音信號的時域特性來檢測,如音量,過零率的檢測,其計算量比較小。(2)利用語音信號的頻域特征進行檢測。端點檢測檢測的過程中有很多的特征參量作為可以作為參考量,在這些參量中我們要選擇一種合適的方式來作為該方式的參考量,這個參考量必須能夠很好地代表信號的某些特征,而且能夠很好地實現(xiàn)端點檢測這樣一個關(guān)鍵技術(shù)。我們選取了下面兩點作為參量來檢測。短時能量、短時幅度 對信號完成上面的處理之后,第n幀的信號為: (4)N代表幀長。不同的信號進行分幀后每一個幀會有不一樣的能量。第n 幀信號的短時能量En為: (5)短時過零率 通常,如果信號為連續(xù)的時間信號,短時過零率(ZCR)就是表示時域波形通過坐標時間軸的次數(shù),語音的頻譜特性就可以通過它表現(xiàn)出來了[[3]林波, 呂明.基于DTW改進算法的孤立詞識別系統(tǒng)的仿真與分析[J].信息技術(shù),2006年第4期.]。就離散信號而言,鄰近兩個參數(shù)取樣值不同的話就稱之為過零。計算公式如下: (6) sgn[ ]表示符號函數(shù),具體的算法見下式: (7) 這里運用兩者相結(jié)合的方法來處理。同時應(yīng)用這兩種檢測法可以更高效的檢測信號的開始點以及結(jié)束點。具體方法需要根據(jù)流程檢驗。 端點檢測之后我們就要開始了整個系統(tǒng)中比較重要的一項技術(shù)那就是特征提取。它之所以如此的重要是因為特征參數(shù)的選擇正確與否不僅會對系統(tǒng)識別的正確度起重大作用。而且能將信號的某些特征很好地表現(xiàn)出來。特征參數(shù)的要求是: (1)各個參量間應(yīng)該具有較好的的獨立特性,可以提高語音檢測的效率。 (2)不同的參數(shù)要有很好的區(qū)分度,此外要注意的是他們要能夠代表相關(guān)信號的特征,以此來提高識別度。 (3)為了方便計算,對于選取的特征參數(shù)的個數(shù)要小,而且要具有較高的有效性。信號的特征參數(shù)分為時域特征和頻域特征,通常在信號的信息處理中頻域特征比頻域能夠更好地表現(xiàn)出一些特質(zhì)。所以本文中主要介紹后者。我們知道信號存在眾多的特性,這些特性很多都可以作為參考量。比如能量,共振峰,語音頻譜等語音參數(shù)都可以作為語音信號的特征參數(shù)。LPCC和MFCC兩種方法應(yīng)用廣泛。下圖是計算LPCC的過程: 圖6 LPCC計算流程圖LPCC與MFCC有許多異同點。值得注意的是,通過兩者的比較我們發(fā)現(xiàn)MFCC比LFCC有更好的優(yōu)越性:(1)語音信號的低頻部分包含大量信息,而Mel到頻譜在轉(zhuǎn)化時也是比較注重其低頻信息;(2)MFCC的使用情況非常的廣泛,沒有各種前提假設(shè);(3)語音識別屬于人工智能的范疇,它的所有技術(shù)都應(yīng)考慮到人類本身的構(gòu)造,這樣才能在該技術(shù)上產(chǎn)生突破。此外MFCC還充分考慮了人體結(jié)構(gòu)中聽覺特點,所以在語音處理方面MFCC比LPCC的性能更好。目前語音識別系統(tǒng)的相關(guān)處理工作也是把MFCC作為主要方向。 MFCC的計算方式是比較復(fù)雜的。通常的方法就是建立一個濾波器組,濾波器組之間會進行頻率之間的相應(yīng)變換。下式為Mel頻率的公式: (8)式中f是實際的語音信號頻率。下圖展示MFCC尺度對應(yīng)曲線: 圖7 MFCC尺度對應(yīng)曲線 我們之所以選擇MFCC是因為它的特殊作用。它能夠?qū)︻l率進行不均勻的標定。通過上面的式子可以進行相應(yīng)的頻域向倒譜的變換。下面是MFCC倒譜系數(shù)的求取步驟: (1) 首先我們要獲得信號并將其進行數(shù)字化,這是信號處理的重要部分。(2) 其次對于一幀語音信號進行FFT變換。這樣就可以獲取信號的離散功率譜X(k)。(3)定義一個濾波器組。各個濾波器的中心頻率都設(shè)為f(m),這些濾波器組在頻域上是有一些要求的,通常情況下它在一定的范圍內(nèi)?,F(xiàn)在我們把三角濾波器的中心f(m)定義為 (9) (9)式中:是錄波器的低通頻率部分而是它的高通頻率部分;是信號采樣頻率;M是濾波器的個數(shù);N是進行FFT變換時的數(shù);計算公式如下: (10)(4)從上一步我們可以求出不同濾波器產(chǎn)生得相關(guān)輸出頻譜能量。我們再對其取對數(shù)之后便得到一組如下系數(shù) (11)再經(jīng)過離散余弦變換(DCT)將S(m)轉(zhuǎn)換到時域,就是MFCC。計算過程如下: (12)下圖為Mel倒譜系數(shù)(MFCC)的計算流程框圖: 圖 8 MFCC計算流程圖 目前存在多種語音識別方法,主要分為三種:隨機模型法、模板匹配法、概率語法分析法。其他的一些方法都歸屬于上面的幾種類型,如果再進行細致的劃分則可為下面這些。動態(tài)時間規(guī)整技術(shù)(DTW)和隱馬爾科夫模型(HMM)歸屬于模板匹配的范疇。人工神經(jīng)網(wǎng)絡(luò)(ANN)、矢量量化(VQ)也是出現(xiàn)比較早并且用到的較多的。當(dāng)然為了語音識別技術(shù)的改進一些多種技術(shù)聯(lián)合使用的新方法也得到推廣,比如說HMM和VQ交叉使用的匹配方法就是一種對隱馬爾科夫改進的方法。動態(tài)時間規(guī)整技術(shù)(DTW)在識別中是比較早期的關(guān)于模式匹配與模型訓(xùn)練的技術(shù)。特征參數(shù)之間進行比較的時候會消耗不同的時間。這樣就不能同時完成參數(shù)間的檢測,識別率機會大大降低。而動態(tài)時間規(guī)整里的DP算法可以很好地解決這樣的問題。在DTW算法中,主要是把語音信號的時間軸失真處理。當(dāng)然這種處理最主要的就是對其進行不規(guī)則的扭曲。這樣做的目的是為了限制該算法中匹配路徑的個數(shù)。個數(shù)越少我們計算就會越簡單,最后我們可以找到一條比較好的路徑方式。 隱馬爾科夫模型(HMM)是比較早的引入理論的。它是一種比較理想的統(tǒng)計方法。這種方法如今已經(jīng)得到了比較廣泛的運用。屬于上面分類中模板匹配的一種方式。其和別的方法最特殊的地方就是他的對比庫的不同。這種對比庫在和待測量進行比較之前會進行大量的訓(xùn)練。通過這些訓(xùn)練可以得到一個和待測語音很近的矢量值作為存儲模板保留。人工神經(jīng)網(wǎng)絡(luò)(ANN)。它的研究是語音識別技術(shù)的重大突破,盡管還未成熟,但是如今它是研究的重點。多層感知神經(jīng)網(wǎng)絡(luò)以及其特征映射是現(xiàn)在識別系統(tǒng)主要研究的方向。在眾多的方法比較
點擊復(fù)制文檔內(nèi)容
黨政相關(guān)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1