freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

-20xx0xx257-孤立詞語音識(shí)別技術(shù)研究-文庫吧

2025-06-13 06:51 本頁面


【正文】 員發(fā)現(xiàn)在極短的時(shí)間里它是較為穩(wěn)定。所以,在實(shí)際的語音信號(hào)處理過程中會(huì)把它分成很小的稱之為幀的時(shí)間段。幀移與幀長(zhǎng)有一定的關(guān)系,通常情況下兩者之比在1/3到1/2的區(qū)間 [[2]王倩,吳國(guó)平,陳琳.特定人語音識(shí)別算法——DRW算法[J].中國(guó)地質(zhì)大學(xué)(武漢)通信工程學(xué)院,湖北 武漢 430074.]。此外,分幀的大小也會(huì)直接影響到語音信號(hào)信息情況,根據(jù)信號(hào)處理的需求可以確定不同的幀長(zhǎng),一般取幀長(zhǎng)取20ms。 加窗的目的是使信號(hào)的主瓣帶寬更加尖銳,旁瓣更窄,加窗常常應(yīng)用的函數(shù)是矩形窗、海明窗以及漢寧窗,根據(jù)不同的需要我們可以選擇不一樣的類型。形式分別為:(1)矩形窗(Rectangular Window) (1)(2)海明窗(Hamming Window) (2)(3)漢寧窗(Hann Window) (3) 其中N是窗口的長(zhǎng)度。下圖是三種窗函數(shù)的相關(guān)波形圖。 圖 4 三種窗的時(shí)域和頻域波形圖 海明窗和漢寧窗都屬于廣義升余弦函數(shù),經(jīng)過對(duì)兩者頻率特性的研究發(fā)現(xiàn),矩形窗的譜旁瓣比海明窗和漢寧窗都要高,可能會(huì)使其頻譜泄露,高頻成分不易保存;漢寧窗也有其自身的局限性,比如說頻譜衰減太快;因?yàn)楹C鞔暗牡屯ㄌ匦院煤团园甑投惠^多的運(yùn)用。雖然上面三種窗函數(shù)存在一些異同點(diǎn)。但是為了很好的處理信號(hào)我們需要選擇一種比較好的方式。綜合而言在本文的研究中,要選用的函數(shù)是海明窗。 圖5 Hamming及頻譜特性對(duì)于語音信號(hào)而言其包括有聲、靜音以及噪聲等比較復(fù)雜的成分。我們需要將不一樣的時(shí)分段分開來獲取必要的部分。端點(diǎn)檢測(cè)就是通過一定的方法定位到某些詞匯的起止點(diǎn)以及排除無聲部分的干擾。端點(diǎn)檢測(cè)是語音識(shí)別中不可忽略的一部分,好的端點(diǎn)檢測(cè)技術(shù)不僅能提高識(shí)別的準(zhǔn)確度,而且它在是在孤立詞語音識(shí)別中能將計(jì)算量較大的非實(shí)時(shí)系統(tǒng)加以簡(jiǎn)化。端點(diǎn)檢測(cè)有許多的要求,這些要求能使我們更好的對(duì)信號(hào)進(jìn)行處理。端點(diǎn)檢測(cè)的方法很多,我們可以對(duì)不同的方法進(jìn)行不同的分類,幾種主要常見的端點(diǎn)檢測(cè)方法和特征參量如下:(1)根據(jù)語音信號(hào)的時(shí)域特性來檢測(cè),如音量,過零率的檢測(cè),其計(jì)算量比較小。(2)利用語音信號(hào)的頻域特征進(jìn)行檢測(cè)。端點(diǎn)檢測(cè)檢測(cè)的過程中有很多的特征參量作為可以作為參考量,在這些參量中我們要選擇一種合適的方式來作為該方式的參考量,這個(gè)參考量必須能夠很好地代表信號(hào)的某些特征,而且能夠很好地實(shí)現(xiàn)端點(diǎn)檢測(cè)這樣一個(gè)關(guān)鍵技術(shù)。我們選取了下面兩點(diǎn)作為參量來檢測(cè)。短時(shí)能量、短時(shí)幅度 對(duì)信號(hào)完成上面的處理之后,第n幀的信號(hào)為: (4)N代表幀長(zhǎng)。不同的信號(hào)進(jìn)行分幀后每一個(gè)幀會(huì)有不一樣的能量。第n 幀信號(hào)的短時(shí)能量En為: (5)短時(shí)過零率 通常,如果信號(hào)為連續(xù)的時(shí)間信號(hào),短時(shí)過零率(ZCR)就是表示時(shí)域波形通過坐標(biāo)時(shí)間軸的次數(shù),語音的頻譜特性就可以通過它表現(xiàn)出來了[[3]林波, 呂明.基于DTW改進(jìn)算法的孤立詞識(shí)別系統(tǒng)的仿真與分析[J].信息技術(shù),2006年第4期.]。就離散信號(hào)而言,鄰近兩個(gè)參數(shù)取樣值不同的話就稱之為過零。計(jì)算公式如下: (6) sgn[ ]表示符號(hào)函數(shù),具體的算法見下式: (7) 這里運(yùn)用兩者相結(jié)合的方法來處理。同時(shí)應(yīng)用這兩種檢測(cè)法可以更高效的檢測(cè)信號(hào)的開始點(diǎn)以及結(jié)束點(diǎn)。具體方法需要根據(jù)流程檢驗(yàn)。 端點(diǎn)檢測(cè)之后我們就要開始了整個(gè)系統(tǒng)中比較重要的一項(xiàng)技術(shù)那就是特征提取。它之所以如此的重要是因?yàn)樘卣鲄?shù)的選擇正確與否不僅會(huì)對(duì)系統(tǒng)識(shí)別的正確度起重大作用。而且能將信號(hào)的某些特征很好地表現(xiàn)出來。特征參數(shù)的要求是: (1)各個(gè)參量間應(yīng)該具有較好的的獨(dú)立特性,可以提高語音檢測(cè)的效率。 (2)不同的參數(shù)要有很好的區(qū)分度,此外要注意的是他們要能夠代表相關(guān)信號(hào)的特征,以此來提高識(shí)別度。 (3)為了方便計(jì)算,對(duì)于選取的特征參數(shù)的個(gè)數(shù)要小,而且要具有較高的有效性。信號(hào)的特征參數(shù)分為時(shí)域特征和頻域特征,通常在信號(hào)的信息處理中頻域特征比頻域能夠更好地表現(xiàn)出一些特質(zhì)。所以本文中主要介紹后者。我們知道信號(hào)存在眾多的特性,這些特性很多都可以作為參考量。比如能量,共振峰,語音頻譜等語音參數(shù)都可以作為語音信號(hào)的特征參數(shù)。LPCC和MFCC兩種方法應(yīng)用廣泛。下圖是計(jì)算LPCC的過程: 圖6 LPCC計(jì)算流程圖LPCC與MFCC有許多異同點(diǎn)。值得注意的是,通過兩者的比較我們發(fā)現(xiàn)MFCC比LFCC有更好的優(yōu)越性:(1)語音信號(hào)的低頻部分包含大量信息,而Mel到頻譜在轉(zhuǎn)化時(shí)也是比較注重其低頻信息;(2)MFCC的使用情況非常的廣泛,沒有各種前提假設(shè);(3)語音識(shí)別屬于人工智能的范疇,它的所有技術(shù)都應(yīng)考慮到人類本身的構(gòu)造,這樣才能在該技術(shù)上產(chǎn)生突破。此外MFCC還充分考慮了人體結(jié)構(gòu)中聽覺特點(diǎn),所以在語音處理方面MFCC比LPCC的性能更好。目前語音識(shí)別系統(tǒng)的相關(guān)處理工作也是把MFCC作為主要方向。 MFCC的計(jì)算方式是比較復(fù)雜的。通常的方法就是建立一個(gè)濾波器組,濾波器組之間會(huì)進(jìn)行頻率之間的相應(yīng)變換。下式為Mel頻率的公式: (8)式中f是實(shí)際的語音信號(hào)頻率。下圖展示MFCC尺度對(duì)應(yīng)曲線: 圖7 MFCC尺度對(duì)應(yīng)曲線 我們之所以選擇MFCC是因?yàn)樗奶厥庾饔?。它能夠?qū)︻l率進(jìn)行不均勻的標(biāo)定。通過上面的式子可以進(jìn)行相應(yīng)的頻域向倒譜的變換。下面是MFCC倒譜系數(shù)的求取步驟: (1) 首先我們要獲得信號(hào)并將其進(jìn)行數(shù)字化,這是信號(hào)處理的重要部分。(2) 其次對(duì)于一幀語音信號(hào)進(jìn)行FFT變換。這樣就可以獲取信號(hào)的離散功率譜X(k)。(3)定義一個(gè)濾波器組。各個(gè)濾波器的中心頻率都設(shè)為f(m),這些濾波器組在頻域上是有一些要求的,通常情況下它在一定的范圍內(nèi)?,F(xiàn)在我們把三角濾波器的中心f(m)定義為 (9) (9)式中:是錄波器的低通頻率部分而是它的高通頻率部分;是信號(hào)采樣頻率;M是濾波器的個(gè)數(shù);N是進(jìn)行FFT變換時(shí)的數(shù);計(jì)算公式如下: (10)(4)從上一步我們可以求出不同濾波器產(chǎn)生得相關(guān)輸出頻譜能量。我們?cè)賹?duì)其取對(duì)數(shù)之后便得到一組如下系數(shù) (11)再經(jīng)過離散余弦變換(DCT)將S(m)轉(zhuǎn)換到時(shí)域,就是MFCC。計(jì)算過程如下: (12)下圖為Mel倒譜系數(shù)(MFCC)的計(jì)算流程框圖: 圖 8 MFCC計(jì)算流程圖 目前存在多種語音識(shí)別方法,主要分為三種:隨機(jī)模型法、模板匹配法、概率語法分析法。其他的一些方法都?xì)w屬于上面的幾種類型,如果再進(jìn)行細(xì)致的劃分則可為下面這些。動(dòng)態(tài)時(shí)間規(guī)整技術(shù)(DTW)和隱馬爾科夫模型(HMM)歸屬于模板匹配的范疇。人工神經(jīng)網(wǎng)絡(luò)(ANN)、矢量量化(VQ)也是出現(xiàn)比較早并且用到的較多的。當(dāng)然為了語音識(shí)別技術(shù)的改進(jìn)一些多種技術(shù)聯(lián)合使用的新方法也得到推廣,比如說HMM和VQ交叉使用的匹配方法就是一種對(duì)隱馬爾科夫改進(jìn)的方法。動(dòng)態(tài)時(shí)間規(guī)整技術(shù)(DTW)在識(shí)別中是比較早期的關(guān)于模式匹配與模型訓(xùn)練的技術(shù)。特征參數(shù)之間進(jìn)行比較的時(shí)候會(huì)消耗不同的時(shí)間。這樣就不能同時(shí)完成參數(shù)間的檢測(cè),識(shí)別率機(jī)會(huì)大大降低。而動(dòng)態(tài)時(shí)間規(guī)整里的DP算法可以很好地解決這樣的問題。在DTW算法中,主要是把語音信號(hào)的時(shí)間軸失真處理。當(dāng)然這種處理最主要的就是對(duì)其進(jìn)行不規(guī)則的扭曲。這樣做的目的是為了限制該算法中匹配路徑的個(gè)數(shù)。個(gè)數(shù)越少我們計(jì)算就會(huì)越簡(jiǎn)單,最后我們可以找到一條比較好的路徑方式。 隱馬爾科夫模型(HMM)是比較早的引入理論的。它是一種比較理想的統(tǒng)計(jì)方法。這種方法如今已經(jīng)得到了比較廣泛的運(yùn)用。屬于上面分類中模板匹配的一種方式。其和別的方法最特殊的地方就是他的對(duì)比庫的不同。這種對(duì)比庫在和待測(cè)量進(jìn)行比較之前會(huì)進(jìn)行大量的訓(xùn)練。通過這些訓(xùn)練可以得到一個(gè)和待測(cè)語音很近的矢量值作為存儲(chǔ)模板保留。人工神經(jīng)網(wǎng)絡(luò)(ANN)。它的研究是語音識(shí)別技術(shù)的重大突破,盡管還未成熟,但是如今它是研究的重點(diǎn)。多層感知神經(jīng)網(wǎng)絡(luò)以及其特征映射是現(xiàn)在識(shí)別系統(tǒng)主要研究的方向。在眾多的方法比較
點(diǎn)擊復(fù)制文檔內(nèi)容
黨政相關(guān)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1