freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

特定人孤立詞語音識別的研究畢業(yè)論文-資料下載頁

2025-08-18 04:10本頁面

【導(dǎo)讀】師的指導(dǎo)下進(jìn)行的研究工作及取得的成果。盡我所知,除文中特別加。而使用過的材料。對本研究提供過幫助和做出過貢獻(xiàn)的個(gè)人或集體,均已在文中作了明確的說明并表示了謝意。集體已經(jīng)發(fā)表或撰寫過的作品成果。本人完全意識到本聲明的法律。結(jié)果由本人承擔(dān)。別系統(tǒng),給出實(shí)現(xiàn)方案。對特定人語音識別系統(tǒng)中牽涉到的有關(guān)識別算法要進(jìn)行編程,并在。,給出具體仿真結(jié)果。4.2020年5月準(zhǔn)備答辯。路徑計(jì)算,從而獲得兩個(gè)矢量匹配時(shí)累積距離最小的規(guī)整函數(shù)。DTW解決了發(fā)音長短不一的模板匹配問題,是語音識別中出現(xiàn)較早,較為經(jīng)典的一種算。語音識別的概念、分類、發(fā)展過程及發(fā)展趨勢;語音識別系統(tǒng)的實(shí)現(xiàn)方案與語音識別中需要的語音信號處理理論;我完成這項(xiàng)設(shè)計(jì)所采取的主要措施有兩條:一是密切聯(lián)系。尋求有關(guān)畢業(yè)設(shè)計(jì)信息,確定設(shè)計(jì)課題方向與設(shè)計(jì)內(nèi)容;二是虛心學(xué)習(xí)。[4]陳立萬.基于語音識別系統(tǒng)中DTW算法改進(jìn)技術(shù)研究[J].《微計(jì)算機(jī)信息》,國防科技大學(xué)出版社.

  

【正文】 窗,以克服 Gibbs 現(xiàn)象。 ( 2 ) 把功率譜通過帶通濾波器,然后再取自然對數(shù)。 ( 3 ) 計(jì)算其離散余弦變換。 為每幀數(shù)據(jù)計(jì)算出 L 階 MFCC 參數(shù)后,一般還要為這 L 個(gè)系數(shù)分別乘以不同的權(quán)系數(shù),實(shí)際上是一個(gè)短窗口: ( 16) 差分倒譜參數(shù) 標(biāo)準(zhǔn)的 MFCC 參數(shù)反映了語音參數(shù)的靜音特特性,而人耳對語音的動態(tài)特征更為敏感,所以通常是用差分倒譜參數(shù)來描述語音特征的動態(tài)特性。 f mel = 2595 log10 (1+ ) f 700 Cm = Wm Cm ^ L 2 Wm = 1 + — sin ( — ), 1≤ m≤ L π L m m 6 差分參數(shù)的計(jì)算公式為: ( 17) 這里 c 和 d 都表示一幀語音信號參數(shù), l 為常數(shù),一般取 2,這時(shí)差分參數(shù)就稱為當(dāng)前幀的前兩幀和后兩幀參數(shù)的線性組合。由上式計(jì)算得到的差分參數(shù)為一階 MFCC 差分參數(shù),用同樣的公式對一階差公參數(shù)進(jìn)行計(jì)算,可以得到二階差 MFCC。 在相同的參數(shù)維數(shù)下, Mel 濾波器個(gè)數(shù) D 對識別性能影響不大,這里取 24,本文中,是將 12 階 MFCC 參數(shù)和它一階差分參數(shù)合并為一個(gè)矢量( 24 階),作為一幀語音信號的參數(shù),因?yàn)閯討B(tài) 信息和靜態(tài)信息形成互補(bǔ),所以能很大程度上提高系統(tǒng)的識別性能。 l d (n) = Σ j ● C(n+j) j = 1 √ __ ∑ j 2 j = l l 1 ________ 7 2 Dynamic Time Warping 算法 假定一個(gè)孤立詞語音識別系統(tǒng),利用模板匹配法進(jìn)行識別。這時(shí)一般是用單詞作為識別單元。在訓(xùn)練階段,用戶將詞匯表中的每個(gè)詞依次說一遍,作為模板存入模板庫;在識別階段,將輸入語音的 特征 矢量時(shí)間序列依次與模板庫中的每個(gè)模板進(jìn)行相似度比較,將相似度最高的作為識別結(jié)果輸出。但是語音具有相當(dāng)大的隨機(jī)性,即使是同一個(gè)人在不同的時(shí)刻所講的同一句話、發(fā)同一個(gè)音,也不可能具有完全相同的時(shí)間長度。因此在進(jìn)行模板匹配時(shí),把識別 信號伸長或縮短至參考模板的長度是必不可少的,但研究表明,簡單的線性拉伸或壓縮并不能有效的提高識別率。對此,日本學(xué)者板倉 將 DP 算法的概念用于解決孤立詞識別時(shí)的說話速度不均勻的難題,提出了著名的動態(tài)時(shí)間伸縮算法,即 DTW 算法。 DTW 是采用一種最優(yōu)化的算法 —— 動態(tài)規(guī)整法,通過將待識別語音信號的時(shí)間軸進(jìn)行不均勻地扭曲和彎曲,使其特征與模板特征對齊,并在兩者之間不斷的進(jìn)行兩個(gè)矢量距離最小的匹配路徑計(jì)算,從而獲得兩個(gè)矢量匹配時(shí)累積距離最小的規(guī)整函數(shù)。這是一個(gè)將時(shí)間規(guī)整和距離測度有機(jī)結(jié)合在一起的非線性規(guī)整技術(shù),保證了待 識別特征與模板特征之間最大的聲學(xué)相似特性和最小的時(shí)差失真 。 DTW 解決了發(fā)音長短不一的模板匹配問題,是語音識別中出現(xiàn)較早,較為經(jīng)典的一種算法 [10]。 DTW 算法原理 在對每一幀語音信號提取 MFCC 特征參數(shù)以后,就轉(zhuǎn)化成了一組 MFCC 特征向量。語音識別就是要將測試語音的這個(gè)特征向量同模板庫中已存在的語音特征向量進(jìn)行模式匹配,尋找距離最短的模式作為識別結(jié)果。在用 DTW 算法進(jìn)行識別判決時(shí) ,由于測試語音與參考模式語音長短不同,因此需要通過 DTW 動態(tài)計(jì)算兩個(gè)長度不同的模式之間的相似程度,或者叫做失真距離。 圖 4 動態(tài)時(shí)間彎曲( DTW)算法求最小失真 假設(shè)參考模板和測試模板分別用 R 和 T 表示,它們之間的相似度用它們之間的距離D[T, R]來度量,距離越小相似度越高。為了計(jì)算這一失真距離,要從 T 和 R中各個(gè)對應(yīng)幀之間的距離算起。設(shè) n 和 m分別是 T 和 R 中任意一幀, d [T(n), R(m)]表示這兩幀特征矢量之間的距離,在 DTW 中通常采用歐式距離。 2 ( 1,1) N M m n T R 2 ( N, M) D[T(n), R(m)] R( m) T( n) ( n, m) 8 設(shè) 測試模板 T 共有 N 幀,參考模板 R 共有 M幀,將測試模板和參考模板的幀號分別在坐標(biāo)系的橫坐標(biāo)和縱坐標(biāo)上標(biāo)出,則各個(gè)幀號之間的關(guān)系可以形成一個(gè)網(wǎng)格,網(wǎng)格中的任何一個(gè)交叉點(diǎn) (n, m)表示測試模板的 T( n)和參考模板的 R( m)相交,并且該交叉點(diǎn)擁有幀失真為 D[T(n), R(m)]。如上 圖所示。 DP 算法就是尋找一條通過此網(wǎng)格中若干個(gè)格點(diǎn)的最佳路徑。路徑不是隨意選擇的,首先任何一種語音的發(fā)音快慢都有可能變化,但是其各部分的先后次序不可能改變,因此所選的路徑必定是從左下角出發(fā),在右上角結(jié)束。如下圖所示: 圖 5 DTW算法搜索路徑 假設(shè)路徑通過的格點(diǎn)依次為 (n1, m1),?, (ni, mi),?, (nN, mM),其中 (n1, m1)=(1,1), (nN, mM)=(N, M)。路徑可以用函數(shù) mi =Φ (ni)來描述,其中 ni = i , i = 1, 2,?, N,Φ (1)=1,Φ (N)=M。為了使路徑不至于過分傾斜,約束斜率在 ~ 2 的范圍內(nèi)。如果路徑已通過了格點(diǎn) (ni1, mi1),那么下一個(gè)通不定期的格點(diǎn) (ni, mi)只可能是 (ni1+1, mi1+2)、 (ni1+1,mi1+1)和 (ni1, mi1),用γ表示這種約束條件。求最佳路徑的問題即為: ( 21) 其中 為最佳路徑函數(shù)。 D[(ni, mi)] = d [T(ni), R(mi)] + D[(ni1, mi1)] ( 22) 其中的 D[(n i1, m i1)]由下式?jīng)Q定 D[(ni1, mi1)]=min{ D[(ni1, mi)], D[(ni1, mi1)], D[(ni1, mi2)]} ( 23) 從 (ni, mi) =(1, 1) 開始往下搜索 (n2, m2),再搜索 (n3, m3) ??,對每一個(gè) (ni,mi) 都存儲相應(yīng)的前一格點(diǎn) (ni1, mi1) 及相應(yīng)的幀匹配距離 d[ni, mi]。搜索到 (nN, mM) 時(shí),只保留一條最佳路徑 [4]。 由于 DTW不斷地計(jì)算測試矢量與模板矢量的距離以尋找最優(yōu)的匹配路徑,所以得到的兩矢量匹配是累計(jì)距離最小的路徑函數(shù),這保證了它們之間存在最大的聲學(xué)相似特性。 改進(jìn)的 DTW 算法 通常,規(guī)整函數(shù)被限制在一個(gè)平行四邊形的網(wǎng)格內(nèi),它的一條邊斜率為 2,另一條邊斜率為 1/ 2。如圖 6 所示。 2 1 2 3 4 5 6 7 8 9 10 N M 9 1 3 4 5 6 7 8 Σ D[n i, m i] = min N n i =1 ^ m i =Φ (n i) ∈γ Σ D[n i, m i] N n i =1 m i =Φ (n i) ∈γ Φ (● ) m i =Φ (n i) ^ 9 圖 6 匹配路徑約束 示意圖 規(guī)整函數(shù)的起點(diǎn)是 (1, 1),終點(diǎn)為 ( N, M), DTW 算法的目的是在此平行四邊形內(nèi)由起點(diǎn)到終點(diǎn)尋找一個(gè)規(guī)整函數(shù),使其具有最小的代價(jià)函數(shù),保證了測試模板與參考模板之間具有最大的聲學(xué)相似特性。由于在模板匹配過程中限定了彎折的斜率,因此平行四邊形之外的格點(diǎn)對應(yīng)的幀匹配距離是不需要計(jì)算的。 另外,因?yàn)槊恳涣懈鞲顸c(diǎn)上的匹配計(jì)算只用到了前一列的 3 個(gè)網(wǎng)格,所以沒有必要保存所有的幀匹配距離矩陣和累積距離矩陣。 充分利用這兩個(gè)特點(diǎn)可以減少計(jì)算量和存儲空間的需求,形成一種高效的 DTW 算法。 把實(shí)際的動態(tài)彎 曲分為三段,( 1, Xa) ,( Xa + 1, Xb)和( Xb + 1, N),其中: ( 24) 由于 Xa 和 Xb 取最相近的整數(shù),從上式可出 M和 N 的限制條件: ( 25) 當(dāng)不滿足上式中的兩個(gè)條件時(shí),可認(rèn)為兩者差太大,無法進(jìn)行動態(tài)彎折匹配。 在 X軸上的每一幀 不再需要與 Y軸上的每一幀進(jìn)行比較,而只是與 Y軸上 [ymin, ymax]間的幀進(jìn)行比較。 ymin, ymax的計(jì)算如下式所示 [3] Xa = Xb 時(shí): 當(dāng) Xa < Xb 時(shí)比較分三段 : A Xa Xb N x y M (N, M) y = 2x + (M – 2N) B y = 2x 1 2 — y = x 1 2 — y = x + (M – N) 1 2 — (1, 1) 2M – N ≥ 3 2N – M ≥ 21 3 — Xa = (2M – N ) 2 3 — Xb = (2N – M ) 1 2 — 1 2 — x → 2 x x ≤ Xa 2 x + (M – 2N ) → x + (M – N ) x > Xa 1 2 — 10 當(dāng) Xa > Xb 時(shí): 沿 X軸上每前進(jìn)一幀,雖然所要比較的 Y軸上的幀數(shù)不同,但彎曲特性是一樣的,這樣, 路徑的累積距離都為: D(x,y) = d(x,y) + min[D(x1,y) , D(x1,y1) , D(x1,y2)] ( 26) 由于 X 軸上每前進(jìn)一幀,只需要用到前一列的積累距離,所以只需兩個(gè)矢量 D 和 d 分別保存前一列的累積距離和當(dāng)前列的累積距離,而不用保存整個(gè)矩陣。通過不斷更新數(shù)據(jù)來實(shí)現(xiàn),一直進(jìn)行到待測模板的最后一幀,矢量 D 的最后一個(gè)元素即為兩個(gè)模板經(jīng)過動態(tài)規(guī)劃后的匹配距離,這樣可大大減小存儲空間,減小計(jì)算量,從而提高識別速度。 除上面介紹的整體路徑約束的 DTW算法外還有兩種簡單約束的 DTW 算法,下面分別進(jìn)行簡單的介紹。 搜索寬度受限的 DTW 算法 在實(shí)際應(yīng)用中 DTW算法加入了一些搜索限制條件 , 實(shí)際 的搜索范圍是在一定的寬度之內(nèi) , 如圖 7 所示的對角線附近的帶狀區(qū)域 [9]。 圖 7 對角線附近的帶狀區(qū)域圖 在這個(gè)范圍之內(nèi)按動態(tài)規(guī)劃路徑計(jì)算累積匹配距離,可以進(jìn)一步減少存儲空間,減少計(jì)算量,提高識別速度。 放寬端點(diǎn)限制的 DTW 算法 對于普通 DTW對端點(diǎn)檢測比較敏感,端點(diǎn)信息是作為一組獨(dú)立的參數(shù)提供給識別算法,它要求兩個(gè)比較模式起點(diǎn)對起點(diǎn),終點(diǎn)對終點(diǎn),對端點(diǎn)檢測的精度要求比較高,當(dāng)環(huán)境噪聲1 2 — 1 2 — 1 2 — 1 2 — 1 2 — x → 2 x x ≤ Xa x → x + (M – N ) Xa < x ≤ Xb 2 x + (M – 2N ) → x + (M – N ) x > Xb 1 2 — 1 2 — 1 2 — 1 2 — 1 2 — 1 2 — x → 2 x x ≤ Xb x → x + (M – N ) Xb < x ≤ Xa 2 x + (M – 2N ) → x + (M – N ) x > Xa 1 2 — W i d t h N M 11 比較大或語音由摩擦音構(gòu)成時(shí),端點(diǎn)檢測不易進(jìn)行,放松端點(diǎn)限制方法不嚴(yán)格要求端點(diǎn)對齊,克服了由于端點(diǎn)算法不精確造 成的測試模式和參考模式起點(diǎn)終點(diǎn)不能對齊的
點(diǎn)擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1