freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于語音識(shí)別的智能小車設(shè)計(jì)_畢業(yè)設(shè)計(jì)(編輯修改稿)

2024-10-01 14:51 本頁面
 

【文章內(nèi)容簡介】 H , 若譜大于 T H ,則可確定 2 個(gè)端點(diǎn) A、 B, 并可認(rèn)為這 2 個(gè)端點(diǎn)之間是語音信號(hào) , 這樣相當(dāng)于完成初判。 再根據(jù)背景噪聲的 過零率和音量積 設(shè)定一個(gè)比 TH 稍低的門限 T L , 如果信號(hào)的能量大于 TL ,則所對(duì)應(yīng)的端點(diǎn) C、 D 之間仍是語音信號(hào) ,至此完成了第二級(jí)判斷。 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 10 判斷結(jié) 果 如圖 25 所示 : 0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0421012聲音波形1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 2 . 1x 1 0421012語音波形 圖 25 端點(diǎn)檢測出的語音波形 167。 特征參數(shù)提取 167。 特征參數(shù)概述 對(duì)于特征參數(shù),有多種參數(shù)可供選取。常見的有三種: ( 1) 線形預(yù)測系數(shù)特征矢量 (LPC) ( 2) LPC 倒譜特征矢量 (LPCC) ( 3) Mel 倒譜系數(shù) (MFCC) 1. 線性預(yù)測系數(shù) (LPC) 這里我采用最簡單的一種線形預(yù)測系數(shù)特征矢量 (LPC)。 線性預(yù)測(Linear Prediction)分析是最有效的語音分析技術(shù)之一,在語音編碼、語音合成、語音識(shí)別和說話人識(shí)別等語音信號(hào)處理領(lǐng)域中得到了廣泛的應(yīng)用?;幽峡萍即髮W(xué)本科畢業(yè)設(shè)計(jì)(論文) 11 本思想是:一個(gè) 語音信號(hào)的抽樣值可以用過去的若干個(gè)抽樣值的線性組合來逼近。 語音信號(hào)是一種典型的時(shí)變信號(hào),然而如果把觀察時(shí)間縮短到十毫秒至幾十毫秒,則可以得到一系列近似穩(wěn)定的信號(hào)。人的發(fā)音器官可以用若干段前后連接的聲管進(jìn)行模擬,這就是所謂的聲管模型。 由于發(fā)音器官不可能毫無規(guī)律地快速變化,因此語音信號(hào)是準(zhǔn)穩(wěn)定的(quasi steady)。全極點(diǎn)線性預(yù)測模型 (LPC)可以對(duì)聲管模型進(jìn)行很好的描述,這里信號(hào)的激勵(lì)源是由肺部氣流的沖擊引起的,聲帶可以有周期振動(dòng)也可以不振動(dòng),分別對(duì)應(yīng)濁音 (Vowel)和清音 (Consonant),而每段聲管則對(duì)應(yīng)一個(gè) LPC 模型的極點(diǎn)。一般情況下,極點(diǎn)的個(gè)數(shù)在 12~16 之間,就可以足夠清晰地描述語音信號(hào)的特征了。 LPC 是語音分析的重要手段,它能很好地進(jìn)行譜估計(jì),即可作為語音特征的參數(shù)。因此僅用 12個(gè) LPC 系數(shù)就能很好地表示復(fù)雜語音信號(hào)的特征,這就大大降低了信號(hào)的冗余度并有效地減少了計(jì)算量和存儲(chǔ)量,使之成為語音識(shí)別和語音壓縮的基礎(chǔ)。 1 ?( , 0 ) ( , )pn k nki a i k???? ? 1,2, ,kp? ???????????? 上式表示 p 個(gè)方程構(gòu)成的方程組,未知數(shù)為 p 個(gè)。求解該方程組,就可以得到系統(tǒng)的線性預(yù)測系數(shù)。由基于自相關(guān)的遞推求解公式求解,也就是所謂的 Durbin 算法得: (0) (0)nnER? ???????????????????????? 1 ( 1 )1( 1 )( ) ( )i in j nji inR i a R i jk E? ?????? ??????????????????? ()iiiak? ??? ??????????????????????? ( ) ( 1 ) ( 1 ) ,1i i ij j i i ja a k a j i???? ? ? ?????????????????? ( ) 2 ( 1)(1 )lin i nE k E ??? ????????????????????? 公式中,上標(biāo) ()i 表示第 i 次迭代,每次迭代只計(jì)算和更新 12, , ,ia a a 直河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 12 到 ip? 時(shí),結(jié)束迭代。 在 MATLAB 中利用 lpc 函數(shù)計(jì)算 LPC 系數(shù),其語法為: a = lpc(x,n)。 這里 x 為一幀語音信號(hào), n 為計(jì)算 LPC 參數(shù)的階數(shù)。通常 x 為 240 點(diǎn)或256 點(diǎn)的數(shù)據(jù), n 取 10~12,對(duì)語音識(shí)別來說就已經(jīng)足夠。 2. 線性預(yù)測倒譜系數(shù) (LPCC) 在語音識(shí)別系統(tǒng)中,很少直接使用 LPC 系數(shù),而是由 LPC 系數(shù)推導(dǎo)出另一種參數(shù):線性預(yù)測倒譜系數(shù)( LPCC)。倒譜實(shí)際上是一種同態(tài)信號(hào)處理方法,標(biāo)準(zhǔn)的倒譜系數(shù)計(jì)算流程需要進(jìn)行 FFT 變換,對(duì)數(shù)操作和相位校正等步驟,運(yùn)算比較復(fù)雜。在實(shí)際運(yùn)作中大 多數(shù)語音識(shí)別系統(tǒng)都會(huì)采用倒譜參數(shù)來作為有關(guān)距離的度量。 LPC 倒譜系數(shù)是描述說話人聲道特性的,廣泛應(yīng)用于聲紋識(shí)別。在實(shí)際計(jì)算中,當(dāng)序列 x(n)為最小相位的情況下,可以利用序列 x(n)及其倒譜系數(shù) c(n)的遞推關(guān)系來簡化計(jì)算。 序列 x(n)及其復(fù)倒譜系數(shù) c(n)的遞推公式如下: 100 , 0() ( ) ( )? ( ) , 0( 0) ( 0)nknxn x n k x n kx k nx n x?????? ?? ???? ?????????????? LPCC 參數(shù)是一種非常重要的參數(shù),它不是由原始信號(hào) x(n)得到,而是由 LPC 系數(shù) ma 得到的。由 式可得 LPC 到 LPCC 的直接遞推關(guān)系。 20 logcG? ????????????????????????? 11 ,1mm m k m kk kc a c a m pm???? ? ? ?? ???????????????? 11 ,mm k m kk kc c a m pm?????? ?????????????????? 3. Mel 尺度 倒譜系數(shù) (MFCC) LPC 模型是基于發(fā)音模型建立的, LPCC 系數(shù)也是一種基于合成的參數(shù)。這種參數(shù)沒有充分利用人耳的聽覺特性。實(shí)際上,人的聽覺系 統(tǒng)是一個(gè)特殊河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 13 的非線性系統(tǒng),它響應(yīng)不同頻率信號(hào)的靈敏度是不同的,基本上是一個(gè)對(duì)數(shù)的關(guān)系。近年來,一種能夠比較充分利用人耳這種特殊的感知特性的參數(shù)得到 了 廣 泛 的 應(yīng) 用 , 這 就 是 Mel 尺 度 倒 譜 參 數(shù) (Melscaled Cepstrum Coefficient),或稱 Mel 頻率倒譜系數(shù),簡稱為 MFCC。大量的研究表明, MFCC參數(shù)能夠比 LPCC 參數(shù)更好地提高系統(tǒng)的識(shí)別性能。從目前使用的情況來看,在大詞匯量語音識(shí)別應(yīng)用中已逐漸取代原本常用的線性預(yù)測編碼導(dǎo)出的倒頻譜參數(shù),原因是它考慮了人類發(fā)聲與接收聲音的特性,具有更好的魯 棒性。由于語音信號(hào)在時(shí)域上的變化快速而不穩(wěn)定,所以通常都將它轉(zhuǎn)換到頻域上來觀察,此時(shí)它的頻譜會(huì)隨著時(shí)間作緩慢的變化。所以通常將加窗后的幀經(jīng)過快速傅立葉變換( FFT),求出每幀的頻譜參數(shù)。再將每幀的頻譜參數(shù)通過一組 N 個(gè)( N 一般為 20 ~ 30 個(gè))三角形帶通濾波器所組成的 Mel 頻率濾波器,將每個(gè)頻帶的輸出取對(duì)數(shù),求出每一個(gè)輸出的對(duì)數(shù)能量( log energy)Ek, k =1, 2, ... N。再將此 N 個(gè)參數(shù)進(jìn)行余弦變換( cosine transform) 求出 L 階的 Mel scale cepstrum 參數(shù)。 MFCC 參數(shù)的計(jì)算是以“ bark”為其頻率基準(zhǔn)的,它和線性頻率的轉(zhuǎn)換關(guān)系是: 102 5 9 5 lo g (1 )700mel ff ????????????????????? MFCC參數(shù)也是按幀計(jì)算的。首先要通過 FFT得到該幀信號(hào)的功率譜 ()Sn,轉(zhuǎn)換為 Mel頻率下的功率譜。這需要在計(jì)算之前先在語音的頻譜范圍內(nèi)設(shè)置若干個(gè)帶通濾波器: ( ) , 0 , 1 , , 1 , 0 , 1 , , 12m NH n m M n? ? ? ??????????? MFCC 參數(shù)的計(jì)算通常采用如 下的流程: ( 1) 首先確定每一幀語音采樣序列的點(diǎn)數(shù)。對(duì)每幀序列 ()sn進(jìn)行預(yù)加重 處理后再經(jīng)過離散 FFT 變換,取模的平方得到離散功率譜 ()Sn。 ( 2)計(jì)算 ()Sn通過 M 個(gè) ()mHn后所得的功率值,即計(jì)算 ()Sn和 ()mHn在 各離散頻率點(diǎn)上 乘積之和,得到 M 個(gè)參數(shù) mP , 0,1, , 1mM??。 ( 3)計(jì)算 mP 的自然對(duì)數(shù),得到 mL , 0,1, , 1mM??。 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 14 ( 4)對(duì) 0 1 1, , , mL L L ? 計(jì)算其離散余弦變換,得到 mD , 0,1, , 1mM??。 ( 5)舍去代表直流成分的 0D ,取 12, , , KD D D 作為 MFCC 參數(shù)。 167。 用 MATLAB 實(shí)現(xiàn) LPC 系數(shù)的計(jì)算 本系統(tǒng)使用的特征參數(shù)是線性預(yù)測系數(shù) (LPC)。 在 MATLAB 中利用 lpc 函數(shù)計(jì)算 LPC 系數(shù),其語法為: a = lpc(x,n)。 這里 x 為一幀語音信號(hào), n 為計(jì)算 LPC 參數(shù)的階數(shù)。通常 x 為 240 點(diǎn)或256 點(diǎn)的數(shù)據(jù), n 取 10~12,對(duì)語音識(shí)別來說就已經(jīng)足夠。 167。 語音識(shí)別中的模式匹配 167。 DTW 算法 原理 目前 ,語音識(shí)別的匹配主要應(yīng)用 HMM 和 DTW 兩種算法。 DTW 算法由于沒有一個(gè)有效地用統(tǒng)計(jì)方法進(jìn)行訓(xùn)練的框架,也不容易將低層和頂層的各種知識(shí)用到語音識(shí)別算法中,因此在解決大詞匯量、連續(xù)語音、非特定人語音識(shí)別問題時(shí)較之 HMM 算法相形見絀。 HMM 是一種用參數(shù)表示的 ,用于描述隨機(jī)過程統(tǒng)計(jì)特性的概率模型。而對(duì)于孤立詞識(shí)別 ,HMM 算法和 DTW算法在相同條件下 ,識(shí)別效果相差不大 , 又由于 DTW 算法本身既簡單又有效,但 HMM 算法要復(fù)雜得多。它需要在訓(xùn)練階段提供大量的語音數(shù)據(jù) ,通過反復(fù)計(jì)算才能得到參數(shù)模型 ,而 DTW 算法的 訓(xùn)練中幾乎不需要額外的計(jì)算。鑒于此 ,DTW 更適合本系統(tǒng)的要求。 在孤立詞語音識(shí)別中,最為簡單有效的方法是采用 DTW( Dynamic Time Warping,動(dòng)態(tài)時(shí)間歸整)算法,該算法基于動(dòng)態(tài)規(guī)劃( DP)的思想,解決了發(fā)音長短不一的模板匹配問題,是語音識(shí)別中出現(xiàn)較早、較為經(jīng)典的一種算法。用于孤立詞識(shí)別, DTW 算法與 HMM 算法在訓(xùn)練階段需要提供大量的語音數(shù)據(jù),通過反復(fù)計(jì)算才能得到模型參數(shù),而 DTW 算法的訓(xùn)練中幾乎不需要額外的計(jì)算。所以在孤立詞語音識(shí)別中, DTW 算法仍然得到廣泛的應(yīng)用。 無論在訓(xùn)練和建立模板 階段還是在識(shí)別階段,都先采用端點(diǎn)算法確定語音的起點(diǎn)和終點(diǎn)。已存入模板庫的各個(gè)詞條稱為參考模板,一個(gè)參考模板可河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 15 表示為 R={R( 1), R( 2),??, R( m),??, R( M) }, m 為訓(xùn)練語音幀的時(shí)序標(biāo)號(hào), m=1 為起點(diǎn)語音幀, m=M 為終點(diǎn)語音幀,因此 M 為該模板所包含的語音幀總數(shù), R( m)為第 m 幀的語音特征矢量。所要識(shí)別的一個(gè)輸入詞條語音稱為測試模板,可表示為 T={T( 1), T( 2),??, T( n),??, T( N) },n 為測試語音幀的時(shí)序標(biāo)號(hào), n=1 為起點(diǎn)語音幀, n=N 為終點(diǎn)語音幀,因此 N為該模板所包含的語音幀總數(shù) , T( n)為第 n 幀的語音特征矢量。參考模板與測試模板一般采用相同類型的特征矢量(如 MFCC, LPC 系數(shù))、相同的幀長、相同的窗函數(shù)和相同的幀移。 假設(shè)測試和參考模板分別用 T 和 R 表示,為了比較它們之間的相似度,可以計(jì)算它們之間的距離 D[T, R],
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1