freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于vq的大學(xué)生語(yǔ)音識(shí)別算法研究畢業(yè)論文-在線瀏覽

2024-07-30 12:41本頁(yè)面
  

【正文】 詞的識(shí)別。其主要缺點(diǎn)是太依賴于發(fā)音人的原來(lái)發(fā)音,發(fā)音人身體不好或發(fā)音時(shí)情緒緊張都會(huì)影響識(shí)別率。HMM方法不僅解決了短時(shí)模型描述平穩(wěn)段的信號(hào)問題,而且解決了每個(gè)短時(shí)平穩(wěn)段是如何轉(zhuǎn)變到下一個(gè)短時(shí)平穩(wěn)段的問題。HMM以大量訓(xùn)練作為基礎(chǔ),語(yǔ)音識(shí)別過(guò)程中需要測(cè)算待識(shí)別語(yǔ)音的概率大小?;赩Q的語(yǔ)音識(shí)別技術(shù)是在20世紀(jì)80年代發(fā)展起來(lái)的,它可替代DTW完成動(dòng)態(tài)匹配,其存儲(chǔ)量和計(jì)算量都比較小。識(shí)別時(shí),將輸入語(yǔ)音的K維幀矢量與已有碼本中的M個(gè)區(qū)域邊界比較,按失真測(cè)度最小準(zhǔn)則找到與該輸入矢量距離最小的碼字標(biāo)號(hào)來(lái)代替此輸入的K維矢量,這個(gè)對(duì)應(yīng)的碼字即為識(shí)別的結(jié)果,再對(duì)它進(jìn)行K維重建就得到被識(shí)別的信號(hào)。知識(shí)庫(kù)中一般包含詞匯、語(yǔ)法、句法、語(yǔ)義和常用搭配等知識(shí),如漢語(yǔ)的聲調(diào)變調(diào)規(guī)則、音長(zhǎng)分布規(guī)則、同音字判別規(guī)則、構(gòu)詞規(guī)則、語(yǔ)法規(guī)則、語(yǔ)義規(guī)則等。對(duì)于不同的語(yǔ)言需要有不同的語(yǔ)言學(xué)專家知識(shí)庫(kù),同樣,漢語(yǔ)也有其特有的專家知識(shí)庫(kù)。因此,選擇適當(dāng)?shù)母鞣N距離測(cè)度的門限值是最主要的問題。判決的結(jié)果識(shí)別率是檢驗(yàn)門限值選擇正確與否的唯一標(biāo)準(zhǔn),通常情況下需要調(diào)整這些門限值才能得到滿意的識(shí)別結(jié)果。由于采用矢量量化技術(shù)的數(shù)據(jù)壓縮具有編碼簡(jiǎn)單、效率高、壓縮比大等諸多優(yōu)點(diǎn),因而,矢量量化最先在語(yǔ)音、圖像、視頻這些媒體信息的壓縮中得到了廣泛的應(yīng)用。矢量量化技術(shù)在其他方面的應(yīng)用也發(fā)展十分迅速,如語(yǔ)音識(shí)別,說(shuō)話人識(shí)別,文件檢索,移動(dòng)通信等眾多科學(xué)領(lǐng)域中矢量量化技術(shù)已得到了廣泛地應(yīng)用。碼書設(shè)計(jì)在一方面可以看成是一個(gè)統(tǒng)計(jì)聚類的過(guò)程,但從另一個(gè)角度來(lái)看,碼書設(shè)計(jì)也是一個(gè)迭代過(guò)程。從以上分析可以看出,碼書的優(yōu)化是一個(gè)很重要的環(huán)節(jié)。此外,先進(jìn)的預(yù)測(cè)技術(shù)也是提高壓縮比的一種方法。量化可分為標(biāo)量量化和矢量量化兩大類。當(dāng)輸入的標(biāo)量信號(hào)落入這個(gè)小區(qū)間時(shí),其量化值就用這個(gè)代表值代替,或者稱之為被量化為這個(gè)代表值。 矢量量化用線性空間的觀點(diǎn)把標(biāo)量量化看成是一維矢量量化。矢量量化是標(biāo)量量化的發(fā)展,同時(shí),矢量量化總是優(yōu)于標(biāo)量量化。 在輸入信號(hào)序列中,每K個(gè)連續(xù)樣點(diǎn)可以組成一組K維歐式空間中的一個(gè)矢量,矢量量化就是把這個(gè)K維輸入矢量X映射成另一個(gè)K維量化矢量Y。例如,當(dāng)K=2時(shí)所構(gòu)成的是一個(gè)二維矢量,所有可能的二維矢量就構(gòu)成了一個(gè)平面,記二維矢量,所有可能的就是一個(gè)二維空間。圖22(b)所示的是一個(gè)的二維矢量量化器,共有7個(gè)代表值,這些代表值值通常被稱為量化矢量。其中最小失真值所對(duì)應(yīng)的那個(gè)量化矢量,就是模擬矢量X的重構(gòu)矢量(或稱恢復(fù)矢量)。碼書中的量化矢量稱為碼字或碼矢。 (a) (b) 圖22 矢量量化示意圖根據(jù)上面對(duì)矢量量化的描述,可以給矢量量化進(jìn)行如下下的定義:矢量量化是把一個(gè)K維模擬矢量映射成為另一個(gè)K維量化矢量,其數(shù)學(xué)表達(dá)式為: (21) (22) 式中,X表示輸入矢量;表示信源空間;表示K維歐氏空間;Y表示量化矢量(碼字或碼矢);表示量化符號(hào);表示輸出空間(即碼書);N表示碼書的大?。创a字的數(shù)目)。 碼書設(shè)計(jì)對(duì)于矢量量化,首先要設(shè)計(jì)出一個(gè)性能良好的碼書,一個(gè)好的碼書是實(shí)現(xiàn)編碼的基礎(chǔ)。因而,尋求一種高效的算法,使盡可能找到全局最優(yōu)或接近全局最優(yōu)的碼書來(lái)提高碼書的性能,從而減少計(jì)算的復(fù)雜程度才是研究碼書設(shè)計(jì)算法的目的。 碼字索引分配在矢量量化參與的編碼和解碼系統(tǒng)中,如果信道有噪聲,則在信道左端的索引i經(jīng)過(guò)信道傳輸輸出索引j ,這樣就會(huì)導(dǎo)致在解碼端引入額外的失真。好的碼書能最大程度的提高矢量量化的效果,使得恢復(fù)后的矢量、語(yǔ)音、圖像和原來(lái)的矢量、語(yǔ)音、圖像盡可能的相似。矢量量化技術(shù)的核心是矢量量化器的設(shè)計(jì)。矢量量化器根據(jù)其原理可以分解為編碼器和解碼器兩部分,如圖23。由于碼書(a)與碼書(b)是一樣的,此時(shí)失真最小,所以就是輸入矢量X的重構(gòu)矢量(恢復(fù)矢量)。 失真測(cè)度碼書(a)計(jì)算 置信道/存儲(chǔ)器碼書(b)尋找輸入矢量X編碼器譯碼器ii 圖23 矢量量化器原理框圖 矢量量化器的設(shè)計(jì)關(guān)鍵是編碼器的設(shè)計(jì),而譯碼器僅是一個(gè)簡(jiǎn)單的查表過(guò)程。失真是將輸入信號(hào)矢量用碼書的重構(gòu)矢量來(lái)表征時(shí)的誤差或付出的代價(jià),用這種誤差的統(tǒng)計(jì)平均值(平均失真)來(lái)表征矢量量化器的工作特性。常用的失真測(cè)度主要有均方誤差失真測(cè)度(即歐氏距離)、加權(quán)的均方誤差失真測(cè)度、板倉(cāng)齋藤似然比距離、似然比失真測(cè)度等,在語(yǔ)音信號(hào)處理中常被應(yīng)用于語(yǔ)音波形的矢量量化、線性預(yù)測(cè)參數(shù)矢量量化和孤立詞識(shí)別的矢量量化中。 (1)歐氏距離均方誤差設(shè)輸入信號(hào)的某個(gè)K維矢量X,與碼書中某個(gè)K維矢量Y進(jìn)行比較,、分別表示X和Y中的各元素,則定義均方誤差為歐氏距離,即有 (26) 這里,的下標(biāo)2表示平方誤差。在分析語(yǔ)音信號(hào)時(shí),它按照預(yù)測(cè)誤差能量(方均值)最小準(zhǔn)則,得到模型的預(yù)測(cè)系數(shù)。因?yàn)閮H由預(yù)測(cè)系數(shù)的差值不能完全表征這兩個(gè)語(yǔ)音信息的差別。日本學(xué)者板倉(cāng)等人提出了這種失真測(cè)度。信號(hào)x(n)(功率譜為)和碼書特征矢量決定的信號(hào)(功率譜為)之間的ItakuraSaito失真測(cè)度,定義為 (27) 信號(hào)x(n)的p+1階自相關(guān)矩陣信號(hào)x(n)的自相關(guān)函數(shù),信號(hào)x(n)的預(yù)測(cè)誤差功率;p階碼書重構(gòu)矢量的預(yù)測(cè)誤差功率 (3)識(shí)別失真測(cè)度將矢量量化技術(shù)應(yīng)用于語(yǔ)音識(shí)別時(shí),對(duì)失真測(cè)度還應(yīng)該有其他一些考慮。為此,可以采用如下定義的失真測(cè)度: (28)式中,、輸入信號(hào)矢量和碼書重構(gòu)矢量的歸一化能量; g(x)專用函數(shù),定義為 g(x)作用:當(dāng)兩矢量的能量接近時(shí),忽略能量差異引起的影響;當(dāng)兩矢量的能量相差較大時(shí),進(jìn)行線性加權(quán);當(dāng)能量差超過(guò)門限時(shí),則為某固定值。 第三章 矢量量化器的設(shè)計(jì)算法目前,對(duì)基于矢量量化(VQ)算法的研究已取得了不少的成果,包括LBG算法,K均值算法(KMeans),K均值修正算法(MKM),最鄰近算法,預(yù)測(cè)矢量量化法(PreVQ),乘積矢量量化法等等。所謂矢量量化器的最佳設(shè)計(jì)就是從大量的輸入信號(hào)樣本中訓(xùn)練出一個(gè)較好的碼本,基于一定的條件下使失真最小。矢量量化器的最佳設(shè)計(jì)可以由標(biāo)量量化器的最佳設(shè)計(jì)原理而來(lái),由于這一過(guò)程使用了Lloyd提出的兩個(gè)條件,而后又將該條件推廣到矢量量化器的最佳設(shè)計(jì)上。 最佳劃分類似于標(biāo)量量化中量化區(qū)間的劃分過(guò)程,對(duì)給定的碼書,找出所有碼書矢量的最佳區(qū)域邊界,尋找最佳劃分以使其平均失真最小。因?yàn)榻o定的碼書中共有N個(gè)碼字,所以可以把信源空間劃分為N個(gè)區(qū)間。形心就是該區(qū)域空間的幾何中心,這些形心就組成了最佳碼書中的碼字。LBG算法實(shí)際上就是尋找最佳碼書的反復(fù)迭代過(guò)程,從一個(gè)最初選定的初始碼本開始迭代,將訓(xùn)練序列進(jìn)行分組,找到每一個(gè)組的初始碼書,計(jì)算該初始碼本與訓(xùn)練序列的失真度,根據(jù)計(jì)算所得的最小失真度來(lái)確定新的碼本,產(chǎn)生的新碼本將作為第二次迭代時(shí)的初始碼本。LBG算法因其嚴(yán)密的理論、簡(jiǎn)便的應(yīng)用和良好的設(shè)計(jì)效果,從而得到了廣泛的應(yīng)用,常被作為許多新型碼書設(shè)計(jì)算法改進(jìn)的基礎(chǔ)算法。LBG算法是目前比較常用和流行的一種碼書建立方法,該方法可以用于兩種情況:一是已知信源概率分布,二是未知信源概率分布,但是已知一個(gè)信號(hào)序列的情況。利用訓(xùn)練序列建立碼書的LBG算法的步驟如下。第二步 迭代:用初始碼書為形心,根據(jù)最鄰近準(zhǔn)則將訓(xùn)練序列分成N個(gè)胞腔,即 (33)其中。 第四步 利用公式(32)計(jì)算這時(shí)劃分的各個(gè)胞腔的形心,由這N個(gè)新形構(gòu)成新的碼書,并置n=n+1,返回第二步再進(jìn)行計(jì)算,直到得到所要求的碼書為止。因?yàn)橄噜彽恼Z(yǔ)音信號(hào)具有高度的相關(guān)性,在語(yǔ)音波形量化過(guò)程中應(yīng)使樣本之間具有足夠大的間隔才能使樣本之間的互相關(guān)性得以忽略。其優(yōu)點(diǎn)是無(wú)需初始化計(jì)算,大大節(jié)約了計(jì)算時(shí)間;另外,由于初始碼書是從訓(xùn)練序列中選出來(lái)得,所以不存在空胞腔的問題。隨機(jī)選取方法同時(shí)也存在著一些問題,對(duì)于可能選到的一些非典型的矢量作為碼字,因該胞腔中只存在很少的矢量,特別是只剩下一個(gè)初始碼字時(shí),在某些空間可能造成胞腔的劃分過(guò)于細(xì)致,使很多碼字得不到充分的利用,然而在有些空間又將胞腔劃分的過(guò)大,所以被選中的碼字在訓(xùn)練序列中的不均勻分布使得該方法比較適用于相對(duì)比較平穩(wěn)的序列。本設(shè)計(jì)中語(yǔ)音信息選取的時(shí)間相對(duì)較短,是一個(gè)相對(duì)平穩(wěn)的序列,所以使用隨機(jī)選取法選取初始碼書具有可行性。具體步驟如下:(1)求出S中全體訓(xùn)練矢量x的質(zhì)心作為初始碼書的碼字;(2)將分裂為、并作為新的初始碼書,利用LBG算法求得新碼書,;(3)重復(fù)上面的循環(huán),將、各分裂一次,得、并作為新的初始碼書,利用LBG算法求取新碼書,如此繼續(xù)。用分裂法形成的初始碼書的性能較好,然而計(jì)算工作量比較大,同時(shí)隨著馬書中碼字的增加計(jì)算量也會(huì)迅速增加。分裂方法可以用在初始碼書的隨機(jī)選擇法中,當(dāng)選擇碼字為非典型時(shí)就可以去掉非典型胞腔,而把有最多的矢量胞腔分裂來(lái)構(gòu)成初始碼書。 空胞腔問題及處理方法空胞腔是指在最佳劃分階段,某個(gè)胞腔的訓(xùn)練矢量數(shù)目為0。解決空胞腔的問題時(shí)可首先去掉某個(gè)空胞腔中的形心,即碼字,然后將最大的胞腔(訓(xùn)練矢量數(shù)目最多的胞腔)分裂為2個(gè)胞腔。該方法由于利用兩個(gè)小胞腔代替了1個(gè)大胞腔,減小了量化失真,量化器的總失真也減小了,因此性能也得到了提升。其實(shí)在其他算法設(shè)計(jì)中同樣存在胞腔矢量少的問題,此時(shí)一般采用如下的方法進(jìn)行處理:(1)重新選擇隨機(jī)初始碼字,直到?jīng)]有非典型碼字為止;(2)把這種胞腔中少數(shù)矢量分別歸并到鄰近的各個(gè)胞腔中,然后用分裂法把其中一個(gè)最大的胞腔分裂為2個(gè)小胞腔。隨著語(yǔ)音信號(hào)處理學(xué)科的飛速發(fā)展,MATLAB及其強(qiáng)大的功能廣泛應(yīng)用于數(shù)字信號(hào)處理、數(shù)值圖像處理、仿真、自動(dòng)控制、小波分析、神經(jīng)網(wǎng)絡(luò)等等。MATLAB在數(shù)字語(yǔ)音信號(hào)處理方面的主要應(yīng)用有:(1) 通過(guò)MATLAB可以對(duì)數(shù)字化的語(yǔ)音信號(hào)進(jìn)行時(shí)頻域分析,方便的展現(xiàn)語(yǔ)音信號(hào)的時(shí)域及頻域曲線,根據(jù)語(yǔ)音特性對(duì)語(yǔ)音進(jìn)行分析。(3) 通過(guò)利用MATLAB編程對(duì)語(yǔ)音信號(hào)進(jìn)行處理。運(yùn)用MATLAB可以對(duì)信號(hào)進(jìn)行加噪、去噪、濾波、截取音頻等操作,也可以進(jìn)行語(yǔ)音編碼、語(yǔ)音識(shí)別、語(yǔ)音合成的編程??紤]到輸入數(shù)據(jù)有正值有負(fù)值,失真測(cè)度采用歐氏距離均方誤差失真測(cè)度。設(shè)置碼本維數(shù)是7,碼書大小為16,通過(guò)不斷迭代來(lái)修改碼書,此時(shí)的碼書是最終的碼書。圖41 輸入語(yǔ)音與碼書波形圖 圖42 程序運(yùn)行結(jié)果初始碼書圖43 程序運(yùn)行時(shí)間、平均失真與相對(duì)失真圖44 碼書樣本個(gè)數(shù)與循環(huán)次數(shù)圖45 程序運(yùn)行結(jié)果最終碼書 LBG算法物理概念清晰易懂、理論算法結(jié)構(gòu)嚴(yán)密,而且容易實(shí)現(xiàn),同時(shí)還可作為其他碼書設(shè)計(jì)技術(shù)中對(duì)初始碼書優(yōu)化的附加步驟。由圖43的程序運(yùn)行數(shù)據(jù)結(jié)果可看出,LBG算法在每次迭代的過(guò)程中平均失真具有單調(diào)不增特性(或者大小至少保持不變),故它能改進(jìn)任何給定的初始碼書,也就是說(shuō),其他碼書設(shè)計(jì)算法所產(chǎn)生的碼書可作為L(zhǎng)BG算法的初始碼書,其得以進(jìn)一步優(yōu)化而生成最佳碼書。從本實(shí)驗(yàn)程序的運(yùn)行結(jié)果圖43可看出,每次的迭代總能減少(或者至少保持)平均失真,所以LBG算法是一種下降算法,并且由圖42和圖45的程序運(yùn)行結(jié)果比對(duì)可看出,每次迭代通常產(chǎn)生的只是碼書的局部變化,也就是說(shuō)一旦選定LBG算法的初始碼書,通過(guò)該算法得到的是局部最優(yōu)碼書。輸入語(yǔ)音依舊采用同一語(yǔ)音 C:\Users\lenovo\,語(yǔ)音長(zhǎng)度為20秒,采樣頻率為8000Hz,采用隨機(jī)選取的方法選取初始碼書。表41 LBG算法改變數(shù)據(jù)量仿真結(jié)果采樣頻率8000Hz8000Hz8000Hz8000Hz8000Hz8000Hz語(yǔ)音長(zhǎng)度20s20s20s20s20s20s樣本個(gè)數(shù)1005001000150020002500碼字個(gè)數(shù)84080120160200碼字維數(shù)777777量化壓縮比失真門限循環(huán)次數(shù)51719355589平均失真相對(duì)失真運(yùn)算時(shí)間數(shù)據(jù)結(jié)果分析: 以上不同數(shù)據(jù)量的仿真均采用同一段語(yǔ)音輸入,保持碼字維數(shù),使訓(xùn)練序列輸入樣本大小分別為100、500、1000、1500、2000、2500,則碼字個(gè)數(shù)隨之改變?yōu)?0、1160、200,才能使量化壓縮比保持不變。仿真結(jié)論分析說(shuō)明:LBG算法中輸入的數(shù)據(jù)量越大,循環(huán)次數(shù)越多,平均失真越小,運(yùn)算量(時(shí)間)越長(zhǎng)。表42 LBG算法改變量化壓
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1