freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于vq的大學(xué)生語(yǔ)音識(shí)別算法研究畢業(yè)論文-預(yù)覽頁(yè)

 

【正文】 圖23 矢量量化器原理框圖 矢量量化器的設(shè)計(jì)關(guān)鍵是編碼器的設(shè)計(jì),而譯碼器僅是一個(gè)簡(jiǎn)單的查表過(guò)程。常用的失真測(cè)度主要有均方誤差失真測(cè)度(即歐氏距離)、加權(quán)的均方誤差失真測(cè)度、板倉(cāng)齋藤似然比距離、似然比失真測(cè)度等,在語(yǔ)音信號(hào)處理中常被應(yīng)用于語(yǔ)音波形的矢量量化、線性預(yù)測(cè)參數(shù)矢量量化和孤立詞識(shí)別的矢量量化中。在分析語(yǔ)音信號(hào)時(shí),它按照預(yù)測(cè)誤差能量(方均值)最小準(zhǔn)則,得到模型的預(yù)測(cè)系數(shù)。日本學(xué)者板倉(cāng)等人提出了這種失真測(cè)度。為此,可以采用如下定義的失真測(cè)度: (28)式中,、輸入信號(hào)矢量和碼書(shū)重構(gòu)矢量的歸一化能量; g(x)專用函數(shù),定義為 g(x)作用:當(dāng)兩矢量的能量接近時(shí),忽略能量差異引起的影響;當(dāng)兩矢量的能量相差較大時(shí),進(jìn)行線性加權(quán);當(dāng)能量差超過(guò)門(mén)限時(shí),則為某固定值。所謂矢量量化器的最佳設(shè)計(jì)就是從大量的輸入信號(hào)樣本中訓(xùn)練出一個(gè)較好的碼本,基于一定的條件下使失真最小。 最佳劃分類似于標(biāo)量量化中量化區(qū)間的劃分過(guò)程,對(duì)給定的碼書(shū),找出所有碼書(shū)矢量的最佳區(qū)域邊界,尋找最佳劃分以使其平均失真最小。形心就是該區(qū)域空間的幾何中心,這些形心就組成了最佳碼書(shū)中的碼字。LBG算法因其嚴(yán)密的理論、簡(jiǎn)便的應(yīng)用和良好的設(shè)計(jì)效果,從而得到了廣泛的應(yīng)用,常被作為許多新型碼書(shū)設(shè)計(jì)算法改進(jìn)的基礎(chǔ)算法。利用訓(xùn)練序列建立碼書(shū)的LBG算法的步驟如下。 第四步 利用公式(32)計(jì)算這時(shí)劃分的各個(gè)胞腔的形心,由這N個(gè)新形構(gòu)成新的碼書(shū),并置n=n+1,返回第二步再進(jìn)行計(jì)算,直到得到所要求的碼書(shū)為止。其優(yōu)點(diǎn)是無(wú)需初始化計(jì)算,大大節(jié)約了計(jì)算時(shí)間;另外,由于初始碼書(shū)是從訓(xùn)練序列中選出來(lái)得,所以不存在空胞腔的問(wèn)題。本設(shè)計(jì)中語(yǔ)音信息選取的時(shí)間相對(duì)較短,是一個(gè)相對(duì)平穩(wěn)的序列,所以使用隨機(jī)選取法選取初始碼書(shū)具有可行性。用分裂法形成的初始碼書(shū)的性能較好,然而計(jì)算工作量比較大,同時(shí)隨著馬書(shū)中碼字的增加計(jì)算量也會(huì)迅速增加。 空胞腔問(wèn)題及處理方法空胞腔是指在最佳劃分階段,某個(gè)胞腔的訓(xùn)練矢量數(shù)目為0。該方法由于利用兩個(gè)小胞腔代替了1個(gè)大胞腔,減小了量化失真,量化器的總失真也減小了,因此性能也得到了提升。隨著語(yǔ)音信號(hào)處理學(xué)科的飛速發(fā)展,MATLAB及其強(qiáng)大的功能廣泛應(yīng)用于數(shù)字信號(hào)處理、數(shù)值圖像處理、仿真、自動(dòng)控制、小波分析、神經(jīng)網(wǎng)絡(luò)等等。(3) 通過(guò)利用MATLAB編程對(duì)語(yǔ)音信號(hào)進(jìn)行處理。考慮到輸入數(shù)據(jù)有正值有負(fù)值,失真測(cè)度采用歐氏距離均方誤差失真測(cè)度。圖41 輸入語(yǔ)音與碼書(shū)波形圖 圖42 程序運(yùn)行結(jié)果初始碼書(shū)圖43 程序運(yùn)行時(shí)間、平均失真與相對(duì)失真圖44 碼書(shū)樣本個(gè)數(shù)與循環(huán)次數(shù)圖45 程序運(yùn)行結(jié)果最終碼書(shū) LBG算法物理概念清晰易懂、理論算法結(jié)構(gòu)嚴(yán)密,而且容易實(shí)現(xiàn),同時(shí)還可作為其他碼書(shū)設(shè)計(jì)技術(shù)中對(duì)初始碼書(shū)優(yōu)化的附加步驟。從本實(shí)驗(yàn)程序的運(yùn)行結(jié)果圖43可看出,每次的迭代總能減少(或者至少保持)平均失真,所以LBG算法是一種下降算法,并且由圖42和圖45的程序運(yùn)行結(jié)果比對(duì)可看出,每次迭代通常產(chǎn)生的只是碼書(shū)的局部變化,也就是說(shuō)一旦選定LBG算法的初始碼書(shū),通過(guò)該算法得到的是局部最優(yōu)碼書(shū)。表41 LBG算法改變數(shù)據(jù)量仿真結(jié)果采樣頻率8000Hz8000Hz8000Hz8000Hz8000Hz8000Hz語(yǔ)音長(zhǎng)度20s20s20s20s20s20s樣本個(gè)數(shù)1005001000150020002500碼字個(gè)數(shù)84080120160200碼字維數(shù)777777量化壓縮比失真門(mén)限循環(huán)次數(shù)51719355589平均失真相對(duì)失真運(yùn)算時(shí)間數(shù)據(jù)結(jié)果分析: 以上不同數(shù)據(jù)量的仿真均采用同一段語(yǔ)音輸入,保持碼字維數(shù),使訓(xùn)練序列輸入樣本大小分別為100、500、1000、1500、2000、2500,則碼字個(gè)數(shù)隨之改變?yōu)?0、1160、200,才能使量化壓縮比保持不變。表42 LBG算法改變量化壓縮比仿真結(jié)果采樣頻率8000Hz8000Hz8000Hz8000Hz8000Hz8000Hz語(yǔ)音長(zhǎng)度20s20s20s20s20s20s樣本個(gè)數(shù)100010001000100010001000碼字個(gè)數(shù)510152050100碼字維數(shù)777777量化壓縮比200100502010失真門(mén)限循環(huán)次數(shù)91718242736平均失真相對(duì)失真運(yùn)算時(shí)間數(shù)據(jù)結(jié)果分析:以上不同量化壓縮比的仿真均采用同一段語(yǔ)音輸入,保持訓(xùn)練序列輸入樣本大小為1000、碼字維數(shù),使量化壓縮比分別為200、100、50、10,則碼書(shū)中碼字個(gè)數(shù)隨之改變?yōu)?250、100。表43 LBG算法改變碼書(shū)維數(shù)的仿真結(jié)果采樣頻率8000Hz8000Hz8000Hz8000Hz8000Hz8000Hz語(yǔ)音長(zhǎng)度20s20s20s20s20s20s樣本個(gè)數(shù)100010001000100010001000碼字個(gè)數(shù)161616161616碼字維數(shù)24681012量化壓縮比失真門(mén)限循環(huán)次數(shù)72132282217平均失真相對(duì)失真運(yùn)算時(shí)間數(shù)據(jù)結(jié)果分析:以上不同碼書(shū)維數(shù)的仿真均采用同一段語(yǔ)音輸入,保持訓(xùn)練序列輸入樣本大小為1000、使碼書(shū)維數(shù)分別為12。表44 LBG算法改變失真門(mén)限的仿真結(jié)果采樣頻率8000Hz8000Hz8000Hz8000Hz8000Hz8000Hz語(yǔ)音長(zhǎng)度20s20s20s20s20s20s樣本個(gè)數(shù)100010001000100010001000碼字大小161616161616碼字維數(shù)777777量化壓縮比失真門(mén)限循環(huán)次數(shù)71416202020平均失真相對(duì)失真運(yùn)算時(shí)間數(shù)據(jù)結(jié)果分析:以上不同失真門(mén)限的仿真均采用同一段語(yǔ)音輸入,保持訓(xùn)練序列輸入樣本大小為1000、碼字維數(shù),、。通過(guò)MATLAB系統(tǒng)仿真數(shù)據(jù)結(jié)果我們可看出,LBG算法是一種下降算法,在每次迭代的過(guò)程中平均失真具有單調(diào)不增特性(或者大小至少保持不變),故可改進(jìn)任何訓(xùn)練序列的初始碼書(shū)生成最佳碼書(shū);在每次迭代的最佳劃分階段,需要從碼書(shū)中搜索與訓(xùn)練矢量最相近的碼字,因而需要大量的計(jì)算和存儲(chǔ)空間;每次迭代通常產(chǎn)生的只是碼書(shū)的局部變化,也就是說(shuō)一旦選定LBG算法的初始碼書(shū),通過(guò)該算法得到的是局部最優(yōu)碼書(shū)。(3)LBG算法中在只改變碼書(shū)維數(shù)的情況下,碼書(shū)維數(shù)越大,循環(huán)次數(shù)總體呈現(xiàn)遞減趨勢(shì),相對(duì)失真減小,運(yùn)算量(時(shí)間)隨著循環(huán)次數(shù)的變化而變化,總體基本上呈現(xiàn)遞減趨勢(shì)。矢量量化是具有良好性能的模型訓(xùn)練和模式匹配的技術(shù)之一。(2) 分析了最佳矢量量化器設(shè)計(jì)的兩個(gè)條件最佳劃分和最佳碼書(shū),以及在碼書(shū)選定過(guò)程中所存在的空胞腔和隨機(jī)選擇法中的非典型矢量及其處理問(wèn)題,同時(shí)設(shè)計(jì)了矢量量化器的LBG算法的實(shí)現(xiàn),及流程圖的標(biāo)注。47(2)。在本文中,提出使用的算法稱為改進(jìn)的K均值LBG算法,取得了良好的碼本。矢量量化(VQ)是語(yǔ)音編碼,圖像編碼,語(yǔ)音識(shí)別,語(yǔ)音合成和說(shuō)話人識(shí)別中使用的最基本的和最成功的技術(shù)[,1986]。在各種學(xué)科中VQ技術(shù)也被稱為數(shù)據(jù)聚類方法。在硬聚類中每一個(gè)數(shù)據(jù)點(diǎn)獲得的數(shù)據(jù)屬于不相交的分割,而每一個(gè)數(shù)據(jù)點(diǎn)具有一定的概率是屬于具有各分區(qū)的軟聚類的分區(qū)中的一個(gè)。矢量量化技術(shù)的性能取決于代表矢量的碼本的良好的存在。第3節(jié)闡述LBG算法。2 矢量量化數(shù)據(jù)壓縮的主要目標(biāo)是減少比特率的傳輸或存儲(chǔ)數(shù)據(jù),同時(shí)保持必要的數(shù)據(jù)的保真度。該子集C被稱為碼本,它的元素被稱為碼字、碼向量、向量復(fù)制、原型或設(shè)計(jì)樣品。無(wú)論是經(jīng)典的K均值算法還是LBG算法都屬于類近鄰量化。在語(yǔ)音處理中使用的指標(biāo)是閔可夫斯基度量[J. S. Pan et ]。失真度量只是一種滿足相異測(cè)量的正定屬性。為了避免計(jì)算分類,平方歐氏度量采用歐氏度量的模式匹配來(lái)代替。在語(yǔ)音識(shí)別中,加權(quán)倒譜失真,可用于平衡不同的說(shuō)話者識(shí)別器的性能。一個(gè)量化器的性能總是限定輸入矢量和最后再現(xiàn)的載體,其中E表示期望算子之間的平均失真。它限制了編碼實(shí)時(shí)傳輸?shù)谋U娑?。給定一個(gè)代碼字和測(cè)試向量X的k維空間,平方歐幾里德度量的畸變可以表示為如下: 其中和有三種方式產(chǎn)生并設(shè)計(jì)一個(gè)好的碼本,即隨機(jī)法,成對(duì)最近鄰聚類和分割方法。這種算法要么是基于一個(gè)已知的概率模型或是一個(gè)長(zhǎng)訓(xùn)練序列的數(shù)據(jù)。在LBG算法中,從所有訓(xùn)練數(shù)據(jù)的應(yīng)用分裂過(guò)程中產(chǎn)生初始質(zhì)心。因此,GLA算法是一個(gè)分裂的聚類方法。初始化是碼本估算的重要一步。這里δ是一個(gè)小固定攝動(dòng)標(biāo)量。如果是近鄰于,將放入分區(qū)集合。否則,請(qǐng)轉(zhuǎn)到步驟2。它是一種眾所周知的迭代過(guò)程用于解決聚類問(wèn)題。在訓(xùn)練過(guò)程結(jié)束的最后一個(gè)載體結(jié)合時(shí)。步驟2:對(duì)于每個(gè)訓(xùn)練數(shù)據(jù)向量,如果,分配向分區(qū)集合。也有K均值算法的各種限制。該算法進(jìn)行分類或基于屬性/功能集成到組的K個(gè)組對(duì)象。在實(shí)踐中,數(shù)迭代通常比點(diǎn)的數(shù)量要少得多。步驟2:計(jì)算質(zhì)心的編號(hào)。步驟6:更新該重心,直到有一個(gè)在聚類質(zhì)心沒(méi)有改變,終止程序,否則轉(zhuǎn)到步驟1??倲?shù)據(jù)庫(kù)大小是4160句話的1600樣本被用于訓(xùn)練和剩余樣本用于測(cè)試10個(gè)英文數(shù)字1到9號(hào)的測(cè)試和和0被采樣頻率為8000 Hz。相比K均值算法和LBG算法,該提出修改的K均值LBG算法所給出最小的失真度量,提高了系統(tǒng)的性能。它被用來(lái)有效地提高語(yǔ)音識(shí)別系統(tǒng)的性能。T Technical Journal,.Wiploa J. G. , Rabiner L. R. [1985], “A Modified KMeans Clustering Algorithm for Use in Isolated Word Recognition”, IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. 33 , pp. 587594.Arindam Banerjee, Srujana Merugu, Inderjit S. Dhillon, Joydeep Ghosh [2005], “Clustering with Bregman Divergences”, Journal of Machine Learning Research, Vol. 6, pp. 1705–1749.J. S. Pan, F. R. McInnes and M. A. Jack [1996], “Bound for Minkowski metric or quadratic metric applied to codeword search”, IEEProceedings on Vision Image and Signal Processing, Vol. 143, No. 1, pp. 67–71.Marcel R. Ackermann, Johannes Blomer, Christian Sohler [2010], “Clustering for Metric and Nonmetric Distance Measures”, ACM Transactions on Algorithms, Vol. 6, No. 4, Article 59, pp. 126.ShihMing Pan, KuoSheng Cheng [2007], An evolutionbased tabu search approach to codebook design, Pattern Recognition, Vol. 40, No. 2, pp. 476491.ChinChen Chang, YuChiang Li, JunBin Yeh [2006], Fast codebook search algorithms based on treestructured vector quantization, Pattern Recognition Letters, Vol. 27, No. 10, pp. 10771086.Buzo, A. H. Gray, R. M. Gray, J. D. Markel [1980], “Speech coding based upon vector quantization”, IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. 28, No. 5, pp. 562–574.Y. Linde, A.
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1