freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于vq的大學(xué)生語音識別算法研究畢業(yè)論文(參考版)

2025-06-22 12:41本頁面
  

【正文】 參考文獻,[1993],“Fundamentals of Speech Recognition”, PrenticeHall, Englewood Cliffs, .TzuChuen Lu,ChingYun Chang [2010],“A Survey of VQ Codebook Generation”, Journal of Information Hiding and Multimedia Signal Processing, Ubiquitous International, ,.[1986],“Speakerindependent isolated word recognition using dynamic features of speech spectrum”,IEEE Transactions on Acoustic,Speech,Signal Processing, ,.[1994],“An overview of speaker recognition technology”,ESCA Workshop on Automatic Speaker Recognition,Identification and Verification,.,[1987],“A vector quantization approach to speaker recognition”,ATamp。 相比于K均值和LBG算法,采用K均值LBG算法獲得的識別精度更好。在本文中,提出了所謂的新的矢量量化算法K均值LBG算法。該最小的量度給出了優(yōu)異的性能,相比這兩個算法對每一個數(shù)字增加了1%到4%。相比K均值算法和LBG算法,通過該算法得到的失真度量是最小的。獲得12維的線性特征向量預(yù)測編碼倒譜系數(shù)并作為輸入提供給矢量量化找到每個類碼字。每個人復(fù)制的數(shù)字是26話語。6 實驗與結(jié)果該TI46數(shù)據(jù)庫[NIST,1991]用于實驗。步驟5:查找平均失真。步驟3:通過拆分兩倍的碼本的大小。該K均值LBG算法描述為如下:步驟1:隨機選擇N個訓(xùn)練數(shù)據(jù)向量作為初始碼向量。5 建議改進K均值LBG算法該算法的目標(biāo)是克服LBG算法和K均值算法的限制。K均值聚類的主要目的是對數(shù)據(jù)進行分類。K為正整數(shù)。第三,如果一個數(shù)據(jù)的個數(shù)小到最終很難找到實際的簇群,按照假設(shè),每個屬性具有相同的重量同時很難知道該屬性會提供更多的分組過程。首先,它需要大量的數(shù)據(jù)來確定集群。否則,請轉(zhuǎn)到步驟2。步驟3:計算所述劃分集是碼矢量使用的質(zhì)心其中,表示的訓(xùn)練數(shù)據(jù)向量中的分區(qū)集合的數(shù)量。K均值算法可以被描述為如下:步驟1:從T訓(xùn)練數(shù)據(jù)向量中隨機選擇N個訓(xùn)練數(shù)據(jù)向量作為初始碼向量。K均值算法用于組數(shù)據(jù)和可以隨時間變化的群組。K均值算法中,初始質(zhì)心從訓(xùn)練矢量隨機選擇的訓(xùn)練向量一次一個被添加到該訓(xùn)練程序。它也被稱為C均值算法或基本ISODATA聚類算法。 4 經(jīng)典K均值算法K均值算法是MacQueen在1967年提出的。 這里,N是所述碼本的大小。 步驟7:迭代2 如果m = N,則取碼本作為最后的碼本。步驟4:查找平均失真 獲得分割后的組 ,設(shè)定n=n+1 計算總體平均失真 當(dāng)。步驟3:最近鄰搜索 找到最近相鄰的每個數(shù)據(jù)向量。令m=2m。計算質(zhì)心 其中T是數(shù)據(jù)向量的總數(shù)步驟2:將碼本由分裂的雙重大小 將每個質(zhì)心變成兩個親密的載體和。用于初始化的兩種方法是L向量隨機從訓(xùn)練矢量集選擇的隨機初始化和由分裂所選擇的載體從一個較小的碼書中選擇的選擇初始化。 在語音處理中,矢量量化是用于比特流減少編碼的實現(xiàn)或基于HMM的任務(wù)。每個階段的分類使用全搜索算法來找到每一個向量最近的質(zhì)心。GLA算法開始于一個集群,然后分離該集群到兩個、四個集群,依此類推,直至所生成的N個集群,其中N是群或碼本大小的所需數(shù)量。在每次迭代過程中所有訓(xùn)練矢量被納入到判別過程中。這種矢量量化算法通過尋找分配集和最小失真分割的質(zhì)心而得出一個好的碼本。3 Linde–Buzo–Gray(LBG)算法LBG算法也被稱為廣義的勞埃德算法(GLA)。LBG算法是一種有效的量化聚類算法。各種各樣的變形的功能,如平方歐氏距離,馬氏距離,板倉齊藤距離和相對熵已被用于聚類。關(guān)于碼字搜索問題,分配一個碼字的測試向量表示所有碼字之間的碼字和所述測試向量之間的最小失真。一個完整的搜索算法是應(yīng)用在VQ編碼和識別中。矢量維數(shù)成倍增加,相應(yīng)的搜索復(fù)雜性隨之增加,這是VQ碼字搜索的一個主要限制。通常情況下,如果平均失真小,則對量化器的性能將是一件好事。通常情況下,歐幾里得失真度量被使用。板倉齊藤失真[Arindam Banerjee et al., 2005]通過使用他們的頻譜密度測量計算兩個輸入向量之間的失真。加權(quán)倒譜失真的關(guān)鍵特征是,它均衡的對倒譜系數(shù)的每個維度的重要性。二次度量[Marcel R. Ackermann et al., 2010]是歐幾里德度量的一個重要的概括。在某些應(yīng)用中除法的運算不是必需的。有許多種變形的措施,包括歐氏距離,板倉失真測度和似然失真測量等等。這些指標(biāo)在失真測量功能計算中都是十分必要的。閔可夫斯基度量可以表示為 其中和是矢量,p為度量的順序。每個指標(biāo)有三個主要特點,如計算復(fù)雜性,分析性和可追蹤性功能評估的可靠性。模式匹配的一個關(guān)鍵組成部分是兩個特征向量之間相異的測量。常用的矢量量化是基于稱為最近鄰Voronoi圖或最近鄰矢量量化。唯一的索引i被發(fā)送到解碼器。VQ編碼器編碼一個給定的k維數(shù)據(jù)向量與一個小得多的子集。特征向量可以表示包括線性預(yù)測編碼(LPC)系數(shù)在內(nèi)的多個不同的可能的語音編碼參數(shù),以便對倒譜系數(shù)的確定。實驗工作和結(jié)果將在第6節(jié)和文末提出的結(jié)論性意見進行討論。第4節(jié)解釋經(jīng)典的K均值算法。第2節(jié)描述了矢量量化的理論細節(jié)。 在本文中,一個高效的VQ碼本設(shè)計算法稱為改進K均值LBG算法。經(jīng)典的K均值算法是基于歐氏距離和基于板倉齋藤距離的LindeBuzoGray(LBG)算法。該參數(shù)的聚類算法由于它的簡單性和可擴展性非常受歡迎。這些都是基于一個稱為布雷格曼分歧[Arindam Banerjee et al., 2005]失真函數(shù)質(zhì)心為基礎(chǔ)的參數(shù)化聚類技術(shù)的大類。它是一個無監(jiān)督的學(xué)習(xí)過程,被廣泛用于許多應(yīng)用中。在VQ中,信號樣本或參數(shù)的有序集合可以有效地匹配輸入矢量在預(yù)定的類似碼本的模式或碼矢(碼字)的編碼[TzuChuen Lu et al., 2010]。這些技術(shù)在講話中首先分析應(yīng)用,其中大型向量空間映射到有限數(shù)量的區(qū)域空間。很多人都是通過手機以及其他的通訊工具用一個真實的方式進行交換信息[. Rabiner et al.,1993]。該方法在小詞匯量任務(wù)中有很好的表現(xiàn)。原始圖案和重建模式之間的失真度量應(yīng)該是最小的。634648[5] [J].無線電工程2004:341[6] [M].北京:機械工業(yè)出版社,2007:83175[7] 楊行峻 ,[M].北京:電子工業(yè)出版社 ,1995:175189[8] 趙力. 語音信號處理[M]. 北京機械工業(yè)出版社,2003:85113[9] . Overview of the Ptolemy Project[EB/OL] ,2003:72.[10] 張正陽,吳成柯.一種快速高效的VQ初始碼書設(shè)計方法[J].西安電子科技大學(xué)學(xué)報2008:132[11] 李昌立,[M].北京:人民郵電出版社,2004:7584 [12] 劉丹蕾 陳善學(xué) 韓靜字:矢量量化綜述[M].重慶:重慶郵電大學(xué),2008:5773[13] Linde,Buro,and Gray,An Algorithm for Vector Quantizer Design,IEEE Transaction on Communication, 1980:28,8495.[14] Nida Saenghaengtham and Pizzanu Kanongchaiyos .Using LBG Quantization for Particlebased Collision Detection Algorithm .journal of Zhejiang university science A,2006,volume7,number7,pages 2532.[15] 張雪英,[M].西安:西安電子科技大學(xué)出版社,2011:120132[16] 陸哲明. 矢量量化編碼算法及應(yīng)用研究[J].哈爾濱工業(yè)大學(xué)博士論文,2001:94[17] 梁彥霞,楊家瑋,李燁 .一種設(shè)計LBG初始碼書的改進PNN算法[J](西安電子科技大學(xué)綜合 業(yè)務(wù)網(wǎng)理論和關(guān)鍵技術(shù)國家重點實驗室),2010:83[18] 吳家安,現(xiàn)代語音編碼技術(shù)[M]. ,2007:175186[19] Macro Russo and Giuseppe Patane. Improving the LBG Algorithm. Lecture Notes in Computer Science,1999, volume1606, pages 1217[20] [J].中國圖象圖形學(xué)報,1998, 3(4): 295~298.29附錄一 外文翻譯外文原文外文原文一外文原文二45外文譯文外文原文一譯文基于改進矢量量化K均值LBG算法的語音識別Balwant A. SonkambleD. D. Doye1. Pune Institute of Computer Technology, Dhankawadi, Pune, India 2. Proefessor, Electronics and Telemunication Department, SGGSIEamp。 參考文獻[1] [M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2000:125143[2] [M].上海:上海交通大學(xué)出版社,1991:8393[3] Methods of Pitch ,1968,16(1):262266[4] , for Automatic Formant Analysis of Voiced .,1997。(3) 利用MATLAB工具對LBG算法進行仿真,比對實驗數(shù)據(jù)結(jié)果進行性能分析,同時通過改變數(shù)據(jù)量、碼書維數(shù)、量化壓縮比、最小失真門限等參數(shù)對LBG算法的一些參數(shù)性能進行了分析。本文所做的主要工作有:(1) 介紹了在研究語音識別系統(tǒng)的過程中所涉及到的基本概念及原理,以及語音識別系統(tǒng)的發(fā)展歷程和分類,研究語音識別系統(tǒng)的目的和意義。本文針對數(shù)字語音識別系統(tǒng)中所涉及的矢量量化技術(shù),在對矢量量化器的基本理論和結(jié)構(gòu)學(xué)習(xí)的基礎(chǔ)上,重點依靠MATLAB仿真工具,運用LBG算法實現(xiàn)了矢量量化器設(shè)計中最基本的技術(shù)——碼書設(shè)計,通過仿真結(jié)果對LBG算法的性能參數(shù)進行分析。語音識別技術(shù)主要包括語音信號處理、特征提取、模型訓(xùn)練和模式匹配技術(shù)。(4)LBG算法中在只改變失真門限的情況下,失真門限越小,循環(huán)次數(shù)增加,平均失真減小,相對失真減小,運算量(時間)增大。(2)LBG算法中在只改變量化壓縮比的情況下,隨著量化壓縮比越小,碼字個數(shù)逐漸增加,循環(huán)次數(shù)越多,平均失真越小,運算量(時間)越長。利用MATLAB仿真工具對輸入語音信號進行處理,通過修改數(shù)據(jù)量大小,碼書維數(shù),量化壓縮比以及失真門限等參數(shù)變化,比對實驗數(shù)據(jù)結(jié)果分析不同數(shù)據(jù)參數(shù)的變化對矢量量化器LBG算法的影響。最佳矢量量化器的設(shè)計就是尋找最佳劃分和最佳碼書,使平均失真最小的過程,LBG算法是矢量量化器設(shè)計的一個基本算法。通過上表程序運行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù)1120呈現(xiàn)出遞趨勢(或者至少保持);、(或者至少保持不變);、(或者至少保持不變);運算量(運算時間)、。 改變失真門限保持數(shù)據(jù)量大小、量化壓縮比和碼書維數(shù)不變,改變失真門限。通過上表程序運行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù)232217總體呈現(xiàn)遞減趨勢;、沒有明顯的規(guī)律性;、(或者至少保持);運算量(運算時間)、總體基本上呈現(xiàn)遞減趨勢。 改變碼書維數(shù)保持數(shù)據(jù)量大小、量化壓縮比和失真門限不變,改變碼書維數(shù)。通過上表程序運行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù)1122236呈現(xiàn)出遞增趨勢;;、但規(guī)律不明顯,偶有跳動;、。 改變量化壓縮比保持數(shù)據(jù)量大小不變,改變量化壓縮比,碼書中碼字個數(shù)隨之變化,保持失真門限和碼字維數(shù)不變。通過上表程序運行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù)113589呈現(xiàn)出遞增趨勢;;;、。 改變數(shù)據(jù)量改變數(shù)據(jù)量大小,保持量化壓縮比不變,碼書中碼字個數(shù)隨之變化,保持失真門限和碼字維數(shù)不變。在對比上面仿真得出結(jié)論的基礎(chǔ)上,通過改變語音數(shù)據(jù)量大小,碼書維數(shù),量化壓縮比以及失真門限等參數(shù),利用MATLAB仿真工具對輸入語音信號進行處理,比對實驗結(jié)果進行數(shù)據(jù)分析,研究不同數(shù)據(jù)參數(shù)的變化對矢量量化器LBG算法的影響。通過第二章對LBG算法原理特性的推導(dǎo)我們知道,LBG算法采用不斷的迭代方式來選擇最佳碼書,在每次迭代的最佳劃分階段,由于需要從碼書中搜索與訓(xùn)練矢量最近的碼字,所以需要大量的計算和存儲空間。最佳矢量量化器設(shè)計的兩個必要條件是尋找最佳劃分與最佳碼書,使平均失真最小。仿真最終達到100個數(shù)據(jù)量化為16個數(shù)據(jù)的目的。本程序設(shè)計的具體實現(xiàn)參數(shù)為:輸入語音 C:\Users\lenovo\,長度為20秒,采樣頻率為8000Hz,采用隨機選取的方法選取大小為100的初始碼書。 LB
點擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1