freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于vq的大學(xué)生語音識別算法研究畢業(yè)論文(文件)

2025-07-07 12:41 上一頁面

下一頁面
 

【正文】 ternational, ,.[1986],“Speakerindependent isolated word recognition using dynamic features of speech spectrum”,IEEE Transactions on Acoustic,Speech,Signal Processing, ,.[1994],“An overview of speaker recognition technology”,ESCA Workshop on Automatic Speaker Recognition,Identification and Verification,.,[1987],“A vector quantization approach to speaker recognition”,ATamp。 相比于K均值和LBG算法,采用K均值LBG算法獲得的識別精度更好。該最小的量度給出了優(yōu)異的性能,相比這兩個算法對每一個數(shù)字增加了1%到4%。獲得12維的線性特征向量預(yù)測編碼倒譜系數(shù)并作為輸入提供給矢量量化找到每個類碼字。6 實驗與結(jié)果該TI46數(shù)據(jù)庫[NIST,1991]用于實驗。步驟3:通過拆分兩倍的碼本的大小。5 建議改進(jìn)K均值LBG算法該算法的目標(biāo)是克服LBG算法和K均值算法的限制。K為正整數(shù)。首先,它需要大量的數(shù)據(jù)來確定集群。步驟3:計算所述劃分集是碼矢量使用的質(zhì)心其中,表示的訓(xùn)練數(shù)據(jù)向量中的分區(qū)集合的數(shù)量。K均值算法用于組數(shù)據(jù)和可以隨時間變化的群組。它也被稱為C均值算法或基本ISODATA聚類算法。 這里,N是所述碼本的大小。步驟4:查找平均失真 獲得分割后的組 ,設(shè)定n=n+1 計算總體平均失真 當(dāng)。令m=2m。用于初始化的兩種方法是L向量隨機從訓(xùn)練矢量集選擇的隨機初始化和由分裂所選擇的載體從一個較小的碼書中選擇的選擇初始化。每個階段的分類使用全搜索算法來找到每一個向量最近的質(zhì)心。在每次迭代過程中所有訓(xùn)練矢量被納入到判別過程中。3 Linde–Buzo–Gray(LBG)算法LBG算法也被稱為廣義的勞埃德算法(GLA)。各種各樣的變形的功能,如平方歐氏距離,馬氏距離,板倉齊藤距離和相對熵已被用于聚類。一個完整的搜索算法是應(yīng)用在VQ編碼和識別中。通常情況下,如果平均失真小,則對量化器的性能將是一件好事。板倉齊藤失真[Arindam Banerjee et al., 2005]通過使用他們的頻譜密度測量計算兩個輸入向量之間的失真。二次度量[Marcel R. Ackermann et al., 2010]是歐幾里德度量的一個重要的概括。有許多種變形的措施,包括歐氏距離,板倉失真測度和似然失真測量等等。閔可夫斯基度量可以表示為 其中和是矢量,p為度量的順序。模式匹配的一個關(guān)鍵組成部分是兩個特征向量之間相異的測量。唯一的索引i被發(fā)送到解碼器。特征向量可以表示包括線性預(yù)測編碼(LPC)系數(shù)在內(nèi)的多個不同的可能的語音編碼參數(shù),以便對倒譜系數(shù)的確定。第4節(jié)解釋經(jīng)典的K均值算法。 在本文中,一個高效的VQ碼本設(shè)計算法稱為改進(jìn)K均值LBG算法。該參數(shù)的聚類算法由于它的簡單性和可擴(kuò)展性非常受歡迎。它是一個無監(jiān)督的學(xué)習(xí)過程,被廣泛用于許多應(yīng)用中。這些技術(shù)在講話中首先分析應(yīng)用,其中大型向量空間映射到有限數(shù)量的區(qū)域空間。該方法在小詞匯量任務(wù)中有很好的表現(xiàn)。634648[5] [J].無線電工程2004:341[6] [M].北京:機械工業(yè)出版社,2007:83175[7] 楊行峻 ,[M].北京:電子工業(yè)出版社 ,1995:175189[8] 趙力. 語音信號處理[M]. 北京機械工業(yè)出版社,2003:85113[9] . Overview of the Ptolemy Project[EB/OL] ,2003:72.[10] 張正陽,吳成柯.一種快速高效的VQ初始碼書設(shè)計方法[J].西安電子科技大學(xué)學(xué)報2008:132[11] 李昌立,[M].北京:人民郵電出版社,2004:7584 [12] 劉丹蕾 陳善學(xué) 韓靜字:矢量量化綜述[M].重慶:重慶郵電大學(xué),2008:5773[13] Linde,Buro,and Gray,An Algorithm for Vector Quantizer Design,IEEE Transaction on Communication, 1980:28,8495.[14] Nida Saenghaengtham and Pizzanu Kanongchaiyos .Using LBG Quantization for Particlebased Collision Detection Algorithm .journal of Zhejiang university science A,2006,volume7,number7,pages 2532.[15] 張雪英,[M].西安:西安電子科技大學(xué)出版社,2011:120132[16] 陸哲明. 矢量量化編碼算法及應(yīng)用研究[J].哈爾濱工業(yè)大學(xué)博士論文,2001:94[17] 梁彥霞,楊家瑋,李燁 .一種設(shè)計LBG初始碼書的改進(jìn)PNN算法[J](西安電子科技大學(xué)綜合 業(yè)務(wù)網(wǎng)理論和關(guān)鍵技術(shù)國家重點實驗室),2010:83[18] 吳家安,現(xiàn)代語音編碼技術(shù)[M]. ,2007:175186[19] Macro Russo and Giuseppe Patane. Improving the LBG Algorithm. Lecture Notes in Computer Science,1999, volume1606, pages 1217[20] [J].中國圖象圖形學(xué)報,1998, 3(4): 295~298.29附錄一 外文翻譯外文原文外文原文一外文原文二45外文譯文外文原文一譯文基于改進(jìn)矢量量化K均值LBG算法的語音識別Balwant A. SonkambleD. D. Doye1. Pune Institute of Computer Technology, Dhankawadi, Pune, India 2. Proefessor, Electronics and Telemunication Department, SGGSIEamp。(3) 利用MATLAB工具對LBG算法進(jìn)行仿真,比對實驗數(shù)據(jù)結(jié)果進(jìn)行性能分析,同時通過改變數(shù)據(jù)量、碼書維數(shù)、量化壓縮比、最小失真門限等參數(shù)對LBG算法的一些參數(shù)性能進(jìn)行了分析。本文針對數(shù)字語音識別系統(tǒng)中所涉及的矢量量化技術(shù),在對矢量量化器的基本理論和結(jié)構(gòu)學(xué)習(xí)的基礎(chǔ)上,重點依靠MATLAB仿真工具,運用LBG算法實現(xiàn)了矢量量化器設(shè)計中最基本的技術(shù)——碼書設(shè)計,通過仿真結(jié)果對LBG算法的性能參數(shù)進(jìn)行分析。(4)LBG算法中在只改變失真門限的情況下,失真門限越小,循環(huán)次數(shù)增加,平均失真減小,相對失真減小,運算量(時間)增大。利用MATLAB仿真工具對輸入語音信號進(jìn)行處理,通過修改數(shù)據(jù)量大小,碼書維數(shù),量化壓縮比以及失真門限等參數(shù)變化,比對實驗數(shù)據(jù)結(jié)果分析不同數(shù)據(jù)參數(shù)的變化對矢量量化器LBG算法的影響。通過上表程序運行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù)1120呈現(xiàn)出遞趨勢(或者至少保持);、(或者至少保持不變);、(或者至少保持不變);運算量(運算時間)、。通過上表程序運行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù)232217總體呈現(xiàn)遞減趨勢;、沒有明顯的規(guī)律性;、(或者至少保持);運算量(運算時間)、總體基本上呈現(xiàn)遞減趨勢。通過上表程序運行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù)1122236呈現(xiàn)出遞增趨勢;;、但規(guī)律不明顯,偶有跳動;、。通過上表程序運行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù)113589呈現(xiàn)出遞增趨勢;;;、。在對比上面仿真得出結(jié)論的基礎(chǔ)上,通過改變語音數(shù)據(jù)量大小,碼書維數(shù),量化壓縮比以及失真門限等參數(shù),利用MATLAB仿真工具對輸入語音信號進(jìn)行處理,比對實驗結(jié)果進(jìn)行數(shù)據(jù)分析,研究不同數(shù)據(jù)參數(shù)的變化對矢量量化器LBG算法的影響。最佳矢量量化器設(shè)計的兩個必要條件是尋找最佳劃分與最佳碼書,使平均失真最小。本程序設(shè)計的具體實現(xiàn)參數(shù)為:輸入語音 C:\Users\lenovo\,長度為20秒,采樣頻率為8000Hz,采用隨機選取的方法選取大小為100的初始碼書。由于MATLAB是一種面向科學(xué)和工程計算的高級語言,允許用數(shù)學(xué)形式的語言編程,同時又具有大量的庫函數(shù),所以編程簡單、效率高、簡單易學(xué)易用。由于MATLAB具有大量數(shù)字信號處理工具箱,并能利用非線性動態(tài)系統(tǒng)分析工具Simulink等優(yōu)點,因此其已成為學(xué)習(xí)、研究數(shù)字語音信號處理的有力的仿真工具軟件。 非典型碼字問題及處理方法在隨機選擇方法中,存在一些非典型矢量,利用其形成胞腔時,胞腔中常常只有少數(shù)幾個矢量,甚至有可能只有他們自己本身一個矢量。隨機選取法產(chǎn)生的初始碼書中不存在空胞腔的問題。 乘積碼書法隨機碼書的初始化方法是用若干個低維數(shù)的碼書作為乘積碼,求得所需的高維數(shù)的碼書,即維數(shù)為、大小為的碼書乘以維數(shù)為、大小為的碼書,得到一個k維碼書,其大小為。 分裂法分裂法是由Linde,Buzo,Gray在1980年提出來的,該方法生成初始碼書時先取一個較少碼字的碼書,用LBG算法對其優(yōu)化,對優(yōu)化的結(jié)果進(jìn)行分裂,得到較大的體積、較優(yōu)化的碼書,重復(fù)優(yōu)化、分裂、再優(yōu)化過程。隨機選取法還具有形成初始碼書過程所需時間較短的特性。 LBG算法流程如圖31所示: 用給定碼書劃分成N個胞腔 開 始給定碼書大小N,初始碼書訓(xùn)練序列TS置n=0,起始平均失真 以及給定計算停止門限 計算平均失真和相對失真 ; 求出新碼書結(jié) 束 NY 圖31 LBG算法流程圖 LBG算法初始碼書的選取對于初始碼書的選取在最佳碼書的設(shè)計中有很大的影響,要求碼書在開始時對要編碼的數(shù)據(jù)來說要具有一定的代表性,直接取輸入信號矢量作為碼子就是方法之一。第一步 初始化:給定初始碼書,即給定碼書的大小N和碼字,并設(shè)置n=0,設(shè)起始平均失真 ,以及給定計算停止門限。 LBG算法實現(xiàn)流程設(shè)計LBG算法根據(jù)最佳矢量量化器設(shè)計的最佳劃分和最佳碼書這兩個必要條件提出,它的特點是算法理論嚴(yán)密,物理概念清晰和算法實現(xiàn)容易。 LBG算法的實現(xiàn)LBG算法在矢量量化中是一個基本算法,它是由標(biāo)量量化器中的Lloyd算法推廣而來,1980年由Linde ,Buzo和 Gray首次提出。對于給定的碼書可以采用最鄰近準(zhǔn)則NNR(Nearest Neighbor Rule),即對于信源空間的任一矢量X,如果它與矢量的失真小于它和其它碼子之間的失真,則X應(yīng)屬于某區(qū)域邊界: (31)為最佳劃分,即為一個胞腔。由于碼書的設(shè)計也是在這一過程中產(chǎn)生的,所以同時也是最佳碼書的設(shè)計過程。其中為加權(quán)因子,、和要進(jìn)過實驗確定。設(shè)x(n)(n=0,1,...,N1)是一幀N長信號,是其p階最佳線性預(yù)測系數(shù),并組成特征矢量,再設(shè)碼書中的某特征矢量為。為了比較用這種參數(shù)表征的矢量,如果直接使用Euclid失真,顯然意義不大。在本畢業(yè)論文設(shè)計中,各種算法中涉及到計算失真的部分均采用的是歐氏距離均方誤差。編碼的過程中,需要引入失真測度的概念。在編碼端,輸入矢量X與碼書(a)中的每一個或部分碼字進(jìn)行比較,分別計算它們的失真,檢索到失真最小碼字的序號(或碼書中此碼字所在的地址),并將的編碼信號通過信道傳輸?shù)阶g碼端;在譯碼端,先把信道傳來的編碼信號譯成序號,再根據(jù)序號 (或碼字所在地址),從碼書(b)中查出相應(yīng)的碼字。矢量量化反映在實際中的應(yīng)用就是矢量量化器,矢量量化器在實際生產(chǎn)生活中應(yīng)用非常廣泛,特別是在多媒體信息中更加突出。 碼字搜索矢量量化碼字搜索算法是當(dāng)碼書已經(jīng)設(shè)計好的時候,輸入給定矢量,在碼書中搜索與輸入碼字間失真最小的碼字。矢量量化系統(tǒng)一般情況下可以分解為兩個集合的映射,即 (23) 式中,是編碼器,它是將輸入矢量映射為信道符號中的一個元;是譯碼器,它是將信道符號映射為碼書中的一個碼字,即 (24) (25) 碼書設(shè)計、碼字搜索和碼字索引分配是矢量量化的三個關(guān)鍵技術(shù),其中碼書設(shè)計和碼字搜索尤為重要。通常把所有M個量化矢量(重構(gòu)矢量或恢復(fù)矢量)構(gòu)成的集合稱之為碼書或碼本。如圖22(a)所示,矢量量化就是將平面分成M個如的小區(qū)域,從每個小區(qū)域中找出代表向量,這些代表向量的集合就是有M個區(qū)間的二維矢量量化器。矢量維數(shù)越大,矢量量化的性能就越優(yōu)越。因為此時的信號量是一維的標(biāo)量,所以稱之為標(biāo)量量化。 量化的實質(zhì)是把一個模擬信號值的連續(xù)范圍分為若干個相鄰并且具有唯一量值的區(qū)間,凡落在某區(qū)間的抽樣信號樣值都指定為該區(qū)間量值的過程。碼書設(shè)計可以視
點擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1