freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于vq的大學(xué)生語音識別算法研究畢業(yè)論文-資料下載頁

2025-08-16 14:06本頁面

【導(dǎo)讀】終目的是使計算機(jī)能夠準(zhǔn)確的識別任何人、任何內(nèi)容的講話。語音識別技術(shù)是一項集聲學(xué)、語音識別系統(tǒng)從本質(zhì)上說是一種模式識別系統(tǒng),其基本結(jié)構(gòu)與常規(guī)模式識別系統(tǒng)一樣,包含有特征提取、模式匹配、參考模式庫等基本單元。矢量量化技術(shù)在語音識別中占有很重。要的地位,其包括碼書設(shè)計、碼字搜索和碼字索引分配,前兩者尤為重要。比對實驗數(shù)據(jù)結(jié)果可看出LBG算法是一種下降算法,在仿真過程中,每次迭代的平均失

  

【正文】 取法實現(xiàn) LBG 算法碼書的生成,初始碼書從訓(xùn)練序列中每隔 5 個樣本選取一組??紤]到輸入 數(shù)據(jù)有正值有負(fù)值,失真測度采用歐氏距離 均方誤差失真測度。 本程序設(shè)計的具體實現(xiàn)參數(shù)為:輸入語音 C:\Users\lenovo\,長度為 20 秒,采樣頻率為 8000Hz,采用隨機(jī)選取的方法選取大小為 100 的初始碼書。設(shè)置碼本維數(shù)是 7,碼書大小為 16,通過不斷迭代來修改碼書,直到小于失真門限 時停止迭代,此時的碼書是最終的碼書。仿真最終達(dá)到 100 個數(shù)據(jù)量化為 16個數(shù)據(jù)的目的。 蘭州理工大學(xué)畢業(yè)論文 18 0 2 4 6 8 10 12 14 16 18 201 0 . 500 . 51時間幅度輸入語音0 0 . 0 0 2 0 . 0 0 4 0 . 0 0 6 0 . 0 0 8 0 . 0 1 0 . 0 1 2 0 . 0 1 421012x 1 03時間幅度碼書 圖 41 輸入語音與碼書波形圖 圖 42 程序運(yùn)行結(jié)果 初始碼書 蘭州理工大學(xué)畢業(yè)論文 19 圖 43 程序運(yùn)行時間、平均失真與相對失真 圖 44 碼書樣本個數(shù)與循環(huán)次數(shù) 蘭州理工大學(xué)畢業(yè)論文 20 圖 45 程序運(yùn)行結(jié)果 最終碼書 LBG 算法物理概念清晰易懂、理論算法結(jié)構(gòu)嚴(yán)密,而且容易實現(xiàn),同時還可作為其他碼書設(shè)計技術(shù)中對初始碼書優(yōu)化的附加步驟。最佳矢量量化器設(shè)計的兩個必要條件是尋找最佳劃分與最佳碼書,使平均失真最小。由圖 43 的程序運(yùn)行數(shù)據(jù)結(jié)果可看出, LBG 算法在每次迭代的過程中平均失真具有單調(diào)不增特性(或者大小至少保持不變),故它能改進(jìn)任何給定的初始碼書,也就是說,其他碼書設(shè)計算法所產(chǎn)生的碼書可作為 LBG 算法的初始碼書,其得以進(jìn)一步優(yōu)化而生成最佳碼書。 通過第二章對 LBG 算法原理特性的推導(dǎo)我們知道, LBG 算法采用不斷的迭代方式來選擇最佳碼書,在每次迭代的最佳劃分階段,由于需要從碼書中搜索與訓(xùn)練矢量最近的碼字,所以需要大量的計算和存儲空間。從本實驗程序的運(yùn)行結(jié)果圖 43 可看出,每次的迭代總能減少(或者至少保持)平均失真,所以 LBG 算法是一種下降算法,并且由圖 42 和圖 45 的程序運(yùn)行結(jié)果比對可看出,每次迭代通常產(chǎn)生的只是碼書的局部變化,也就是說一旦選定 LBG算法的初始碼書,通過該算法得到的是局部最優(yōu)碼書。 修改參數(shù)后矢量量化器的 LBG 算法仿真及結(jié)果分析 在對比上面仿真得出結(jié)論的基礎(chǔ)上,通過改變語音數(shù)據(jù)量大小,碼書維數(shù),量化壓縮比蘭州理工大學(xué)畢業(yè)論文 21 以及失真門限等參數(shù),利用 MATLAB 仿真工具對輸入語音信號進(jìn)行處理,比對實驗結(jié)果進(jìn)行數(shù)據(jù)分析,研究不同數(shù)據(jù)參數(shù)的變化對矢量量化器 LBG 算法的影響。 輸入語音依舊采用同一語音 C:\Users\lenovo\,語音長度為 20 秒,采樣頻率為 8000Hz,采用隨機(jī)選取的方法選取初始碼書。 改變數(shù)據(jù)量 改變數(shù)據(jù)量大小,保持量化壓縮比不變,碼書中碼字 個數(shù)隨之變化,保持失真門限和碼字維數(shù)不變。 表 41 LBG 算法改變數(shù)據(jù)量仿真結(jié)果 數(shù)據(jù)結(jié)果分析: 以上不同數(shù)據(jù)量的仿真均采用同一段語音輸入,保持碼字維數(shù) 量化壓縮比 、失真門限 不 變,使訓(xùn)練序列輸入樣本大小分別為 100、 500、 1000、 1500、 20 2500,則碼字個數(shù)隨之改變?yōu)? 80、 1 160、 200,才能使量化壓縮比保持不變。通過上表程序運(yùn)行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù) 1 1 3 5 89 呈現(xiàn)出遞增趨勢;平均失真 、 、 、 總體呈現(xiàn)遞減趨勢;相對失真 、 、 、 、 沒有明顯規(guī)律可尋;運(yùn)算時間 、 、 、 、 。 采樣頻率 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 語音長度 20s 20s 20s 20s 20s 20s 樣本個數(shù) 100 500 1000 1500 2020 2500 碼字個數(shù) 8 40 80 120 160 200 碼字維數(shù) 7 7 7 7 7 7 量化壓縮比 失真門限 循環(huán)次數(shù) 5 17 19 35 55 89 平均失真 相對失真 運(yùn)算時間 蘭州理工大學(xué)畢業(yè)論文 22 仿真結(jié)論分析說明 : LBG 算法中輸入的數(shù)據(jù)量越大,循環(huán)次數(shù)越多,平均失真越小,運(yùn)算量(時間)越長。 改變量化壓縮比 保持?jǐn)?shù)據(jù)量大小不變,改變量化壓縮比,碼書中碼字個數(shù)隨之變化,保持失真門限和碼字維數(shù)不變。 表 42 LBG 算法改變量化壓縮比仿真結(jié)果 數(shù)據(jù)結(jié)果分析: 以上不同量化壓縮比的仿真均采用同一段語音輸入,保持訓(xùn)練序列輸入樣本大小為 1000、碼字維數(shù) 失真門限 不變,使量化壓縮比分別為 200、 100、 、 50、 10,則碼書中碼字個數(shù)隨之改變?yōu)? 1 2 50、 100。通過上表程序運(yùn)行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù) 1 1 2 22 36 呈現(xiàn)出遞增趨勢;平均失真 、 、 、 、 呈現(xiàn)遞減趨勢;相對失真 、 、 、 、 、 總體保持,但規(guī)律不明顯,偶有跳動;運(yùn)算時間 、 、 、 、 呈現(xiàn)遞增趨勢。 仿真結(jié)論分析說明: LBG 算法中隨著量化壓縮比越小,碼字個數(shù)逐漸增加,循環(huán)次數(shù)越多,平均失真越小,運(yùn)算量(時間)越長。 采樣頻率 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 語音長度 20s 20s 20s 20s 20s 20s 樣本個數(shù) 1000 1000 1000 1000 1000 1000 碼字個數(shù) 5 10 15 20 50 100 碼字維數(shù) 7 7 7 7 7 7 量化壓縮比 200 100 50 20 10 失真門限 循環(huán)次數(shù) 9 17 18 24 27 36 平均失真 相對失真 運(yùn)算時間 蘭州理工大學(xué)畢業(yè)論文 23 改變碼書維數(shù) 保持?jǐn)?shù)據(jù)量大小、量化壓縮比和失真門限不變,改變碼書維數(shù)。 表 43 LBG算法改變碼書維數(shù)的仿真 結(jié)果 采樣頻率 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 語音長度 20s 20s 20s 20s 20s 20s 樣本個數(shù) 1000 1000 1000 1000 1000 1000 碼字個數(shù) 16 16 16 16 16 16 碼字維數(shù) 2 4 6 8 10 12 量化壓縮比 失真門限 循環(huán)次數(shù) 7 21 32 28 22 17 平均失真 相對失真 運(yùn)算時間 數(shù)據(jù)結(jié)果分析: 以上不同碼書維數(shù)的仿真均采用同一段語音輸入,保持訓(xùn)練序列輸入樣本大小為 1000、量化壓縮比 、失真門限 不變,使碼書維數(shù)分別為 12。通過上表程序 運(yùn)行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù) 2 3 2 2 17 總體呈現(xiàn)遞減趨勢;平均失真 、 、 、 、 、 跳躍性較大,沒有明顯的規(guī)律性;相對失真 、 、 、 、 、 呈現(xiàn)遞減趨勢(或者至少保持);運(yùn)算量(運(yùn)算時間) 、 、 、 、 、 隨著循環(huán)次數(shù)的變化而變化,總體基本上呈現(xiàn)遞減趨勢。 仿真結(jié)論分析說明: LBG 算法中碼書維數(shù)越大 ,循環(huán)次數(shù) 總體呈現(xiàn)遞減趨勢 ,相對失真減小, 運(yùn)算量(時間)隨著循環(huán)次數(shù)的變化而變化,總體基本上呈現(xiàn)遞減趨勢。 改變失真門限 保持?jǐn)?shù)據(jù)量大小、量化壓縮比和碼書維數(shù)不變,改變失真門限。 蘭州理工大學(xué)畢業(yè)論文 24 表 44 LBG 算法改變失真門限的仿真結(jié)果 采樣頻率 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 語音長度 20s 20s 20s 20s 20s 20s 樣本個數(shù) 1000 1000 1000 1000 1000 1000 碼字大小 16 16 16 16 16 16 碼字維數(shù) 7 7 7 7 7 7 量化壓縮比 失真門限 循環(huán)次數(shù) 7 14 16 20 20 20 平均失真 相對失真 運(yùn)算時間 數(shù)據(jù)結(jié)果分析: 以上不同失真門限的仿真均采用同一段語音輸入,保持訓(xùn)練序列輸入樣本大小為 1000、碼字維數(shù) 量化壓縮比 不變,使失真門限分別為 、 、 、 、 、。 通過上表程序運(yùn)行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù) 1 1 20 呈現(xiàn)出遞趨勢(或者 至少保持) ;平均失真 、 、 、 、 、 呈現(xiàn)出遞減趨勢(或者至少保持不變);相對失真 、 、 、 、 、 呈現(xiàn)出遞減趨勢(或者至少保持不變);運(yùn)算量(運(yùn)算時間) 、 、 、 、 總體呈現(xiàn)出遞增趨勢。 仿真結(jié)論分析說明: LBG 算法中失真門限越小,循環(huán)次數(shù)增加,平均失真減小,相對失真減小, 運(yùn)算量(時間)增大。 最佳矢量量化器的設(shè)計就是尋找最佳劃分和最佳碼書,使平均失真最小的過程, LBG算法是矢量量化器設(shè)計的一個基本算法。通過 MATLAB 系統(tǒng)仿真數(shù)據(jù)結(jié)果我們可看出, LBG算法是一種 下降算法,在每次迭代的過程中平均失真具有單調(diào)不增特性(或者大小至少保持不變),故可改進(jìn)任何訓(xùn)練序列的初始碼書生成最佳碼書;在每次迭代的最佳劃分階段,需要蘭州理工大學(xué)畢業(yè)論文 25 從碼書中搜索與訓(xùn)練矢量最相近的碼字,因而需要大量的計算和存儲空間;每次迭代通常產(chǎn)生的只是碼書的局部變化,也就是說一旦選定 LBG 算法的初始碼書,通過該算法得到的是局部最優(yōu)碼書。 利用 MATLAB 仿真工具對輸入語音信號進(jìn)行處理,通過修改數(shù)據(jù)量大小,碼書維數(shù),量化壓縮比 以及失真門限等參數(shù)變化,比對實驗數(shù)據(jù)結(jié)果分析不同數(shù)據(jù)參數(shù)的變化對矢量量化器 LBG 算法的影響。 ( 1) LBG 算法中在只改變數(shù)據(jù)量的情況下,輸入的數(shù)據(jù)量越大,循環(huán)次數(shù)越多,平均失真越小,運(yùn)算量(時間)越長。 ( 2) LBG 算法中在只改變量化壓縮比的情況下,隨著量化壓縮比越小,碼字個數(shù)逐漸增加,循環(huán)次數(shù)越多,平均失真越小,運(yùn)算量(時間)越長。 ( 3) LBG 算法中在只改變碼書維數(shù)的情況下,碼書維數(shù)越大,循環(huán)次數(shù) 總體呈現(xiàn)遞減趨勢 ,相對失真減小, 運(yùn)算量(時間)隨著循環(huán)次數(shù)的變化而變化,總體基本上呈現(xiàn)遞減趨勢。 ( 4) LBG 算法中在只改變失真門限的情況下,失真門限越小,循環(huán)次數(shù)增加,平均失真減小,相對失真減小, 運(yùn)算量(時間)增大。 蘭州理工大學(xué)畢業(yè)論文 26 結(jié) 論 語音識別的根本目的是研究出一種具有聽覺智能的工具,使計算機(jī)能夠識別說話人的語音信息,理解說話人的意圖而做出相應(yīng)的反應(yīng)。語音識別技術(shù)主要包括語音信號處理、特征提取、模型訓(xùn)練和模式匹配技術(shù)。矢量量化是具有良好性能的模型訓(xùn)練和模式匹配的技術(shù)之一。 本文針對數(shù)字語音識別系統(tǒng)中所涉及的矢量量化技術(shù),在對矢量量化器的基本理論和結(jié)構(gòu)學(xué)習(xí)的基礎(chǔ)上,重點(diǎn)依靠 MATLAB仿真工具,運(yùn)用 LBG算法實現(xiàn)了矢量量化器設(shè)計中最基本的技術(shù) —— 碼書設(shè)計,通過仿真結(jié)果對 LBG算法的性能參數(shù)進(jìn)行分析。首先 ,通過 LATLAB工具對輸入的語音信號進(jìn)行仿真,運(yùn)用 LBG算法實現(xiàn)了矢量量化器最佳碼書的提取,通過對實驗數(shù)據(jù)的分析比對,可看出 LBG算法是一種下降算法,在每次迭代的過程中平均失真具有單調(diào)不增特性(或者大小至少保持不變),故可改進(jìn)任何訓(xùn)練序列的初始碼書生成最佳碼書,同時存在運(yùn)算量和存儲空間大,易得到局部最優(yōu)碼書的特點(diǎn);其次,在運(yùn)用仿真工具, 通過改變數(shù)據(jù)量大小、碼書維數(shù)、量化壓縮比、最小失真門限等參數(shù)進(jìn)行了大量仿真實驗,比對仿真數(shù)據(jù)結(jié)果,對 LBG算法的實現(xiàn)過程和性能特點(diǎn)進(jìn)行了分析。 本文所做的主要工作有: ( 1) 介紹 了在研究語音識別系統(tǒng)的過程中所涉及到的基本概念及原理,以及語音識別系統(tǒng)的發(fā)展歷程和分類,研究語音識別系統(tǒng)的目的和意義。 ( 2) 分析了最佳矢量量化器設(shè)計的兩個條件 最佳劃分和最佳碼書,以及在碼書選定過程中所存在的空胞腔和隨機(jī)選擇法中的非典型矢量及其處理問題,同時設(shè)計了矢量量化器的LBG算法的實現(xiàn),及流程圖的標(biāo)注。 ( 3) 利用 MATLAB工具對 LBG算法進(jìn)行仿真,比對實驗數(shù)據(jù)結(jié)果進(jìn)行性能分析,同時通過改變數(shù)據(jù)量、碼書維數(shù)、量化壓縮比、最小失真門限等參數(shù)對 LBG算法的一些參數(shù)性能進(jìn)行了分析。 本文在設(shè)計過程中由于時間和設(shè)計 者能力的問題,僅僅只是做到了語音識別過程中算法的實現(xiàn),若要提高算法的性能,還需要對程序語言和設(shè)計思路流程做進(jìn)一步的優(yōu)化。 蘭州理工大學(xué)畢業(yè)論文 27 參考文獻(xiàn) [1] 胡航 .語音信號處理 [M].哈爾濱:哈爾濱工
點(diǎn)擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1