freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于vq的大學(xué)生語(yǔ)音識(shí)別算法研究畢業(yè)論文-資料下載頁(yè)

2025-08-16 14:06本頁(yè)面

【導(dǎo)讀】終目的是使計(jì)算機(jī)能夠準(zhǔn)確的識(shí)別任何人、任何內(nèi)容的講話。語(yǔ)音識(shí)別技術(shù)是一項(xiàng)集聲學(xué)、語(yǔ)音識(shí)別系統(tǒng)從本質(zhì)上說(shuō)是一種模式識(shí)別系統(tǒng),其基本結(jié)構(gòu)與常規(guī)模式識(shí)別系統(tǒng)一樣,包含有特征提取、模式匹配、參考模式庫(kù)等基本單元。矢量量化技術(shù)在語(yǔ)音識(shí)別中占有很重。要的地位,其包括碼書(shū)設(shè)計(jì)、碼字搜索和碼字索引分配,前兩者尤為重要。比對(duì)實(shí)驗(yàn)數(shù)據(jù)結(jié)果可看出LBG算法是一種下降算法,在仿真過(guò)程中,每次迭代的平均失

  

【正文】 取法實(shí)現(xiàn) LBG 算法碼書(shū)的生成,初始碼書(shū)從訓(xùn)練序列中每隔 5 個(gè)樣本選取一組??紤]到輸入 數(shù)據(jù)有正值有負(fù)值,失真測(cè)度采用歐氏距離 均方誤差失真測(cè)度。 本程序設(shè)計(jì)的具體實(shí)現(xiàn)參數(shù)為:輸入語(yǔ)音 C:\Users\lenovo\,長(zhǎng)度為 20 秒,采樣頻率為 8000Hz,采用隨機(jī)選取的方法選取大小為 100 的初始碼書(shū)。設(shè)置碼本維數(shù)是 7,碼書(shū)大小為 16,通過(guò)不斷迭代來(lái)修改碼書(shū),直到小于失真門(mén)限 時(shí)停止迭代,此時(shí)的碼書(shū)是最終的碼書(shū)。仿真最終達(dá)到 100 個(gè)數(shù)據(jù)量化為 16個(gè)數(shù)據(jù)的目的。 蘭州理工大學(xué)畢業(yè)論文 18 0 2 4 6 8 10 12 14 16 18 201 0 . 500 . 51時(shí)間幅度輸入語(yǔ)音0 0 . 0 0 2 0 . 0 0 4 0 . 0 0 6 0 . 0 0 8 0 . 0 1 0 . 0 1 2 0 . 0 1 421012x 1 03時(shí)間幅度碼書(shū) 圖 41 輸入語(yǔ)音與碼書(shū)波形圖 圖 42 程序運(yùn)行結(jié)果 初始碼書(shū) 蘭州理工大學(xué)畢業(yè)論文 19 圖 43 程序運(yùn)行時(shí)間、平均失真與相對(duì)失真 圖 44 碼書(shū)樣本個(gè)數(shù)與循環(huán)次數(shù) 蘭州理工大學(xué)畢業(yè)論文 20 圖 45 程序運(yùn)行結(jié)果 最終碼書(shū) LBG 算法物理概念清晰易懂、理論算法結(jié)構(gòu)嚴(yán)密,而且容易實(shí)現(xiàn),同時(shí)還可作為其他碼書(shū)設(shè)計(jì)技術(shù)中對(duì)初始碼書(shū)優(yōu)化的附加步驟。最佳矢量量化器設(shè)計(jì)的兩個(gè)必要條件是尋找最佳劃分與最佳碼書(shū),使平均失真最小。由圖 43 的程序運(yùn)行數(shù)據(jù)結(jié)果可看出, LBG 算法在每次迭代的過(guò)程中平均失真具有單調(diào)不增特性(或者大小至少保持不變),故它能改進(jìn)任何給定的初始碼書(shū),也就是說(shuō),其他碼書(shū)設(shè)計(jì)算法所產(chǎn)生的碼書(shū)可作為 LBG 算法的初始碼書(shū),其得以進(jìn)一步優(yōu)化而生成最佳碼書(shū)。 通過(guò)第二章對(duì) LBG 算法原理特性的推導(dǎo)我們知道, LBG 算法采用不斷的迭代方式來(lái)選擇最佳碼書(shū),在每次迭代的最佳劃分階段,由于需要從碼書(shū)中搜索與訓(xùn)練矢量最近的碼字,所以需要大量的計(jì)算和存儲(chǔ)空間。從本實(shí)驗(yàn)程序的運(yùn)行結(jié)果圖 43 可看出,每次的迭代總能減少(或者至少保持)平均失真,所以 LBG 算法是一種下降算法,并且由圖 42 和圖 45 的程序運(yùn)行結(jié)果比對(duì)可看出,每次迭代通常產(chǎn)生的只是碼書(shū)的局部變化,也就是說(shuō)一旦選定 LBG算法的初始碼書(shū),通過(guò)該算法得到的是局部最優(yōu)碼書(shū)。 修改參數(shù)后矢量量化器的 LBG 算法仿真及結(jié)果分析 在對(duì)比上面仿真得出結(jié)論的基礎(chǔ)上,通過(guò)改變語(yǔ)音數(shù)據(jù)量大小,碼書(shū)維數(shù),量化壓縮比蘭州理工大學(xué)畢業(yè)論文 21 以及失真門(mén)限等參數(shù),利用 MATLAB 仿真工具對(duì)輸入語(yǔ)音信號(hào)進(jìn)行處理,比對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行數(shù)據(jù)分析,研究不同數(shù)據(jù)參數(shù)的變化對(duì)矢量量化器 LBG 算法的影響。 輸入語(yǔ)音依舊采用同一語(yǔ)音 C:\Users\lenovo\,語(yǔ)音長(zhǎng)度為 20 秒,采樣頻率為 8000Hz,采用隨機(jī)選取的方法選取初始碼書(shū)。 改變數(shù)據(jù)量 改變數(shù)據(jù)量大小,保持量化壓縮比不變,碼書(shū)中碼字 個(gè)數(shù)隨之變化,保持失真門(mén)限和碼字維數(shù)不變。 表 41 LBG 算法改變數(shù)據(jù)量仿真結(jié)果 數(shù)據(jù)結(jié)果分析: 以上不同數(shù)據(jù)量的仿真均采用同一段語(yǔ)音輸入,保持碼字維數(shù) 量化壓縮比 、失真門(mén)限 不 變,使訓(xùn)練序列輸入樣本大小分別為 100、 500、 1000、 1500、 20 2500,則碼字個(gè)數(shù)隨之改變?yōu)? 80、 1 160、 200,才能使量化壓縮比保持不變。通過(guò)上表程序運(yùn)行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù) 1 1 3 5 89 呈現(xiàn)出遞增趨勢(shì);平均失真 、 、 、 總體呈現(xiàn)遞減趨勢(shì);相對(duì)失真 、 、 、 、 沒(méi)有明顯規(guī)律可尋;運(yùn)算時(shí)間 、 、 、 、 。 采樣頻率 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 語(yǔ)音長(zhǎng)度 20s 20s 20s 20s 20s 20s 樣本個(gè)數(shù) 100 500 1000 1500 2020 2500 碼字個(gè)數(shù) 8 40 80 120 160 200 碼字維數(shù) 7 7 7 7 7 7 量化壓縮比 失真門(mén)限 循環(huán)次數(shù) 5 17 19 35 55 89 平均失真 相對(duì)失真 運(yùn)算時(shí)間 蘭州理工大學(xué)畢業(yè)論文 22 仿真結(jié)論分析說(shuō)明 : LBG 算法中輸入的數(shù)據(jù)量越大,循環(huán)次數(shù)越多,平均失真越小,運(yùn)算量(時(shí)間)越長(zhǎng)。 改變量化壓縮比 保持?jǐn)?shù)據(jù)量大小不變,改變量化壓縮比,碼書(shū)中碼字個(gè)數(shù)隨之變化,保持失真門(mén)限和碼字維數(shù)不變。 表 42 LBG 算法改變量化壓縮比仿真結(jié)果 數(shù)據(jù)結(jié)果分析: 以上不同量化壓縮比的仿真均采用同一段語(yǔ)音輸入,保持訓(xùn)練序列輸入樣本大小為 1000、碼字維數(shù) 失真門(mén)限 不變,使量化壓縮比分別為 200、 100、 、 50、 10,則碼書(shū)中碼字個(gè)數(shù)隨之改變?yōu)? 1 2 50、 100。通過(guò)上表程序運(yùn)行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù) 1 1 2 22 36 呈現(xiàn)出遞增趨勢(shì);平均失真 、 、 、 、 呈現(xiàn)遞減趨勢(shì);相對(duì)失真 、 、 、 、 、 總體保持,但規(guī)律不明顯,偶有跳動(dòng);運(yùn)算時(shí)間 、 、 、 、 呈現(xiàn)遞增趨勢(shì)。 仿真結(jié)論分析說(shuō)明: LBG 算法中隨著量化壓縮比越小,碼字個(gè)數(shù)逐漸增加,循環(huán)次數(shù)越多,平均失真越小,運(yùn)算量(時(shí)間)越長(zhǎng)。 采樣頻率 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 語(yǔ)音長(zhǎng)度 20s 20s 20s 20s 20s 20s 樣本個(gè)數(shù) 1000 1000 1000 1000 1000 1000 碼字個(gè)數(shù) 5 10 15 20 50 100 碼字維數(shù) 7 7 7 7 7 7 量化壓縮比 200 100 50 20 10 失真門(mén)限 循環(huán)次數(shù) 9 17 18 24 27 36 平均失真 相對(duì)失真 運(yùn)算時(shí)間 蘭州理工大學(xué)畢業(yè)論文 23 改變碼書(shū)維數(shù) 保持?jǐn)?shù)據(jù)量大小、量化壓縮比和失真門(mén)限不變,改變碼書(shū)維數(shù)。 表 43 LBG算法改變碼書(shū)維數(shù)的仿真 結(jié)果 采樣頻率 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 語(yǔ)音長(zhǎng)度 20s 20s 20s 20s 20s 20s 樣本個(gè)數(shù) 1000 1000 1000 1000 1000 1000 碼字個(gè)數(shù) 16 16 16 16 16 16 碼字維數(shù) 2 4 6 8 10 12 量化壓縮比 失真門(mén)限 循環(huán)次數(shù) 7 21 32 28 22 17 平均失真 相對(duì)失真 運(yùn)算時(shí)間 數(shù)據(jù)結(jié)果分析: 以上不同碼書(shū)維數(shù)的仿真均采用同一段語(yǔ)音輸入,保持訓(xùn)練序列輸入樣本大小為 1000、量化壓縮比 、失真門(mén)限 不變,使碼書(shū)維數(shù)分別為 12。通過(guò)上表程序 運(yùn)行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù) 2 3 2 2 17 總體呈現(xiàn)遞減趨勢(shì);平均失真 、 、 、 、 、 跳躍性較大,沒(méi)有明顯的規(guī)律性;相對(duì)失真 、 、 、 、 、 呈現(xiàn)遞減趨勢(shì)(或者至少保持);運(yùn)算量(運(yùn)算時(shí)間) 、 、 、 、 、 隨著循環(huán)次數(shù)的變化而變化,總體基本上呈現(xiàn)遞減趨勢(shì)。 仿真結(jié)論分析說(shuō)明: LBG 算法中碼書(shū)維數(shù)越大 ,循環(huán)次數(shù) 總體呈現(xiàn)遞減趨勢(shì) ,相對(duì)失真減小, 運(yùn)算量(時(shí)間)隨著循環(huán)次數(shù)的變化而變化,總體基本上呈現(xiàn)遞減趨勢(shì)。 改變失真門(mén)限 保持?jǐn)?shù)據(jù)量大小、量化壓縮比和碼書(shū)維數(shù)不變,改變失真門(mén)限。 蘭州理工大學(xué)畢業(yè)論文 24 表 44 LBG 算法改變失真門(mén)限的仿真結(jié)果 采樣頻率 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 8000Hz 語(yǔ)音長(zhǎng)度 20s 20s 20s 20s 20s 20s 樣本個(gè)數(shù) 1000 1000 1000 1000 1000 1000 碼字大小 16 16 16 16 16 16 碼字維數(shù) 7 7 7 7 7 7 量化壓縮比 失真門(mén)限 循環(huán)次數(shù) 7 14 16 20 20 20 平均失真 相對(duì)失真 運(yùn)算時(shí)間 數(shù)據(jù)結(jié)果分析: 以上不同失真門(mén)限的仿真均采用同一段語(yǔ)音輸入,保持訓(xùn)練序列輸入樣本大小為 1000、碼字維數(shù) 量化壓縮比 不變,使失真門(mén)限分別為 、 、 、 、 、。 通過(guò)上表程序運(yùn)行數(shù)據(jù)結(jié)果可看出,循環(huán)次數(shù) 1 1 20 呈現(xiàn)出遞趨勢(shì)(或者 至少保持) ;平均失真 、 、 、 、 、 呈現(xiàn)出遞減趨勢(shì)(或者至少保持不變);相對(duì)失真 、 、 、 、 、 呈現(xiàn)出遞減趨勢(shì)(或者至少保持不變);運(yùn)算量(運(yùn)算時(shí)間) 、 、 、 、 總體呈現(xiàn)出遞增趨勢(shì)。 仿真結(jié)論分析說(shuō)明: LBG 算法中失真門(mén)限越小,循環(huán)次數(shù)增加,平均失真減小,相對(duì)失真減小, 運(yùn)算量(時(shí)間)增大。 最佳矢量量化器的設(shè)計(jì)就是尋找最佳劃分和最佳碼書(shū),使平均失真最小的過(guò)程, LBG算法是矢量量化器設(shè)計(jì)的一個(gè)基本算法。通過(guò) MATLAB 系統(tǒng)仿真數(shù)據(jù)結(jié)果我們可看出, LBG算法是一種 下降算法,在每次迭代的過(guò)程中平均失真具有單調(diào)不增特性(或者大小至少保持不變),故可改進(jìn)任何訓(xùn)練序列的初始碼書(shū)生成最佳碼書(shū);在每次迭代的最佳劃分階段,需要蘭州理工大學(xué)畢業(yè)論文 25 從碼書(shū)中搜索與訓(xùn)練矢量最相近的碼字,因而需要大量的計(jì)算和存儲(chǔ)空間;每次迭代通常產(chǎn)生的只是碼書(shū)的局部變化,也就是說(shuō)一旦選定 LBG 算法的初始碼書(shū),通過(guò)該算法得到的是局部最優(yōu)碼書(shū)。 利用 MATLAB 仿真工具對(duì)輸入語(yǔ)音信號(hào)進(jìn)行處理,通過(guò)修改數(shù)據(jù)量大小,碼書(shū)維數(shù),量化壓縮比 以及失真門(mén)限等參數(shù)變化,比對(duì)實(shí)驗(yàn)數(shù)據(jù)結(jié)果分析不同數(shù)據(jù)參數(shù)的變化對(duì)矢量量化器 LBG 算法的影響。 ( 1) LBG 算法中在只改變數(shù)據(jù)量的情況下,輸入的數(shù)據(jù)量越大,循環(huán)次數(shù)越多,平均失真越小,運(yùn)算量(時(shí)間)越長(zhǎng)。 ( 2) LBG 算法中在只改變量化壓縮比的情況下,隨著量化壓縮比越小,碼字個(gè)數(shù)逐漸增加,循環(huán)次數(shù)越多,平均失真越小,運(yùn)算量(時(shí)間)越長(zhǎng)。 ( 3) LBG 算法中在只改變碼書(shū)維數(shù)的情況下,碼書(shū)維數(shù)越大,循環(huán)次數(shù) 總體呈現(xiàn)遞減趨勢(shì) ,相對(duì)失真減小, 運(yùn)算量(時(shí)間)隨著循環(huán)次數(shù)的變化而變化,總體基本上呈現(xiàn)遞減趨勢(shì)。 ( 4) LBG 算法中在只改變失真門(mén)限的情況下,失真門(mén)限越小,循環(huán)次數(shù)增加,平均失真減小,相對(duì)失真減小, 運(yùn)算量(時(shí)間)增大。 蘭州理工大學(xué)畢業(yè)論文 26 結(jié) 論 語(yǔ)音識(shí)別的根本目的是研究出一種具有聽(tīng)覺(jué)智能的工具,使計(jì)算機(jī)能夠識(shí)別說(shuō)話人的語(yǔ)音信息,理解說(shuō)話人的意圖而做出相應(yīng)的反應(yīng)。語(yǔ)音識(shí)別技術(shù)主要包括語(yǔ)音信號(hào)處理、特征提取、模型訓(xùn)練和模式匹配技術(shù)。矢量量化是具有良好性能的模型訓(xùn)練和模式匹配的技術(shù)之一。 本文針對(duì)數(shù)字語(yǔ)音識(shí)別系統(tǒng)中所涉及的矢量量化技術(shù),在對(duì)矢量量化器的基本理論和結(jié)構(gòu)學(xué)習(xí)的基礎(chǔ)上,重點(diǎn)依靠 MATLAB仿真工具,運(yùn)用 LBG算法實(shí)現(xiàn)了矢量量化器設(shè)計(jì)中最基本的技術(shù) —— 碼書(shū)設(shè)計(jì),通過(guò)仿真結(jié)果對(duì) LBG算法的性能參數(shù)進(jìn)行分析。首先 ,通過(guò) LATLAB工具對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行仿真,運(yùn)用 LBG算法實(shí)現(xiàn)了矢量量化器最佳碼書(shū)的提取,通過(guò)對(duì)實(shí)驗(yàn)數(shù)據(jù)的分析比對(duì),可看出 LBG算法是一種下降算法,在每次迭代的過(guò)程中平均失真具有單調(diào)不增特性(或者大小至少保持不變),故可改進(jìn)任何訓(xùn)練序列的初始碼書(shū)生成最佳碼書(shū),同時(shí)存在運(yùn)算量和存儲(chǔ)空間大,易得到局部最優(yōu)碼書(shū)的特點(diǎn);其次,在運(yùn)用仿真工具, 通過(guò)改變數(shù)據(jù)量大小、碼書(shū)維數(shù)、量化壓縮比、最小失真門(mén)限等參數(shù)進(jìn)行了大量仿真實(shí)驗(yàn),比對(duì)仿真數(shù)據(jù)結(jié)果,對(duì) LBG算法的實(shí)現(xiàn)過(guò)程和性能特點(diǎn)進(jìn)行了分析。 本文所做的主要工作有: ( 1) 介紹 了在研究語(yǔ)音識(shí)別系統(tǒng)的過(guò)程中所涉及到的基本概念及原理,以及語(yǔ)音識(shí)別系統(tǒng)的發(fā)展歷程和分類(lèi),研究語(yǔ)音識(shí)別系統(tǒng)的目的和意義。 ( 2) 分析了最佳矢量量化器設(shè)計(jì)的兩個(gè)條件 最佳劃分和最佳碼書(shū),以及在碼書(shū)選定過(guò)程中所存在的空胞腔和隨機(jī)選擇法中的非典型矢量及其處理問(wèn)題,同時(shí)設(shè)計(jì)了矢量量化器的LBG算法的實(shí)現(xiàn),及流程圖的標(biāo)注。 ( 3) 利用 MATLAB工具對(duì) LBG算法進(jìn)行仿真,比對(duì)實(shí)驗(yàn)數(shù)據(jù)結(jié)果進(jìn)行性能分析,同時(shí)通過(guò)改變數(shù)據(jù)量、碼書(shū)維數(shù)、量化壓縮比、最小失真門(mén)限等參數(shù)對(duì) LBG算法的一些參數(shù)性能進(jìn)行了分析。 本文在設(shè)計(jì)過(guò)程中由于時(shí)間和設(shè)計(jì) 者能力的問(wèn)題,僅僅只是做到了語(yǔ)音識(shí)別過(guò)程中算法的實(shí)現(xiàn),若要提高算法的性能,還需要對(duì)程序語(yǔ)言和設(shè)計(jì)思路流程做進(jìn)一步的優(yōu)化。 蘭州理工大學(xué)畢業(yè)論文 27 參考文獻(xiàn) [1] 胡航 .語(yǔ)音信號(hào)處理 [M].哈爾濱:哈爾濱工
點(diǎn)擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1