freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于vq的大學生語音識別算法研究畢業(yè)論文-wenkub.com

2025-06-16 12:41 本頁面
   

【正文】 %,%。7 結(jié)論矢量量化技術(shù)有效地應用在語音識別系統(tǒng)的發(fā)展。該5組數(shù)據(jù)示出了利用LBG算法和K均值算法獲得失真度量的比較圖,同時提出K均值LBG算法。該16揚聲器包含8男揚聲器和8女揚聲器。 步驟4:最近鄰搜索。建議修改的K均值LBG算法是LBG算法和K均值算法的組合優(yōu)勢。分組是通過最小化數(shù)據(jù)和相應的簇矩心之間的距離的平方的總和進行。其次,集群K的數(shù)量必須事先確定。如果在該聚類的質(zhì)心沒有變化,則終止程序。該算法可以應用于VQ碼本設計。它是一個無監(jiān)督的學習過程,可以自動根據(jù)該條件的質(zhì)心最小距離為對象進行分類。LBG算法有其局限性,如量化空間沒有被優(yōu)化在每次迭代中,算法對初始條件非常敏感。 步驟5:質(zhì)心更新 通過查找所有不相交的分區(qū)設置的質(zhì)心 步驟6:迭代1 如果,請轉(zhuǎn)至步驟3; 否則轉(zhuǎn)到步驟7,ε是一個門檻。設定n=0,這里n是迭代次數(shù)。使用未知分布的詳細LBG算法描述如下:步驟1:設計一個1矢量碼本 SETM= 1。LBG是一個局部優(yōu)化過程,通過各種方法,如定向搜索二進制分解解決,均值距離排序的局部碼本搜索 [Linde et al., 1980, Modha et al., 2003],提高LBG,基于遺傳算法的算法 [TzuChuen Luet al., 2010, ChinChen Chang et al. 2006],進化為基礎的禁忌搜索算法 [ShihMing Pan et al., 2007],和碼書生成算法 [Buzo et al., 1980]。GLA算法應用于生成的質(zhì)心和質(zhì)心能不隨時間變化。它是用來作為設計標量量化器的迭代非變分技術(shù)的簡易且快速的運算法則。在VQ中有三個主要環(huán)節(jié),即碼本的生成,編碼程序和解碼程序。當碼本大小是大的時候,這是一個耗時的過程。矢量量化的另一重要因素是該碼字的搜索問題。 矢量量化器的性能可以通過一個失真度量D,它是一個非負的成本,與量化任何輸入矢量中的再現(xiàn)矢量關(guān)聯(lián)進行評估。加權(quán)倒譜失真測度是一種quadratec度量。歐氏度量[TzuChuen Lu et al., 2010]是最常用的,因為它適合距離或變形的物理意義。歐氏度量和曼哈頓度量是特殊情況的閔可夫斯基指標。相異的測量滿足幾個性能指標,如對稱性和三角不等式性質(zhì)。該解碼器具有相同的碼本作為編碼器和解碼是由查表程序操作。VQ可以看作標量量化的一種矢量量化的概括。第5節(jié)強調(diào)提出改進的K均值LBG算法。該算法相比傳統(tǒng)的K均值算法和LBG算法具有優(yōu)越的性能。硬聚類算法是基于迭代搬遷方案。數(shù)據(jù)聚類方法可歸類為硬質(zhì)和軟聚類方法。VQ技術(shù)通常應用于開發(fā)離散或半連續(xù)HMM的語音識別系統(tǒng)。 關(guān)鍵詞:K均值算法;LBG算法;矢量量化;語音識別1 引言講話是溝通人與人之間最自然的方式。T, Nanded, India *sonbalwant摘要矢量量化的主要任務是產(chǎn)生良好的碼本。本文在設計過程中由于時間和設計者能力的問題,僅僅只是做到了語音識別過程中算法的實現(xiàn),若要提高算法的性能,還需要對程序語言和設計思路流程做進一步的優(yōu)化。首先,通過LATLAB工具對輸入的語音信號進行仿真,運用LBG算法實現(xiàn)了矢量量化器最佳碼書的提取,通過對實驗數(shù)據(jù)的分析比對,可看出LBG算法是一種下降算法,在每次迭代的過程中平均失真具有單調(diào)不增特性(或者大小至少保持不變),故可改進任何訓練序列的初始碼書生成最佳碼書,同時存在運算量和存儲空間大,易得到局部最優(yōu)碼書的特點;其次,在運用仿真工具,通過改變數(shù)據(jù)量大小、碼書維數(shù)、量化壓縮比、最小失真門限等參數(shù)進行了大量仿真實驗,比對仿真數(shù)據(jù)結(jié)果,對LBG算法的實現(xiàn)過程和性能特點進行了分析。 結(jié) 論語音識別的根本目的是研究出一種具有聽覺智能的工具,使計算機能夠識別說話人的語音信息,理解說話人的意圖而做出相應的反應。(1)LBG算法中在只改變數(shù)據(jù)量的情況下,輸入的數(shù)據(jù)量越大,循環(huán)次數(shù)越多,平均失真越小,運算量(時間)越長。仿真結(jié)論分析說明:LBG算法中失真門限越小,循環(huán)次數(shù)增加,平均失真減小,相對失真減小,運算量(時間)增大。仿真結(jié)論分析說明:LBG算法中碼書維數(shù)越大,循環(huán)次數(shù)總體呈現(xiàn)遞減趨勢,相對失真減小,運算量(時間)隨著循環(huán)次數(shù)的變化而變化,總體基本上呈現(xiàn)遞減趨勢。仿真結(jié)論分析說明:LBG算法中隨著量化壓縮比越小,碼字個數(shù)逐漸增加,循環(huán)次數(shù)越多,平均失真越小,運算量(時間)越長。仿真結(jié)論分析說明:LBG算法中輸入的數(shù)據(jù)量越大,循環(huán)次數(shù)越多,平均失真越小,運算量(時間)越長。輸入語音依舊采用同一語音 C:\Users\lenovo\,語音長度為20秒,采樣頻率為8000Hz,采用隨機選取的方法選取初始碼書。由圖43的程序運行數(shù)據(jù)結(jié)果可看出,LBG算法在每次迭代的過程中平均失真具有單調(diào)不增特性(或者大小至少保持不變),故它能改進任何給定的初始碼書,也就是說,其他碼書設計算法所產(chǎn)生的碼書可作為LBG算法的初始碼書,其得以進一步優(yōu)化而生成最佳碼書。設置碼本維數(shù)是7,碼書大小為16,通過不斷迭代來修改碼書,此時的碼書是最終的碼書。運用MATLAB可以對信號進行加噪、去噪、濾波、截取音頻等操作,也可以進行語音編碼、語音識別、語音合成的編程。MATLAB在數(shù)字語音信號處理方面的主要應用有:(1) 通過MATLAB可以對數(shù)字化的語音信號進行時頻域分析,方便的展現(xiàn)語音信號的時域及頻域曲線,根據(jù)語音特性對語音進行分析。其實在其他算法設計中同樣存在胞腔矢量少的問題,此時一般采用如下的方法進行處理:(1)重新選擇隨機初始碼字,直到?jīng)]有非典型碼字為止;(2)把這種胞腔中少數(shù)矢量分別歸并到鄰近的各個胞腔中,然后用分裂法把其中一個最大的胞腔分裂為2個小胞腔。解決空胞腔的問題時可首先去掉某個空胞腔中的形心,即碼字,然后將最大的胞腔(訓練矢量數(shù)目最多的胞腔)分裂為2個胞腔。分裂方法可以用在初始碼書的隨機選擇法中,當選擇碼字為非典型時就可以去掉非典型胞腔,而把有最多的矢量胞腔分裂來構(gòu)成初始碼書。具體步驟如下:(1)求出S中全體訓練矢量x的質(zhì)心作為初始碼書的碼字;(2)將分裂為、并作為新的初始碼書,利用LBG算法求得新碼書,;(3)重復上面的循環(huán),將、各分裂一次,得、并作為新的初始碼書,利用LBG算法求取新碼書,如此繼續(xù)。隨機選取方法同時也存在著一些問題,對于可能選到的一些非典型的矢量作為碼字,因該胞腔中只存在很少的矢量,特別是只剩下一個初始碼字時,在某些空間可能造成胞腔的劃分過于細致,使很多碼字得不到充分的利用,然而在有些空間又將胞腔劃分的過大,所以被選中的碼字在訓練序列中的不均勻分布使得該方法比較適用于相對比較平穩(wěn)的序列。因為相鄰的語音信號具有高度的相關(guān)性,在語音波形量化過程中應使樣本之間具有足夠大的間隔才能使樣本之間的互相關(guān)性得以忽略。第二步 迭代:用初始碼書為形心,根據(jù)最鄰近準則將訓練序列分成N個胞腔,即 (33)其中。LBG算法是目前比較常用和流行的一種碼書建立方法,該方法可以用于兩種情況:一是已知信源概率分布,二是未知信源概率分布,但是已知一個信號序列的情況。LBG算法實際上就是尋找最佳碼書的反復迭代過程,從一個最初選定的初始碼本開始迭代,將訓練序列進行分組,找到每一個組的初始碼書,計算該初始碼本與訓練序列的失真度,根據(jù)計算所得的最小失真度來確定新的碼本,產(chǎn)生的新碼本將作為第二次迭代時的初始碼本。因為給定的碼書中共有N個碼字,所以可以把信源空間劃分為N個區(qū)間。矢量量化器的最佳設計可以由標量量化器的最佳設計原理而來,由于這一過程使用了Lloyd提出的兩個條件,而后又將該條件推廣到矢量量化器的最佳設計上。 第三章 矢量量化器的設計算法目前,對基于矢量量化(VQ)算法的研究已取得了不少的成果,包括LBG算法,K均值算法(KMeans),K均值修正算法(MKM),最鄰近算法,預測矢量量化法(PreVQ),乘積矢量量化法等等。信號x(n)(功率譜為)和碼書特征矢量決定的信號(功率譜為)之間的ItakuraSaito失真測度,定義為 (27) 信號x(n)的p+1階自相關(guān)矩陣信號x(n)的自相關(guān)函數(shù),信號x(n)的預測誤差功率;p階碼書重構(gòu)矢量的預測誤差功率 (3)識別失真測度將矢量量化技術(shù)應用于語音識別時,對失真測度還應該有其他一些考慮。因為僅由預測系數(shù)的差值不能完全表征這兩個語音信息的差別。 (1)歐氏距離均方誤差設輸入信號的某個K維矢量X,與碼書中某個K維矢量Y進行比較,、分別表示X和Y中的各元素,則定義均方誤差為歐氏距離,即有 (26) 這里,的下標2表示平方誤差。失真是將輸入信號矢量用碼書的重構(gòu)矢量來表征時的誤差或付出的代價,用這種誤差的統(tǒng)計平均值(平均失真)來表征矢量量化器的工作特性。由于碼書(a)與碼書(b)是一樣的,此時失真最小,所以就是輸入矢量X的重構(gòu)矢量(恢復矢量)。矢量量化技術(shù)的核心是矢量量化器的設計。 碼字索引分配在矢量量化參與的編碼和解碼系統(tǒng)中,如果信道有噪聲,則在信道左端的索引i經(jīng)過信道傳輸輸出索引j ,這樣就會導致在解碼端引入額外的失真。 碼書設計對于矢量量化,首先要設計出一個性能良好的碼書,一個好的碼書是實現(xiàn)編碼的基礎。碼書中的量化矢量稱為碼字或碼矢。圖22(b)所示的是一個的二維矢量量化器,共有7個代表值,這些代表值值通常被稱為量化矢量。 在輸入信號序列中,每K個連續(xù)樣點可以組成一組K維歐式空間中的一個矢量,矢量量化就是把這個K維輸入矢量X映射成另一個K維量化矢量Y。 矢量量化用線性空間的觀點把標量量化看成是一維矢量量化。量化可分為標量量化和矢量量化兩大類。從以上分析可以看出,碼書的優(yōu)化是一個很重要的環(huán)節(jié)。矢量量化技術(shù)在其他方面的應用也發(fā)展十分迅速,如語音識別,說話人識別,文件檢索,移動通信等眾多科學領(lǐng)域中矢量量化技術(shù)已得到了廣泛地應用。判決的結(jié)果識別率是檢驗門限值選擇正確與否的唯一標準,通常情況下需要調(diào)整這些門限值才能得到滿意的識別結(jié)果。對于不同的語言需要有不同的語言學專家知識庫,同樣,漢語也有其特有的專家知識庫。識別時,將輸入語音的K維幀矢量與已有碼本中的M個區(qū)域邊界比較,按失真測度最小準則找到與該輸入矢量距離最小的碼字標號來代替此輸入的K維矢量,這個對應的碼字即為識別的結(jié)果,再對它進行K維重建就得到被識別的信號。HMM以大量訓練作為基礎,語音識別過程中需要測算待識別語音的概率大小。其主要缺點是太依賴于發(fā)音人的原來發(fā)音,發(fā)音人身體不好或發(fā)音時情緒緊張都會影響識別率。目前,在已經(jīng)研究過的多種求取測試語音參數(shù)與模板之間的測度的方法中,比較經(jīng)典的有:(1)DTW法:用輸入的待識別語音模式和預存的參考模式匹配;(2)HMM法:以統(tǒng)計方法為依據(jù)進行識別;(3)VQ方法:基于信息論中信源編碼技術(shù)的識別。 距離測度用于語音識別的距離測度有多種,如歐式距離及其變形的距離、似然比測度、加權(quán)了超音段信息的識別測度,此外,人們比較關(guān)注的測度還有HMM之間的距離測度、主管感知的距離測度等。特征的選擇標準應體現(xiàn)出異音字特征間的距離應盡可能大,而同音字間的距離應盡可能小的原則。其基本思想是將信號通過一次變換,去掉冗余部分,而將代表語音本質(zhì)的特征參數(shù)抽取出來。由于語音識別系統(tǒng)所處理的人類語言信息結(jié)構(gòu)非常復雜、內(nèi)容及其豐富,因此,其系統(tǒng)結(jié)構(gòu)比通常情況下的模式識別系統(tǒng)要復雜得多。語音識別的步驟大致可分為兩步進行:第一步,根據(jù)識別系統(tǒng)的類型,選擇能夠滿足要求的一種識別方法,采用語音分析方法分析出該識別方法所要求的語音特征參數(shù),這些參數(shù)將作為標準模式由機器存儲起來,形成標準模式庫,該語音參數(shù)庫稱為模式或樣本,這一過程稱為學習或訓練;第二步,識別過程。根據(jù)比較的方法不同,模式識別可分為模式匹配法、統(tǒng)計模式識別和句法模式識別。近年來在已經(jīng)提出的各種矢量量化方法和系數(shù)的基礎上,更多優(yōu)秀的矢量量化方法逐漸凸顯出來,在圖像數(shù)據(jù)壓縮和語音識別的應用方面,矢量量化的研究得到了很快的發(fā)展,提出了各種各樣的矢量量化系統(tǒng),用硬件實現(xiàn)矢量量化系統(tǒng)的方法也越來越多。1980年,Linde、Buzo和Gray將Loydmax算法推廣,發(fā)表了第一個矢量量化器的設計算法,通常稱之為LBG算法,將矢量量化的研究向前推進了一大步。1964年Newman研究了正六邊形原理。矢量量化技術(shù)在其發(fā)展到目前為止的過程中大致經(jīng)歷了兩個階段。因此語音識別系統(tǒng)具有重要的應用價值,它是人機通信的自然媒介。(3) 語音的反應速度特別快,可以達到毫秒量級。語音識別主要具有如下優(yōu)點:(1) 語音是人類最自然、最方便的交互工具,不需要作專門訓練。矢量量化屬于不可逆壓縮方法,具備比特率低,解碼簡單,失真較小的優(yōu)點。采用矢量量化技術(shù)對信號波形或參數(shù)進行壓縮處理,可以獲得很好的效果。數(shù)字語音通信的兩個關(guān)鍵技術(shù)是語音質(zhì)量和傳輸碼率,同時這兩者之間又是矛盾的:要獲得較高的語音質(zhì)量,就必須使用較高的傳輸碼率;相反,為了實現(xiàn)高效地壓縮傳輸碼率,就很難得到良好的語音質(zhì)量。 LBG algorithm 目 錄第一章 緒論 1 1 1 2第二章 基本原理 4 4 6 7 9 9 10第三章 矢量量化器的設計算法 12 12 LBG算法的實現(xiàn) 13 LBG算法實現(xiàn)流程設計 13 LBG算法初始碼書的選取 14 LBG算法常見的問題 16第四章 仿真結(jié)果及性能分析 17 MATLAB開發(fā)平臺簡介 17 LBG算法的設計仿真及結(jié)果分析 17 17 20結(jié) 論 2
點擊復制文檔內(nèi)容
教學教案相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1