freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于遺傳算法的混合高斯模型在與文本無關(guān)的_說話人識(shí)別中的應(yīng)用_碩士畢業(yè)設(shè)計(jì)論文-資料下載頁

2025-07-06 15:43本頁面

【導(dǎo)讀】本人聲明所呈交的學(xué)位論文是我個(gè)人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得東南大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說明并表示了謝意。東南大學(xué)、中國科學(xué)技術(shù)信息研究所、國家圖書館有權(quán)保留本人所送交學(xué)位論文的復(fù)印件和電子文檔,可以采用影印、縮印或其他復(fù)制手段保存論文。論文的公布授權(quán)東南大學(xué)研究生院辦理。遺傳算法采用浮點(diǎn)編碼,交叉和變異在一個(gè)種群的勝者組和敗者組同時(shí)進(jìn)行,最后改為優(yōu)勝劣汰。語音的端點(diǎn)檢測(cè)方面,分別利用簡單的三門限方法和利用信噪比的方法進(jìn)行端點(diǎn)檢測(cè)。

  

【正文】 計(jì)平均值。是將所有說話人的平均所得的均值。類內(nèi)、類間距離比為恰當(dāng)反映說話人所對(duì)應(yīng)各類參數(shù)的散度,用類間、類內(nèi)距離比來進(jìn)行量度。類內(nèi)距離:則平均類內(nèi)距離:,式中為類中的個(gè)數(shù)。平均類內(nèi)距離反映了同一說話人在不同時(shí)間,發(fā)不同話音時(shí),特征參數(shù)的變化程度。平均類間距離定義為特征空間中所有的點(diǎn)到不屬于其自身類別中心的平均距離,即: (359)平均類間距離反映了參數(shù)隨說話人變化的差異,即每人參數(shù)概率分布的散度。兩者之比體現(xiàn)了說話人的區(qū)分特征: (360)統(tǒng)計(jì)分析中的距離量度歐氏距離 (361)漢明距離 (362). 本章小結(jié)本章主要介紹了說話人識(shí)別的特征參數(shù),介紹并分析了各種說話人識(shí)別的特征參數(shù),包括基音頻率、線性預(yù)測(cè)編碼、復(fù)倒譜和倒譜、MEL倒譜和差值倒譜。最后介紹了參數(shù)的選取方法,分析參數(shù)有效性的評(píng)判標(biāo)準(zhǔn)。第4章 說話人識(shí)別的識(shí)別方法第4章 說話人識(shí)別的識(shí)別方法. 引言1983年K. Li 和E. Wrench[15]和1985年F. K. Soong、A. E. Rosenberg、L. R. Rabiner和B. H. Juang[12]把矢量量化方法從語音識(shí)別中移至說話人識(shí)別并成為當(dāng)時(shí)與文本無關(guān)說話人識(shí)別的基準(zhǔn)方法、隨后出現(xiàn)經(jīng)典的統(tǒng)計(jì)形式的識(shí)別方法:1988年J. B. Attilli的貝葉斯辨別分析[16]和1993年A. L. Higgins、. Bahler和J. E. Porter的最近鄰分類器[17]、接著有各種人工神經(jīng)網(wǎng)絡(luò)(ANN)方法:1990年J. Oglesby和J. S. Mason的多層感知器(MLP)[18]、1990年Y. Bennani和P. Galllinari的學(xué)習(xí)矢量量化(LVQ)[21]、1991年J. Oglesby和J. S. Mason的放射狀基函數(shù)(RBF)[20]和1991年Y. Bennani和P. Galllinari的時(shí)延神經(jīng)網(wǎng)絡(luò)(TDNN)[19]、在這期間提出了利用說話人識(shí)別模型來進(jìn)行說話人識(shí)別:1990年M. Savic和S. K. Gupta[22]和1991年N. Z. Tishby[23]的離散隱馬爾可夫模型(DHMM)、1991年A. E. Rosenberg、C. H. Lee和S. Gokeen[24]的連續(xù)密度的隱馬爾可夫模型(CDHMM)和1990年R. C. Rose和D. A. Reynolds[25]的高斯混合模型(GMM)。. 矢量量化方法(VQ)矢量量化(Vector Quantization,VQ)是一種及其重要的信號(hào)壓縮方法,廣泛應(yīng)用于圖像信號(hào)壓縮、語音信號(hào)壓縮等領(lǐng)域。由于VQ碼本保存了說話人一定的聲道特性,這樣我們就可以利用VQ法來進(jìn)行說話人證實(shí)。在VQ法中模型匹配不依賴于參數(shù)的時(shí)間順序,因而匹配過程中無需采用DTW技術(shù);而且這種方法比應(yīng)用DTW方法的參考模型存儲(chǔ)量小,即碼本碼字小。系統(tǒng)如圖 41所示。完成這個(gè)系統(tǒng)有兩個(gè)步驟:一是對(duì)訓(xùn)練語音進(jìn)行建本;二是對(duì)話者語音的每一幀和碼本碼字之間進(jìn)行匹配。本課題就是研究利用VQ技術(shù)進(jìn)行說話人識(shí)別,所以以下詳細(xì)介紹VQ技術(shù)及其在說話人識(shí)別中的應(yīng)用。圖 41說話人識(shí)別的矢量量化法矢量量化研究的基礎(chǔ)是信息論的一個(gè)分支:“率——畸變理論”,其中有兩項(xiàng)理論研究成果對(duì)于矢量量化算法的發(fā)展起關(guān)鍵作用。第一,該理論指出,對(duì)于一定的量化速率R(用比特/采樣表示),量化畸變D(以量化信號(hào)與原信號(hào)之間的誤差均方值和原信號(hào)均方值之比來衡量)是一定的。對(duì)于不同的信號(hào)源,根據(jù)其統(tǒng)計(jì)特性,可以計(jì)算出兩者的相應(yīng)值。第二,無論對(duì)于何種信息源,即使是無記憶的信息源(即各采樣信號(hào)之間相互統(tǒng)計(jì)獨(dú)立),矢量量化也總是優(yōu)于標(biāo)量量化,且維數(shù)越大優(yōu)度越高。雖然這一理論并沒有指出采用何種具體算法來實(shí)現(xiàn)一個(gè)矢量量化器,但卻指明了努力的方向。矢量量化的研究目的就是針對(duì)特定的信息源和矢量維數(shù),找到一種最優(yōu)的矢量量化器,它能夠在R一定時(shí)給出更小的畸變值。在模式識(shí)別中,還需要完成對(duì)每一個(gè)所要識(shí)別的矢量進(jìn)行分類的任務(wù)。為此,通常的做法是將所有要識(shí)別矢量的集合分成若干子集,各子集中的矢量有相似的特征,因而能用一個(gè)具有代表性的矢量來表示,完成這一任務(wù)的算法稱為“聚類算法”。一個(gè)無記憶的VQ系統(tǒng)的基本框架如圖3-2所示。其中特征矢量形成部分的作用是每輸入一幀語音采樣信號(hào)(若幀長為N,則可表示為),則輸出一個(gè)與之相 對(duì)應(yīng)的特征矢量X,若其維數(shù)為K,則。K可以等于N也可不等于N。最簡單的情況是K=N且,其中i=1~N。X也可以是對(duì)一幀語音進(jìn)行變換或分析之后得到的矢量,例如各種預(yù)LPC分析。同態(tài)處理或DCT有關(guān)的特征矢量。這時(shí)K往往小于N。在具體應(yīng)用中到底選擇哪種矢量則應(yīng)該根據(jù)所要達(dá)到的目標(biāo)而定。X系統(tǒng)中有兩個(gè)完全相同的碼本,每個(gè)碼本包含M個(gè)碼字,其中,每一個(gè)碼字是一個(gè)K維矢量(維數(shù)與X相同)。如無特別聲明,將始終約定X和的各個(gè)分量都是實(shí)數(shù)。VQ編碼器的運(yùn)行原理是根據(jù)輸入矢量X從編碼器碼本中選擇一個(gè)與之對(duì)應(yīng)的矢量,其輸出v即為此矢量的下標(biāo),一般稱為標(biāo)號(hào)。這一過程可以形式化地用下式表示: (41)v是一個(gè)數(shù)字,因而可以通過任何數(shù)字信道或任何數(shù)字存儲(chǔ)介質(zhì)來存儲(chǔ)。如果此過程不引入誤差,那么從信道接收端或從存儲(chǔ)介質(zhì)中取出的信號(hào)仍是v。VQ譯碼器的運(yùn)行原理是按照v從譯碼器碼本(與編碼器的碼本相同)中選出一個(gè)具有相應(yīng)下標(biāo)的碼字作為輸出Y。這可表示為: (42)如果編碼器和譯碼器在同一處(數(shù)字存取),那么只用一個(gè)碼本就足夠了。圖 42矢量量化系統(tǒng)框圖如果用表示X和Y之間的畸變,那么VQ的任務(wù)就是在給定R的條件下,使得此畸變的統(tǒng)計(jì)平均值D達(dá)到最小。,表示對(duì)X的全體所構(gòu)成的集合去統(tǒng)計(jì)平均。為了實(shí)現(xiàn)這一目的,應(yīng)該遵循以下兩條原則。VQ編碼器根據(jù)X選擇相應(yīng)的碼字時(shí)應(yīng)遵從“最鄰近原則”,這可表示為: (43)設(shè)所有選擇碼字的輸入矢量X的集合為,那么應(yīng)使此集合中的所有矢量與之間的畸變值最小。如果X與Y之間的畸變值等于它們的歐氏距離,那么容易證明應(yīng)等于中所有矢量的質(zhì)心,即應(yīng)等于下式之值: (44)N是中所包含的矢量的個(gè)數(shù)。根據(jù)第一個(gè)原則,VQ編碼器的運(yùn)行過程是,每輸入一個(gè)X就計(jì)算X與碼本中每一碼字之間的畸變,以具有最小畸變字的下標(biāo)為輸出v。,所以這是一種“全搜索算法”。解決了VQ編碼器的運(yùn)行問題之后,就需要解決VQ碼本的設(shè)計(jì)問題。一個(gè)VQ系統(tǒng)能否給出較低的D值從而具有較高的質(zhì)量,關(guān)鍵在于碼本的設(shè)計(jì)。根據(jù)第一條和第二條原則,可以設(shè)計(jì)出一種碼本設(shè)計(jì)的遞推算法。,,。所以這種算法常稱為LBG算法或GLA(Generalized Lloyd Algorithm),以下是以歐氏距離計(jì)算兩個(gè)矢量畸變時(shí)的LBG算法步驟,算法的流程圖見圖 43:將形成矢量量化碼本所需全部輸入矢量X存儲(chǔ)于計(jì)算機(jī)內(nèi)存中。全部X的集合用S表示。設(shè)置疊代算法的最大疊代次數(shù)。設(shè)置畸變改進(jìn)閾值。設(shè)置M個(gè)碼字的初值。設(shè)置畸變初值。設(shè)置迭代初值m=1。根據(jù)最近鄰原則將S分成M個(gè)子集,即當(dāng)時(shí),下式應(yīng)成立: (45)計(jì)算總畸變:計(jì)算畸變改進(jìn)量的相對(duì)值:計(jì)算新碼字: 判斷是否小于:若是,轉(zhuǎn)入13)執(zhí)行。若不是,轉(zhuǎn)入12)執(zhí)行。判斷m是否小于L:若不是,轉(zhuǎn)入13)執(zhí)行。若是,令m=m+1,轉(zhuǎn)入7)執(zhí)行。迭代終止,輸出作為碼字,并且輸出總畸變 。對(duì)于上述算法補(bǔ)充說明。第一,為了避免算法陷入死循環(huán),設(shè)置了和L兩個(gè)閾值參數(shù),的值設(shè)得遠(yuǎn)小于1,當(dāng)?shù)闹当刃r(shí),表明運(yùn)算畸變已經(jīng)很小,可停止計(jì)算。L是限制最大迭代次數(shù)的參數(shù),以防止太小時(shí),迭代次數(shù)太多。第二,此算法的第(7)步完成的工作時(shí)以第(m1)形成的M個(gè)碼字為基準(zhǔn),將全部X的集合按照最鄰近準(zhǔn)則劃分為M個(gè)子集,其中。每一個(gè)子集可以看成一個(gè)小區(qū),在模式識(shí)別中稱為“聚類區(qū)”。由此形成的劃分一般也稱為Voronio劃分,對(duì)于來說它所給出的畸變是最小的。第(10)步完成的工作是按照第(7)步得到的Voronio劃分求出新的碼字。當(dāng)采用歐氏距離來計(jì)算畸變時(shí)應(yīng)是中所有矢量的質(zhì)心。由于不一定是矢量的質(zhì)心,用代替時(shí)總會(huì)使畸變下降。這樣每完成一次迭代計(jì)算,總畸變必然有所下降,因此這個(gè)算法是一種使總畸變單調(diào)下降的算法。但是實(shí)用中的函數(shù)既有全局最小解,還有多個(gè)局部最小解,迭代算法無法保證收斂到全局最小解。初始碼本的設(shè)置方法和畸變準(zhǔn)則的選擇:隨機(jī)初始碼本 最簡單的方法是從X的集合中隨意選出M個(gè)矢量作為初始碼本。但這種方法的效果并不好,因?yàn)檫@些被選中的矢量在集合中的分布可能很不均勻。分裂法初始碼字第一步求出S中全體X的質(zhì)心。然后在S中找一個(gè)與此質(zhì)心的畸變最大的矢量,再在S中找一個(gè)與的誤差為最大的。以和為基準(zhǔn)進(jìn)行Voronio劃分,得到和兩個(gè)子集。對(duì)這兩個(gè)子集分別按同樣方法進(jìn)行處理就可以得到四個(gè)子集。依此類推,若(B為整數(shù)),只要進(jìn)行B次分裂可以得到M個(gè)子集。畸變準(zhǔn)則也可分為兩大類。第一類是歐氏距離準(zhǔn)則,這時(shí)兩個(gè)矢量X和Y之間的畸變或誤差用它們的歐氏距離的平方值來衡量,如下: (46)其中表示取一個(gè)矢量的模值。第二類是各種非歐氏距離,如對(duì)歐氏距離的加權(quán)和。對(duì)于時(shí)域特征矢量,一般用歐氏距離。對(duì)于變換域特征矢量,則兩種誤差準(zhǔn)則都采用。圖 43 LBG算法流程圖. 隱馬爾可夫模型方法(HMM)HMM模型是馬爾可夫鏈(Markov)的推廣。在HMM中,觀察到的事件與狀態(tài)通過一組概率分布相聯(lián)系,是一個(gè)雙重隨機(jī)過程,其中一個(gè)是Markov鏈,它描述了狀態(tài)之間的轉(zhuǎn)移;另一個(gè)隨機(jī)過程描述狀態(tài)和觀察值之間的統(tǒng)計(jì)對(duì)應(yīng)關(guān)系。HMM模型的狀態(tài)是隱含的,可以觀察到的的是狀態(tài)產(chǎn)生的觀察值,因此稱為隱馬爾可夫模型(HMM)。圖 44 HMM模型一個(gè)HMM模型可以由下列參數(shù)描述:N:模型中Markov鏈的狀態(tài)數(shù)目。記N個(gè)狀態(tài)為,記t時(shí)刻Markov鏈所處狀態(tài)為,顯然。M:每個(gè)狀態(tài)對(duì)應(yīng)的可能的觀察值數(shù)目。記M個(gè)觀察值為,記t時(shí)刻觀察到的觀察值為,其中。π:初始狀態(tài)概率矢量,其中。A:狀態(tài)轉(zhuǎn)移概率矩陣,其中。B:觀察值概率矩陣,其中,。這樣,可以記一個(gè)HMM為或簡寫為更形象地說,HMM可分為兩部分,一個(gè)是Markov鏈,由π、A描述,產(chǎn)生的輸出為狀態(tài)序列,另一個(gè)是一個(gè)隨機(jī)過程,由B描述,產(chǎn)生的輸出為觀察值序列。T為觀察值的時(shí)間長度。通常認(rèn)為語音信號(hào)是一個(gè)短時(shí)平穩(wěn)的隨機(jī)過程,在10~30ms的短時(shí)段內(nèi),語音信號(hào)是平穩(wěn)的,而從整體來看,語音信號(hào)是時(shí)變的。HMM模型成功的描述了這種短時(shí)平穩(wěn)的信號(hào)。由兩個(gè)相互關(guān)聯(lián)的隨機(jī)過程共同描述了語音信號(hào)的統(tǒng)計(jì)特性,平穩(wěn)段的信號(hào)由對(duì)應(yīng)的狀態(tài)觀察值的隨機(jī)過程描述,而短時(shí)平穩(wěn)段向下一短時(shí)平穩(wěn)段的轉(zhuǎn)變則由隱含的馬爾可夫鏈的狀態(tài)跳轉(zhuǎn)的轉(zhuǎn)移概率來描述。根據(jù)可得到的觀察值的不同類型,HMM可分為兩種類型。如果觀察值是連續(xù)的,這樣的HMM模型稱為連續(xù)HMM(CDHMM);如果觀察值是離散的,則稱為離散HMM(DHMM)。連續(xù)HMM模型需要的參數(shù)存儲(chǔ)空間和運(yùn)算復(fù)雜均高于離散HMM,但是在觀察值是連續(xù)分布時(shí),CDHMM識(shí)別效果要好,這是因?yàn)樵趯⑦B續(xù)值進(jìn)行離散量化時(shí)不可避免地將引入失真,導(dǎo)致識(shí)別性能下降。常用的量化方法有矢量量化(VQ),下面簡單介紹一下矢量量化技術(shù)。HMM應(yīng)用于語音信號(hào)處理需要解決的三個(gè)基本問題是:對(duì)給定的觀察值序列和模型,如何計(jì)算觀察值序列O的概率。如何調(diào)整模型參數(shù)使得觀察值序列O出現(xiàn)的的概率最大對(duì)給定的觀察值序列和模型,如何獲得相應(yīng)的狀態(tài)轉(zhuǎn)移序列對(duì)以上三個(gè)問題的解決方法是前向―后向算法,BaumWelch算法和Viterbi算法:前向-后向算法:這個(gè)算法是用來計(jì)算給定一個(gè)觀察值序列以及一個(gè)模型時(shí),由模型λ產(chǎn)生出O的概率。根據(jù)圖 44所示HMM的組成,最直接的求取方法如下:對(duì)一個(gè)固定的狀態(tài)序列,有 (47)其中,而對(duì)給定λ,產(chǎn)生S的概率為 (48)因此,所求概率為 (49)顯而易見,上式的計(jì)算量是十分驚人的,大約為數(shù)量級(jí),當(dāng)N=5,T=100時(shí),計(jì)算量達(dá),這是完全不能接受的。在此情況下,要求出還必須尋求更有效的算法,這就是Baum等人提出的前向-后向算法:(1)、前向算法定義前向變量為: (410)那么,有初始化:, (411)遞歸:, (412)終結(jié):,其中 (413)這種算法計(jì)算量大為減少,變?yōu)镹(N+1)(T1)+N次乘法和N(N1)(T1)次加法。同樣,N=5,T=100時(shí),只需大約3000次計(jì)算(乘法)。(2)、后向算法與前向算法類似,定義后向變量為:, (414)其中,類似,有初始化:, (415)遞歸:, (416)終結(jié): (417)后向算法的計(jì)算量大約在數(shù)量級(jí),也是一種格型結(jié)構(gòu)。BaumWelch 算法:這個(gè)算法實(shí)際上是解決HMM訓(xùn)練,即HMM參數(shù)估計(jì)問題,或者說,給定一個(gè)觀察值序列,該算法能確定一個(gè),使最大。顯然,由(413)和(417)式定義的前向和后向變量,有:, (418)這里,求取λ
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1