freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計(jì)-基于dtw模型的語(yǔ)音識(shí)別(編輯修改稿)

2025-01-08 19:33 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 匯量語(yǔ) 音識(shí)別系統(tǒng)。 3) 特定人和非特定人語(yǔ)音識(shí)別系統(tǒng)。 在我們的課題中由于要實(shí)現(xiàn)的是對(duì)大象聲音的識(shí)別,所以可以將其歸結(jié)為第 3類(lèi),即特定人和非特定人的語(yǔ)音識(shí)別系統(tǒng)。 語(yǔ)音識(shí)別技術(shù) 介紹 語(yǔ)音識(shí)別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面。此外,還涉及到語(yǔ)音識(shí)別單元的選取。 語(yǔ)音識(shí)別單元的選取 選擇識(shí)別單元是語(yǔ)音識(shí)別研究的第一步。語(yǔ)音識(shí)別單元有單詞(句)、音節(jié)和音素三種,具體選擇哪一種,由具體的研究任務(wù)決定 [4]。 單詞(句)單元廣泛應(yīng)用于中小詞匯語(yǔ)音識(shí)別系統(tǒng),但不適合大詞匯系統(tǒng),原因 在于模型庫(kù)太龐大,訓(xùn)練模型任務(wù)繁重,模型匹配算法復(fù)雜,難以滿足實(shí)時(shí)性要求。 音節(jié)單元多見(jiàn)于漢語(yǔ)語(yǔ)音識(shí)別,主要因?yàn)闈h語(yǔ)是單音節(jié)結(jié)構(gòu)的語(yǔ)言,而英語(yǔ)是多音節(jié),并且漢語(yǔ)雖然有大約 1300 個(gè)音節(jié),但若不考慮聲調(diào),約有 408 個(gè)無(wú)調(diào)音節(jié),數(shù)量相對(duì)較少。因此,對(duì)于中、大詞匯量漢語(yǔ)語(yǔ)音識(shí)別系統(tǒng)來(lái)說(shuō),以音節(jié)為識(shí)別單元基本是可行的 [4]。 音素單元以前多見(jiàn)于英語(yǔ)語(yǔ)音識(shí)別的研究中,但目前中、大詞匯量漢語(yǔ)語(yǔ)音識(shí)別系統(tǒng)也在越來(lái)越多地采用。原因在于漢語(yǔ)音節(jié)僅由聲母(包括零聲母有 22 個(gè))和韻母(共有 28 個(gè))構(gòu)成,且聲韻母聲學(xué)特性相差很大。 實(shí)際應(yīng)用中常把聲母依后續(xù)韻母的不同而構(gòu)成細(xì)化聲母,這樣雖然增加了模型數(shù)目,但提高了易混淆音節(jié)的區(qū)基于 DTW模型的語(yǔ)音識(shí)別 4 分能力。由于協(xié)同發(fā)音的影響,音素單元不穩(wěn)定,所以如何獲得穩(wěn)定的音素單元,還有待研究 [4]。 特征參數(shù)提取技術(shù) 語(yǔ)音信號(hào)中含有豐富的信息,如何從中提取出對(duì)語(yǔ)音識(shí)別有用的信息 是語(yǔ)音識(shí)別的關(guān)鍵。 特征提取就是完成這項(xiàng)工作,它對(duì)語(yǔ)音信號(hào)進(jìn)行分析處理,去除對(duì)語(yǔ)音識(shí)別無(wú)關(guān)緊要的冗余信息,獲得影響語(yǔ)音識(shí)別的重要信息。對(duì)于非特定人語(yǔ)音識(shí)別來(lái)講,希望特征參數(shù)盡可能多的反映語(yǔ)義信息,盡量減少說(shuō)話人的個(gè)人信息(對(duì)特定人語(yǔ)音識(shí) 別來(lái)講,則相反)。從信息論角度講,這是信息壓縮的過(guò)程。 線性預(yù)測(cè)( LP)分析技術(shù)是目前應(yīng)用廣泛的特征參數(shù)提取技術(shù),許多成功的應(yīng)用系統(tǒng)都采用基于 LP 技術(shù)提取的倒譜參數(shù)。但線性預(yù)測(cè)模型是純數(shù)學(xué)模型,沒(méi)有考慮人類(lèi)聽(tīng)覺(jué)系統(tǒng)對(duì)語(yǔ)音的處理特點(diǎn) [4]。 Mel 參數(shù)和基于感知線性預(yù)測(cè)( PLP)分析提取的感知線性預(yù)測(cè)倒譜,在一定程度上模擬了人耳對(duì)語(yǔ)音的處理特點(diǎn),應(yīng)用了人耳聽(tīng)覺(jué)感知方面的一些研究成果 [4]。實(shí)驗(yàn)證明,采用這種技術(shù),語(yǔ)音識(shí)別系統(tǒng)的性能有一定提高。 模式匹配及模型訓(xùn)練技術(shù) 模型訓(xùn)練是指按照一定的準(zhǔn)則,從 大量已知模式中獲取表征該模式本質(zhì)特征的模型參數(shù),而模式匹配則是根據(jù)一定準(zhǔn)則,使未知模式與模型庫(kù)中的某一個(gè)模型獲得最佳匹配。 語(yǔ)音識(shí)別所應(yīng)用的模式匹配和模型訓(xùn)練技術(shù)主要有動(dòng)態(tài)時(shí)間歸正技術(shù)( DTW)、隱馬爾可夫模型( HMM)、概率語(yǔ)法分析法和人工神經(jīng)元網(wǎng)絡(luò)( ANN)。 DTW(Dynamic Time Warping 動(dòng)態(tài)時(shí)間伸縮算法 )是較早的一種模式匹配和模型訓(xùn)練技術(shù),它應(yīng)用動(dòng)態(tài)規(guī)劃方法成功解決了語(yǔ)音信號(hào)特征參數(shù)序列比較時(shí)時(shí)長(zhǎng)不等的難題,在孤立詞語(yǔ)音識(shí)別中獲得了良好性能。 DTW 是用滿足一定條件的時(shí)間歸正函數(shù)描 述待識(shí)別模式和參考模板的時(shí)間對(duì)應(yīng)關(guān)系,求解兩模板匹配是累計(jì)距離最小所對(duì)應(yīng)的歸正函數(shù),從而保證了模板間存在的最大的聲學(xué)相似性。 DTW 算法在詞匯表較小以及各個(gè)詞條不容易混淆的情況下具有一定的優(yōu)越性,但在由于其只是簡(jiǎn)單的模板匹配,在處理要求更高的語(yǔ)音識(shí)別就顯得力不從心了。因?yàn)閷?duì)于連續(xù)西南林學(xué)院 2021屆本科畢業(yè)論文 5 語(yǔ)音識(shí)別系統(tǒng)來(lái)講,如果選擇詞,詞組,短語(yǔ)甚至整個(gè)句子作為識(shí)別單位,為每個(gè)詞條建立一個(gè)模板,那么隨著系統(tǒng)用詞量的增加,模板的數(shù)量將達(dá)到天文數(shù)字,而這在實(shí)際應(yīng)用中是不可能被允許出現(xiàn)的情況。 HMM 模型是語(yǔ)音信號(hào)時(shí)變特征的有參表示法。它由相 互關(guān)聯(lián)的兩個(gè)隨機(jī)過(guò)程共同描述信號(hào)的統(tǒng)計(jì)特性,其中一個(gè)是隱蔽的(不可觀測(cè)的)具有有限狀態(tài)的 Markor鏈,另一個(gè)是與 Markor 鏈的每一狀態(tài)相關(guān)聯(lián)的觀察矢量的隨機(jī)過(guò)程(可觀測(cè)的)。隱蔽 Markor 鏈的特征要靠可觀測(cè)到的信號(hào)特征揭示。這樣,語(yǔ)音等時(shí)變信號(hào)某一段的特征就由對(duì)應(yīng)狀態(tài)觀察符號(hào)的隨機(jī)過(guò)程描述,而信號(hào)隨時(shí)間的變化由隱蔽 Markor鏈的轉(zhuǎn)移概率描述。模型參數(shù)包括 HMM 拓?fù)浣Y(jié)構(gòu)、狀態(tài)轉(zhuǎn)移概率及描述觀察符號(hào)統(tǒng)計(jì)特性的一組隨機(jī)函數(shù)。按照隨機(jī)函數(shù)的特點(diǎn), HMM 模型可分為離散隱馬爾可夫模型(采用離散概率密度函數(shù),簡(jiǎn)稱 DHMM)和連續(xù)隱馬爾可夫模型(采用連續(xù)概率密度函數(shù),簡(jiǎn)稱 CHMM)以及半連續(xù)隱馬爾可夫模型( SCHMM,集 DHMM和 CHMM 特點(diǎn))。一般來(lái)講,在訓(xùn)練數(shù)據(jù)足夠的, CHMM 優(yōu)于 DHMM 和 SCHMM。 語(yǔ)法分析法:一方面由于不同的人說(shuō)同一些語(yǔ)音時(shí),相應(yīng)的語(yǔ)譜極其變化有種種差異,但總有一些共同的特點(diǎn)足以使他們區(qū)分于其他語(yǔ)音,也即語(yǔ)音學(xué)家提出的“區(qū)別性特征 ”。而另一方面,人類(lèi)的語(yǔ)言要受詞法,語(yǔ)法,語(yǔ)義等約束,人在識(shí)別語(yǔ)音的過(guò)程中充分應(yīng)用了這些約束以及對(duì)話環(huán)境的有關(guān)信息。于是,將語(yǔ)音識(shí)別專(zhuān)家提出的 “區(qū)別性特征 ”與來(lái)自 構(gòu)詞,句法,語(yǔ)義等語(yǔ)用約束相互結(jié)合,就可以構(gòu)成一個(gè) “由底向上 ”或 “自頂向下 ”的交互作用的知識(shí)系統(tǒng),不同層次的知識(shí)可以用若干規(guī)則來(lái)描述。 人工神經(jīng)元網(wǎng)絡(luò)在語(yǔ)音識(shí)別中的應(yīng)用是現(xiàn)在研究的又一熱點(diǎn)。 ANN 本質(zhì)上是一個(gè)自適應(yīng)非線性動(dòng)力學(xué)系統(tǒng),模擬了人類(lèi)神經(jīng)元活動(dòng)的原理,具有自學(xué)、聯(lián)想、對(duì)比、推理和概括能力。這些能力是 HMM 模型不具備的,但 ANN 又不 具 有 HMM模型的動(dòng)態(tài)時(shí)間歸正性能。因此,現(xiàn)在已有人研究如何把二者的優(yōu)點(diǎn)有機(jī)結(jié)合起來(lái),從而提高整個(gè)模型的魯棒性。 語(yǔ)音識(shí)別系統(tǒng)的基本構(gòu)成 語(yǔ)音識(shí)別的典型方案如圖 1 所示 。輸入的模擬語(yǔ)音信號(hào)首先要經(jīng)過(guò)預(yù)處理,包括預(yù)濾波,采樣和量化,加窗,端點(diǎn)檢測(cè),預(yù)加重等。語(yǔ)音信號(hào)經(jīng)預(yù)處理后,接下基于 DTW模型的語(yǔ)音識(shí)別 6 特征提取 模式匹配 模型庫(kù) 語(yǔ)音輸入 識(shí)別結(jié)果 圖 1 語(yǔ)音識(shí)別流程圖 來(lái)重要的一環(huán)就是特征參數(shù)提取。對(duì)特征參數(shù)的要求是: 1) 提取的特征參數(shù)能有效的代表語(yǔ)音特征,具有很好的區(qū)分性。 2) 各階參數(shù)之間有良好的獨(dú)立性。 3) 特征參數(shù)要計(jì)算方便,具有高效的計(jì)算方法,以保證語(yǔ)音識(shí)別的實(shí)時(shí)實(shí)現(xiàn) 。 將特征參數(shù)進(jìn)行一定的處理后,為每個(gè)詞條得到一個(gè)模型,保存為模板庫(kù)。在識(shí)別階段,語(yǔ)音信號(hào)經(jīng)過(guò)相同的通道得到語(yǔ)音參數(shù),生成測(cè)試模板,與參考模板進(jìn)行匹配,將匹配分?jǐn)?shù)最高的參考模板 作 為識(shí)別結(jié)果。同時(shí)還 可以在很多先驗(yàn)知識(shí)的幫助下,提高識(shí)別的準(zhǔn)確率。 3 Matlab 簡(jiǎn)介 MATLAB 是矩陣實(shí)驗(yàn)室( Matrix Laboratory)之意。除具備卓越的數(shù)值計(jì)算能力外,它還提供了專(zhuān)業(yè)水平的符號(hào)計(jì)算,文字處理,可視化建模仿真和實(shí)時(shí)控制等功能。 Matlab 是一種解釋性執(zhí)行語(yǔ)言,具有強(qiáng)大的計(jì)算、仿真、繪圖等功能,而且使用簡(jiǎn)單,擴(kuò)充方便,同時(shí)因?yàn)橛胸S富的函數(shù)庫(kù)(工具箱)所以計(jì)算的功能實(shí)現(xiàn)也很簡(jiǎn)單。 Matlab 和其他高級(jí)語(yǔ)言也具有良好的接口,可以方便的實(shí)現(xiàn)與其他語(yǔ)言的混合編程 [3]。 其主要特點(diǎn)在于: 語(yǔ)言簡(jiǎn)潔緊湊, 使用方便靈活,庫(kù)函數(shù)豐富 ; 運(yùn)算符豐富 ; MATLAB 既具有結(jié)構(gòu)化的控制語(yǔ)句(如 for 循環(huán), while 循環(huán), break 語(yǔ)句和 if 語(yǔ)句),又有面向?qū)ο缶幊痰奶匦?; 程序限制不嚴(yán)格,程序設(shè)計(jì)自由度大 ; 程序的可移植性好 ; MATLAB 的圖形功能強(qiáng)大 ; MATLAB 的缺點(diǎn)是,它和其他高級(jí)程序相比,程序的執(zhí)行速度較慢 ;西南林學(xué)院 2021屆本科畢業(yè)論文 7 擁有功能強(qiáng)大的工具箱 ; 源程序的開(kāi)放性 [3]。 4 算法闡述 DTW 算法原理 假設(shè)測(cè)試和參考模板分別用 T 和 R 表示,為了比較它們之間的相似度,可以計(jì)算它們之間的距離 [ , ]DTR ,距離越小則相似度越高。為了計(jì)算這一失真距離,應(yīng)從T 和 R 中各個(gè)對(duì)應(yīng)幀之間的距離算起。設(shè) n 和 m 分別是 T 和 R 中任意選擇的幀號(hào),( ) ( )[ , ]nmd T R 表示這兩幀特征矢 量 之間的距離。距離函數(shù)處決于實(shí)際采用的距離度量,在 DTW 算法中通常采用歐氏距離。 若 N=M 則可以直接計(jì)算,否則要考慮將 ()nT 和 ()mR 對(duì)齊。對(duì)齊主要采用的是動(dòng)態(tài)規(guī)劃( DP)的方法。將 測(cè)試模板的各個(gè)幀號(hào) 1nN? 在一個(gè)二維直角坐標(biāo)系中的橫軸上標(biāo)出,把參考模板的各幀號(hào) 1mM? 在縱軸上標(biāo)出,通過(guò)這些表示幀號(hào)的整數(shù)坐標(biāo)畫(huà)出一些縱橫線即可形成一個(gè)網(wǎng)格,網(wǎng)格中的每一個(gè)交叉點(diǎn) (, )nm 表示測(cè)試模式中某一幀與訓(xùn)練模式中某一幀的交匯點(diǎn)。 DP 算
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1