freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

畢業(yè)設計-基于dtw模型的語音識別-資料下載頁

2024-12-03 19:33本頁面

【導讀】轉變?yōu)橄鄳奈谋净蛎畹募夹g。在課題中,通過采用DTW(Dynamictimewarping,軟件環(huán)境下孤立詞語的語音識別,并針對DTW的主要特點及不足做出了總結。文中還針對動態(tài)規(guī)劃的不足提出了改進。

  

【正文】 這就是目前語音識別過程中的最大難點 [5]。 其次,模板訓練的好壞也直接關系到語音識別系統識別率的高低。為了得到一個好的模板,往往需要有大量 的原始語音數據來訓練語音模型。因此,在開始進行西南林學院 2021屆本科畢業(yè)論文 13 語音識別研究之前,首先要建立起一個龐大的語音數據庫和語料數據庫。一個好的語音數據庫包括足夠數量、具有不同性別、年齡、口音說話人的聲音,并且必須要有代表性,能均衡地反映實際使用情況 [5]。 有了語音數據庫及語音特征,就可以建立語音模型,并用語音數據庫中的語音來訓練這個語音模型。訓練過程是指選擇系統的某種最佳狀態(tài)(如對語音庫中的所有語音有最好的識別率),不斷地調整系統模型(或模板)的參數,使系統模型的性能不斷向這種最佳狀態(tài)逼近的過程。這是一個復雜的過程,要求計算機有 強大的計算能力,并有很強的理論指導,才能保證得到良好的訓練結果。 語音識別系統的實際應用中的難點 語音識別系統的適應性差,主要體現在對環(huán)境依賴性強,即在某種環(huán)境下采集到的語音訓練系統只能在這種環(huán)境下應用,否則系統性能將急劇下降;另外一個問題是對用戶的錯誤輸入不能正確響應,使用不方便 [9]。 高噪聲環(huán)境下語音識別進展困難,因為此時人的發(fā)音變化很大, 如 聲音變高,語速變慢,音調及共振峰變化等等,這就是所謂 Lombard 效應,必須尋找新的信號分析處理方法 [9]。 語音識別所面臨的實際情況 語 言學、生理學、心理學方面的研究成果已有不少,但如何把這些知識量化、建模并用于語音識別,還需研究。而語言模型、語法及詞法模型在中、大詞匯量連續(xù)語音識別中是非常重要的 [6]。 首先, 對人類的聽覺理解、知識積累和學習機制以及大腦神經系統的控制機理等分面的認識還很不清楚;其次,把這方面的現有成果用于語音識別,還有一個艱難的過程 [6]。 語音識別系統從實驗室演示系統到商品的轉化過程中還有許多具體問題需要解決,識別速度、拒識問題以及關鍵詞(句)檢測技術(即從連續(xù)語音中去除諸如 “啊 ”、“唉 ”等語音,獲得真正待識別的語音部 分)等等技術細節(jié)要解決 [6]。 基于 DTW模型的語音識別 14 課題總結 課題最終在編程上實現了個別個體的特定語音的識別,基本上達到了預定的目標?;?DTW 模型的語音識別簡單的說就是將待識別的語音信號與數據庫中的模板進行相似度對比,將相似度最高者作為識別結果輸出。因此在實際程序實現中,功能強大的數據庫將是程序是否成功的關鍵。在程序中,由于受數據庫的局限,并沒有實現對語音的模糊識別,但個別個體的特定語音識別也具有廣泛的用途。 例如,在對象群的追蹤中,就可以采取個別個體的特定語音識別的方法,重點就是要最大限度的搜集象群中頭象的聲音特征 數據,以后一旦發(fā)現頭象的蹤跡,即可認為是發(fā)現了象群的蹤跡。這樣,既免除了搜集大量其它大象聲音特征數據的麻煩,節(jié)省了大量的時間,又免除了因為數據庫文件數量過多而引起的管理困難。因為數據庫的龐大,雖然可以保證識別的準確性,但是也可能因為識別時間過長,而失去意義,如,程序的識別結果還未給出,象群早已走出了控制范圍。 課題心得及長遠發(fā)展 一個完善的語音識別系統是由一個優(yōu)秀的算法以及一個語音特征數據完備的數據庫構成的,所以說,語音識別系統的完善過程可以認為就是語音識別算法的完善過程和語音數據庫的完善過程之和。 算法的完善有助于提高模板搜尋和匹配的效率和可靠性,相當于賦予程序一個善于思考且運轉迅速的大腦,而數據庫的完善有助于提高語音識別的精度和準確性,因為在強大的數據庫的支持下,程序能最大限度的識別準確的結果。 在算法和數據庫逐步完善的過程,模糊識別也將迎刃而解。模糊識別的意義在于能夠使程序區(qū)分不同的群體做出相應的反映,而不像特定識別只能針對指定的群體。 西南林學院 2021屆本科畢業(yè)論文 15 參考文獻 [1] 趙力 .語音信號處理 .北京:機械工業(yè)出 版 社, 2021 [2] 何強 ,何英 .MATLAB 擴展編程 .北京:清華大學出 版 社, 2021 [3] 周金萍 .MATLAB :科學出 版 社, 2021 [4] 胡航 .語音信號處理 .哈爾濱:哈爾濱工業(yè)大學出 版 社, 2021 [5] 易克初等 .語音信號處理 .北京 : 國防工業(yè)出 版 社, 2021 [6] 陳尚勤等 .近代語音識別 .成都:電子科技大學出 版 社, 1991 [7] 樓順天 .MATLAB 程序設計語言 .西安:西安電子科技大學出 版 社, 1997 [8] 姚天任 .數字語音處理 .武漢:華中理工大學出 版 社, 1992 [9] 陳永彬 .語音信號處理 .上海:上海交通大學出 版 社, 1991 [10] 韓立竹 ,王華 .MATLAB 電子仿真 與應用 .北京:國防工業(yè)出 版 社, 2021 [11] 查普曼 Chapman. : 科學出 版 社, 1998 [12] RabinerL. of Speech Rrcognition. 北京 : 清華大學出 版 社, 1999 [13] Chen YongBin .Automatic Segmentation of Chinese Continuous Speech .Proceedings of IEEE Asian Electronics Conference, 2021 基于 DTW模型的語音識別 16 致謝 本文自 2021 年 1 月選題開始,得到了指導教師 趙同林教授及 呂丹桔老師的悉心指導 ,得到了同組李丹同學的熱心幫助,特在此表示衷心的感謝。最后感謝系主任徐聲遠教授,班主任王冬老師及計科系的所有老師四年中的辛勤教導。 西南林學院 2021屆本科畢業(yè)論文 17 附錄 源程序代碼 的代碼及注解如下: function dist = dtw(t,r) n = size(t,1)。 m = size(r,1)。 % 幀匹配距離矩陣 d = zeros(n,m)。 for i = 1:n for j = 1:m d(i,j) = sum((t(i,:)r(j,:)).^2)。 end end % 累積距離矩陣 D = ones(n,m) * realmax。 D(1,1) = d(1,1)。 % 動態(tài)規(guī)劃 for i = 2:n for j = 1:m D1 = D(i1,j)。 if j1 D2 = D(i1,j1)。 基于 DTW模型的語音識別 18 else D2 = realmax。 end if j2 D3 = D(i1,j2)。 else D3 = realmax。 end D(i,j) = d(i,j) + min([D1,D2,D3])。 end end dist = D(n,m)。 的代碼及注解如下: disp(39。正在計算參考模板的參數 ...39。) for i=1:5 fname = sprintf(39。E:\\MATLAB6p5\\work\\dtw_sj\\%39。,i)。 x=fname。 [x1 x2] = vad(x)。 m = mfcc(x)。 m = m(x12:x22,:)。 ref(i).mfcc = m。 % soundview(x)。 end disp(39。正在計算測試模板的參數 ...39。) 西南林學院 2021屆本科畢業(yè)論文 19 for i=1:1 fname = sprintf(39。E:\\MATLAB6p5\\work\\dtw_sj\\%39。,i)。 x=fname。 [x1 x2] = vad(x)。 m = mfcc(x)。 m = m(x12:x22,:)。 test(i).mfcc = m。 end disp(39。正在進行模板匹配 ...39。) dist = zeros(1,5)。 for i=1:1 for j=1:5 dist(i,j) = dtw(test(i).mfcc, ref(j).mfcc)。 end end disp(39。正在計算匹配結果 ...39。) for i=1:1 [d,j] = min(dist(i,:))。 fprintf(39。測試模板 %d 的識別結果為: %d\n39。, i, j)。 en
點擊復制文檔內容
公司管理相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1