freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

特定人孤立詞語音識別的研究畢業(yè)論文(存儲版)

2025-07-22 16:00上一頁面

下一頁面
  

【正文】 都是一個字的孤立詞,因此采用基于動態(tài)噪聲的四狀態(tài)轉(zhuǎn)移端點檢測來消除這些影響。amp_aver = — Σ amp(i)10i=1110 (32)上式中的amp( i )為第i幀輸入信號的短時能量。在過渡狀態(tài)中,由于參數(shù)的數(shù)值比較小,不能確定是否處于真正的有效語音狀態(tài),因此只要兩個參數(shù)的數(shù)值都回落低門限下,就將當(dāng)前狀態(tài)恢復(fù)到靜音狀態(tài)。 端點檢測仿真圖13 無噪聲環(huán)境下的端點檢測圖14 有噪聲環(huán)境下的端點檢測圖13為無噪聲環(huán)境下用四狀態(tài)檢測方法對采樣到的男聲命令詞“停”的端點檢測結(jié)果。圖15 24維特征參數(shù)部分值 DTW算法仿真第二章講述的算法改進均可通過實驗進行證明,本文主要就整體路徑約束的DTW算法的和傳統(tǒng)的DTW算法進行實驗,并比較其性能優(yōu)劣。在完全相同的條件下,對角線上是正確匹配模板的對應(yīng)分數(shù),可見對角線上的數(shù)值都應(yīng)是所在行中最小的,從表1至表4中可以看出,對角線上的數(shù)值確實是所在行中的最小值,由此驗證了算法的正確性。參 考 文 獻[1] 鐘林,劉加,劉潤生.多層前向感知機漢語孤立數(shù)碼語音識別[J].電路與系統(tǒng)學(xué)報,第5 卷第2 期,10070249(2000)02008205.[2] Oppenbeim AV,Schafer RW.Digital signal Processing[M].Prentice Hall,Inc,1975.[3] 王倩,吳國平,陳琳.特定人語音識別算法——DRW算法[J].中國地質(zhì)大學(xué)(武漢)通信工程學(xué)院,湖北 武漢 430074.[4] 徐文盛,戴蓓倩,方紹武,陸偉.特定人漢語數(shù)碼語音抗噪識別方法[J].電路與系統(tǒng)學(xué)報,第5 卷第2 期,10070249(2000)02005804.[5] 陳立萬.基于語音識別系統(tǒng)中DTW 算法改進技術(shù)研究[J].中文核心期刊《微計算機信息》(嵌入式與SOC)2006 年第22 卷第22 期.[6] 李瀟,王大堃.基于MATLAB 的孤立字語音識別試驗平臺[J].四川理工學(xué)院學(xué)報(自然科學(xué)版),第19 卷 第3 期,16731549(2006)03009704.[7] 黃文梅,楊勇,熊桂林,成曉明.系統(tǒng)仿真分析與設(shè)計——Matlab語音工程應(yīng)用[M].國防科技大學(xué)出版社.[8] 林波, 呂明.基于DTW改進算法的孤立詞識別系統(tǒng)的仿真與分析[J].信息技術(shù),2006年第4期.[9] Tretter TJ.Inrtoduction to Discreted Time Signal Processing[M].John Wileyamp。zcr2 = 5。signs = (tmp1.*tmp2)0。end。 status = 2。 else % 語音將結(jié)束 silence = silence+1。 count = 0。for n=1:length(zcr) goto = 0。 t=amp(i)。%計算過零率tmp1 = enframe(x(1:end1), FrameLen, FrameInc)。amp2 = 2。 四狀態(tài)端點檢測法是針對單字詞的端點檢測,按照本文中講述的方法,可以對其進行擴展,使其能檢測多字詞端點。表1和表3分別是實驗一和實驗二采用傳統(tǒng)DTW算法計算得到的測試語音與參考模板之間的失真測度,表2和表4分別是實驗一和實驗二采用改進DTW算法計算得到的測試語音與參考模板之間的失真測度。 特征參數(shù)提取子程序及仿真參數(shù)的提取在語音識別中是很重要的一部分,一個好的語音特征參數(shù)可以表示語音信號的全部特征,這就可以提高語音識別的識別率。過零率和短時能量分別按照第二章的方法計算。先根據(jù)前面的介紹設(shè)定六個門限值,然后對程序進行初始化,設(shè)定初始狀態(tài)status=0,count=0,silence=0。根據(jù)實際環(huán)境來設(shè)定具體門限值,語音序列的前10幀一般都為噪聲,所以這里高低能量門限以語音前10幀的平均能量值作為參考依據(jù),這樣我們的算法就是基于動態(tài)背景噪聲的。因此,沒有足夠準確的語音起止點檢測,將會降低語音識別的識別率,特別是起點的檢測。 語音預(yù)處理預(yù)加重一般是語音信號數(shù)字化以后,在參數(shù)分析之前在計算機里用具有6dB/倍頻程的提升高頻特性的預(yù)加重數(shù)字濾波器來實現(xiàn),它一般是一階的高通數(shù)字濾波器。通過不斷更新數(shù)據(jù)來實現(xiàn),一直進行到待測模板的最后一幀,矢量D 的最后一個元素即為兩個模板經(jīng)過動態(tài)規(guī)劃后的匹配距離,這樣可大大減小存儲空間,減小計算量,從而提高識別速度。如圖6 所示。路徑可以用函數(shù)mi =Φ(ni)來描述,其中ni = i ,i = 1,2,…,N,Φ(1)=1,Φ(N)=M。2(1,1)NMmnTR2(N,M)D[T(n),R(m)]R(m)T(n)(n,m) 圖4 動態(tài)時間彎曲(DTW)算法求最小失真假設(shè)參考模板和測試模板分別用R和T表示,它們之間的相似度用它們之間的距離D[T,R]來度量,距離越小相似度越高。因此在進行模板匹配時,把識別信號伸長或縮短至參考模板的長度是必不可少的,但研究表明,簡單的線性拉伸或壓縮并不能有效的提高識別率。為每幀數(shù)據(jù)計算出 L 階 MFCC 參數(shù)后,一般還要為這 L 個系數(shù)分別乘以不同的權(quán)系數(shù),實際上是一個短窗口:Cm = Wm Cm^L2Wm = 1 + — sin ( — ), 1≤m≤LπLm (16) 差分倒譜參數(shù)標準的 MFCC 參數(shù)反映了語音參數(shù)的靜音特特性,而人耳對語音的動態(tài)特征更為敏感,所以通常是用差分倒譜參數(shù)來描述語音特征的動態(tài)特性。每個濾波器具有三角形特性,其中心頻率為fm,它們在 Mel 頻率軸上是均勻分布的。 常用的參數(shù)有線性預(yù)測的倒譜系數(shù)(LPCC)和Mel頻率的倒譜系數(shù)(MFCC)。②區(qū)分聲母與韻母的邊界,無聲和有聲的分界,連字的分界等。在語音信號處理中,常用的窗函數(shù)是矩形窗和漢明窗。 模式匹配中需要用到的參考模板通過模板訓(xùn)練獲得。全文共分3章,具體的研究內(nèi)容如下:第1章:介紹了語音識別系統(tǒng)的實現(xiàn)方案,給出了孤立詞識別中需要的語音信號處理理論,如預(yù)加重、端點檢測和特征參數(shù)提取等。語音識別技術(shù)經(jīng)過全球半個多世紀的研究,目前已經(jīng)發(fā)展到了接近實用的階段。 T Bell實驗室實現(xiàn)了第一個可識別十個英文數(shù)字的語音識別系統(tǒng)——Audry系統(tǒng)。 2.按識別對象的類型可以分為特定人(Speaker Dependent)語音識別和非特定人(Speaker Independent)語音識別。近二三十年來,語音識別技術(shù)在工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費電子產(chǎn)品等領(lǐng)域有著廣泛應(yīng)用。論文中首先介紹了孤立詞語音識別系統(tǒng)的基本理論,分析了孤立詞語音識別的基本工作過程。5實評總分 成績等級 評閱教師評審意見: 評閱教師簽名: 說明:評定成績分為優(yōu)秀、良好、中等、及格、不及格五個等級,實評總分90—100分記為優(yōu)秀,80—89分記為良好,70—79分記為中等,60—69分記為及格,60分以下記為不及格。10研究方案的設(shè)計能力整體思路清晰;研究方案合理可行。用語、格式、圖表、數(shù)據(jù)、量和單位、各種資料引用規(guī)范化、符合標準。5能力水平40%查閱文獻資料能力能獨立查閱相關(guān)文獻資料,歸納總結(jié)本論文所涉及的有關(guān)研究狀況及成果。學(xué) 生 簽 名: 200 年 月 日 指導(dǎo)教師簽名: 200 年 月 日答辯小組組長意見組長(簽名): 200 年 月 日注:本表與畢業(yè)論文一起裝訂存檔。湖南科技學(xué)院畢業(yè)設(shè)計(論文)指導(dǎo)過程記錄表畢業(yè)論文(設(shè)計)題目特定人孤立詞語音識別的研究學(xué)生姓名周剛學(xué)號2004010099專業(yè)班級電信0401指導(dǎo)教師楊熙職稱助教系(教研室)電子科學(xué)與技術(shù)指導(dǎo)過程記錄指導(dǎo)內(nèi)容記錄(一)建議畢業(yè)設(shè)計的選題方向,并提供一些參考課題及如何查閱資料。進行資料的整理。并且語音識別作為一門正火熱發(fā)展的技術(shù),其發(fā)展前景相當(dāng)可觀,對其進行深入了解,研究是非常必要的。 湖南科技學(xué)院本科畢業(yè)論文(設(shè)計)開題報告書 論文(設(shè)計)題目特定人孤立詞語音識別的研究作 者 姓 名周 剛所屬系、專業(yè)、年級 物理與電子工程系 電子信息工程專業(yè) 2004年級指導(dǎo)教師姓名、職稱楊 熙預(yù)計字數(shù)10000開題日期選題的根據(jù):1)說明本選題的理論、實際意義 2)綜述國內(nèi)外有關(guān)本選題的研究動態(tài)和自己的見解一個完整特定人孤立詞語音識別系統(tǒng)通常包括語音的輸入、語音的預(yù)處理(預(yù)加重、加窗分幀、端點檢測等)、特征提取、訓(xùn)練與識別等幾個環(huán)節(jié)。本人完全意識到本聲明的法律結(jié)果由本人承擔(dān)。盡我所知,除文中特別加以標注和致謝的地方外,不包含其他人或組織已經(jīng)發(fā)表或公布過的研究成果,也不包含我為獲得 及其它教育機構(gòu)的學(xué)位或?qū)W歷而使用過的材料。文獻查閱指引:[1] 趙力.語音信號處理.第一版,北京:機械工業(yè)出版社.[2] 陳立萬.基于語音識別系統(tǒng)中DTW算法改進技術(shù)研究.微計算機信息,2006,2(2).[3] 何強,何英.MATLAB擴展編程.第一版,北京:清華大學(xué)出版社.[4] 李瀟,王大堃.基于MATLAB的孤立字語音識別試驗平臺.四川理工學(xué)院學(xué)報(自然科學(xué)版),19(3).畢業(yè)論文(設(shè)計)進度安排:1. 論文資料收集和整理,完成開題報告。這是一個將時間規(guī)整和距離測度有機結(jié)合在一起的非線性規(guī)整技術(shù),保證了待識別特征與模板特征之間最大的聲學(xué)相似特性和最小的時差失真。聯(lián)系本組設(shè)計成員及畢業(yè)設(shè)計指導(dǎo)師,尋求有關(guān)畢業(yè)設(shè)計信息,確定設(shè)計課題方向與設(shè)計內(nèi)容;二是虛心學(xué)習(xí)。同時繼續(xù)論文的寫作工作。學(xué) 生 簽 名: 200 年 月 日 指導(dǎo)教師簽名: 200 年 月 日指導(dǎo)內(nèi)容記錄(四)語音樣本的采集,樣本語音庫和測試語音庫的建立。提出了基于動態(tài)噪聲的四狀態(tài)端點檢測算法,給出了詳細的算法流程圖以及具體參數(shù)的設(shè)置。5研究方法和手段的運用能力能運用本學(xué)科常規(guī)研究方法及相關(guān)研究手段(如計算機、實驗儀器設(shè)備等)進行實驗、實踐并加工處理、總結(jié)信息。 評閱教師評定成績評審基元評審要素評審內(nèi)涵滿分評閱教師實評分選題質(zhì)量25%目的明確符合要求選題符合專業(yè)培養(yǎng)目標,體現(xiàn)學(xué)科、專業(yè)特點和教學(xué)計劃的基本要求,達到畢業(yè)論文(設(shè)計)綜合訓(xùn)練的目的。5論文質(zhì)量35%文題相符較好地完成論文選題的目的要求。一般要根據(jù)實際情況選取。利用這些算法對孤立詞的端點檢測效果,實驗結(jié)果表明,些算法具有抗噪聲能力。語音識別系統(tǒng)從不同角度、不同的應(yīng)用范圍等都會有不同的分類。 3.按識別的詞匯量可以分為小詞匯、中詞匯和大詞匯量語音識別。80年代,的最大特點是從基于模板的方法向統(tǒng)計模型方法的轉(zhuǎn)變,特別是轉(zhuǎn)向研究隱馬爾柯夫模型HMM的理論、方法和實現(xiàn)問題。但語音識別技術(shù)要進入成熟的商業(yè)運用還有一段艱難的路程,還必須在很多方面取得突破性進展。第3章:針對本文采集的語音樣本,對預(yù)處理后的語音提出了基于動態(tài)噪聲有四狀態(tài)端點檢測法。同時,還可以在一些先驗知識的幫助下,提高識別的準確率[3]。 在實際應(yīng)用中,通常是利用過零率來檢測清音,用短時能量來檢測濁音,兩者配合實現(xiàn)可靠的端點檢測。定義Xn(m)的短時過零率Zn為:Zn = — Σ |sgn [Xn(m)]sgn[Xn(m1)]|N 1m=012 (14) 上式中,sgn[ ] 是符號函數(shù)。實際上,人的聽覺系統(tǒng)是一個特殊的非線性系統(tǒng),它響應(yīng)不同頻率信號的靈敏度是不同的,基本上是一個對數(shù)的關(guān)系。如圖3所示:m圖3 線性頻率上 fm 和 f 關(guān)系MFCC參數(shù)的計算是以“bark”為頻率基準的,Mel頻率與線性頻率的轉(zhuǎn)換關(guān)系為:f mel = 2595 log10 (1+ )f700 (15)其中,線性
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1