【正文】
以提高識別效率。提出了基于動態(tài)噪聲的四狀態(tài)端點檢測算法,給出了詳細的算法流程圖以及具體參數的設置。,利用這些算法對孤立詞的端點檢測效果,實驗結果表明,些算法具有抗噪聲能力。關鍵詞(35個)語音識別,孤立詞,特定人,DTW英文摘要The thesis first introduces the elementary theory of isolated word speech recognition system and analyses the basic work process of isolated word speech it introduces two kinds of isolated word speech recognition algorithms in mon use,Dynamic Time Warping(DTW) and advanced DTW,carrying on the parison to the to the parison results and considering this system’s characteristic,it adopts advanced DTW at present to improve recognition this paper,it proposes a fourstate endpoint detection algorithm based on dynamic noise and gives the detailed algorithm flow chart as well as the concrete parameters also gives the isolatedword endpoint detection effect using the algorithm in noise and nonnoise situation with the software experimental results indicate that this algorithm has the antinoise ability.關鍵詞(35個)speech recognition;isolated word;speakerdependent;DTW指導教師評定成績評審基元評審要素評審內涵滿分指導教師實評分選題質量25%目的明確符合要求選題符合專業(yè)培養(yǎng)目標,體現學科、專業(yè)特點和教學計劃的基本要求,達到畢業(yè)論文(設計)綜合訓練的目的。10理論意義或實際價值符合本學科的理論發(fā)展,有一定的學術意義;對經濟建設和社會發(fā)展的應用性研究中的某個理論或方法問題進行研究,具有一定的實際價值。10選題恰當題目規(guī)模適當,難易度適中;有一定的科學性。5能力水平40%查閱文獻資料能力能獨立查閱相關文獻資料,歸納總結本論文所涉及的有關研究狀況及成果。10綜合運用知識能力能運用所學專業(yè)知識闡述問題;能對查閱的資料進行整理和運用;能對其科學論點進行論證。10研究方案的設計能力整體思路清晰;研究方案合理可行。5研究方法和手段的運用能力能運用本學科常規(guī)研究方法及相關研究手段(如計算機、實驗儀器設備等)進行實驗、實踐并加工處理、總結信息。10外文應用能力能閱讀、翻譯一定量的本專業(yè)外文資料、外文摘要和外文參考書目(特殊專業(yè)除外)體現一定的外語水平。5論文質量35%文題相符較好地完成論文選題的目的要求。5寫作水平論點鮮明;論據充分;條理清晰;語言流暢。15寫作規(guī)范符合學術論文的基本要求。用語、格式、圖表、數據、量和單位、各種資料引用規(guī)范化、符合標準。10論文篇幅10000字左右。5實評總分 成績等級 指導教師評審意見: 指導教師簽名: 說明:評定成績分為優(yōu)秀、良好、中等、及格、不及格五個等級,實評總分90—100分記為優(yōu)秀,80—89分記為良好,70—79分記為中等,60—69分記為及格,60分以下記為不及格。評閱教師評定成績評審基元評審要素評審內涵滿分評閱教師實評分選題質量25%目的明確符合要求選題符合專業(yè)培養(yǎng)目標,體現學科、專業(yè)特點和教學計劃的基本要求,達到畢業(yè)論文(設計)綜合訓練的目的。10理論意義或實際價值符合本學科的理論發(fā)展,有一定的學術意義;對經濟建設和社會發(fā)展的應用性研究中的某個理論或方法問題進行研究,具有一定的實際價值。10選題恰當題目規(guī)模適當,難易度適中;有一定的科學性。5能力水平40%查閱文獻資料能力能獨立查閱相關文獻資料,歸納總結本論文所涉及的有關研究狀況及成果。10綜合運用知識能力能運用所學專業(yè)知識闡述問題;能對查閱的資料進行整理和運用;能對其科學論點進行論證。10研究方案的設計能力整體思路清晰;研究方案合理可行。5研究方法和手段的運用能力能運用本學科常規(guī)研究方法及相關研究手段(如計算機、實驗儀器設備等)進行實驗、實踐并加工處理、總結信息。10外文應用能力能閱讀、翻譯一定量的本專業(yè)外文資料、外文摘要和外文參考書目(特殊專業(yè)除外)體現一定的外語水平。5論文質量35%文題相符較好地完成論文選題的目的要求。5寫作水平論點鮮明;論據充分;條理清晰;語言流暢。15寫作規(guī)范符合學術論文的基本要求。用語、格式、圖表、數據、量和單位、各種資料引用規(guī)范化、符合標準。10論文篇幅10000字左右。5實評總分 成績等級 評閱教師評審意見: 評閱教師簽名: 說明:評定成績分為優(yōu)秀、良好、中等、及格、不及格五個等級,實評總分90—100分記為優(yōu)秀,80—89分記為良好,70—79分記為中等,60—69分記為及格,60分以下記為不及格。湖南科技學院本科畢業(yè)論文(設計)答辯記錄表論文題目特定人孤立詞語音識別的研究作者姓名周 剛所屬系、專業(yè)、年級物理與電子工程系 電子信息工程專業(yè) 2004年級指導教師姓名、職稱楊 熙答 辯 會 紀 要時間2008年5月15日地點第三教學樓317答辯小組成員姓 名職務(職稱)姓 名職務(職稱)姓 名職務(職稱)李春樹副教授楊熙助教李艷芳副教授周玲助教廖朝陽講師譚永宏講師盧卯旺教授答辯中提出的主要問題及回答的簡要情況記錄: 論文中改進的DTW算法較傳統DTW算法有何優(yōu)點?答:由論文中圖6可看出,改進的DTW算法更進一步約束了搜索范圍,從而減少了數據計算量,加快識別速度并提高了計算準確度,在仿真結果中能清楚的看出其改進效果。 論文中用到的端點檢測算法為何能抗噪聲?答:論文中的端點檢測算法設定了高低短時能量、高低過零率、最大靜音時間、最小語音長度六個門限值,其中短時能量是用于抗噪聲設計的,由于語音序列的前10幀一般都為噪聲,而端點檢測算法中的高低能量門限是以前10幀的平均能量值作為參考依據,這樣我們的算法就是基于動態(tài)背景噪聲的。一般要根據實際情況選取。 論文中只提到了對單個字的識別,能否實現對多字詞的識別?答:DTW能實現對多字詞的識別,但本文中的四端點檢測法是針對單字詞設計的,不過根據本文中四端點檢測法的方法進行擴展,便能輕易實現對多字詞的識別。會議主持人: 記 錄 人: 年 月 日答辯小組意見評語:評定等級: 負責人(簽名): 年 月 日系學位委員會意見評語:論文(設計)最終評定等級:負責人(簽名): 系部(公章) 年 月 日校學位委員會意見評語:評定等級: 負責人(簽名): 年 月 日目 錄緒 論 11 語音識別系統基本理論 3 語音識別系統的組成 3 預處理 3 特征參數的提取 4 MFCC參數計算流程 5 差分倒譜參數 52 Dynamic Time Warping算法 7 DTW算法原理 7 改進的DTW算法 83 系統的軟件設計與仿真 12 語音預處理 12 改進的端點檢測算法及仿真 12 改進的端點檢測算法 12 端點檢測算法子程序流程圖 14 端點檢測仿真 15 特征參數提取子程序及仿真 16 DTW算法仿真 16 語音識別仿真 18結 論 19參 考 文 獻 20附錄A 部分程序 21致 謝 28插圖索引圖1 一般語音識別系統框圖 3圖2 用能量和過零率進行端點檢測 4圖3 線性頻率上 fm 和 f 關系 5圖4 動態(tài)時間彎曲(DTW)算法求最小失真 7圖5 DTW算法搜索路徑 8圖6 匹配路徑約束示意圖 9圖7 對角線附近的帶狀區(qū)域圖 10圖8 放寬端點后的區(qū)域限制 11圖9 預加重后的語音效果 12圖10 四狀態(tài)轉移的端點檢測 13圖11 “停止”的短時能量和過零率 13圖12 基于四狀態(tài)轉移的端點檢測流程圖 14圖13 無噪聲環(huán)境下的端點檢測 15圖14 有噪聲環(huán)境下的端點檢測 15圖15 24維特征參數部分值 16圖16 數字1—6在MATLAB環(huán)境下的識別結果顯示 18附表索引表1 實驗一在傳統DTW算法下的失真測度 16表2 實驗一在改進DTW算法下的失真測度 17表3 實驗二在傳統DTW算法下的失真測度 17表4 實驗二在改進DTW算法下的失真測度 17表5 實驗一傳統DTW算法和改進DTW算法的用時比較 18表6 實驗二傳統DTW算法和改進DTW算法的用時比較 18特定人孤立詞語音識別的研究摘 要語音是人類進行交流的手段,因此,使用語音作為人機交互的途徑對于使用者來說是最自然的一種方式,同時設備的小型化也要求省略鍵盤以節(jié)省體積。近年來,語音識別技術被廣泛應用于工業(yè)控制、消費類產品及移動通信中,是高科技應用領域的研究熱點。本文就是在這種情況下對特定人孤立詞語音識別系統做了一些探討。論文中首先介紹了孤立詞語音識別系統的基本理論,分析了孤立詞語音識別的基本工作過程。接著介紹了常用的孤立詞語音識別算法:DTW(Dynamic Time Warping,動態(tài)時間彎折)以及改進的DTW,對兩種算法進行了比較,根據比較結果,采用比較高效的改進型DTW,以提高識別效率。提出了基于動態(tài)噪聲的四狀態(tài)端點檢測算法,給出了詳細的算法流程圖以及具體參數的設置。,利用這些算法對孤立詞的端點檢測效果,實驗結果表明,些算法具有抗噪聲能力。【關鍵詞】語音識別 孤立詞 特定人 DTWResearch Of Speakerdependent Isolatedword Speech RecognitionAbstractSpeech is the means that human being carries on ,using speech as a humanputer interaction approach is the most natural way for the the same time,equipment miniaturization also demands omitting the keyboard to economize recent years,the speech recognition technology has been widely applied to industrial control,consuming product and mobile is a hot research spot in high technology application thesis makes some discussions on speakerindependent isolated word speech recognition system in this case.The thesis first introduces the elementary theor