freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

特定人孤立詞語音識別的研究畢業(yè)論文-在線瀏覽

2024-08-02 16:00本頁面
  

【正文】 量25%目的明確符合要求選題符合專業(yè)培養(yǎng)目標(biāo),體現(xiàn)學(xué)科、專業(yè)特點和教學(xué)計劃的基本要求,達(dá)到畢業(yè)論文(設(shè)計)綜合訓(xùn)練的目的。10選題恰當(dāng)題目規(guī)模適當(dāng),難易度適中;有一定的科學(xué)性。10綜合運用知識能力能運用所學(xué)專業(yè)知識闡述問題;能對查閱的資料進(jìn)行整理和運用;能對其科學(xué)論點進(jìn)行論證。5研究方法和手段的運用能力能運用本學(xué)科常規(guī)研究方法及相關(guān)研究手段(如計算機(jī)、實驗儀器設(shè)備等)進(jìn)行實驗、實踐并加工處理、總結(jié)信息。5論文質(zhì)量35%文題相符較好地完成論文選題的目的要求。15寫作規(guī)范符合學(xué)術(shù)論文的基本要求。10論文篇幅10000字左右。 評閱教師評定成績評審基元評審要素評審內(nèi)涵滿分評閱教師實評分選題質(zhì)量25%目的明確符合要求選題符合專業(yè)培養(yǎng)目標(biāo),體現(xiàn)學(xué)科、專業(yè)特點和教學(xué)計劃的基本要求,達(dá)到畢業(yè)論文(設(shè)計)綜合訓(xùn)練的目的。10選題恰當(dāng)題目規(guī)模適當(dāng),難易度適中;有一定的科學(xué)性。10綜合運用知識能力能運用所學(xué)專業(yè)知識闡述問題;能對查閱的資料進(jìn)行整理和運用;能對其科學(xué)論點進(jìn)行論證。5研究方法和手段的運用能力能運用本學(xué)科常規(guī)研究方法及相關(guān)研究手段(如計算機(jī)、實驗儀器設(shè)備等)進(jìn)行實驗、實踐并加工處理、總結(jié)信息。5論文質(zhì)量35%文題相符較好地完成論文選題的目的要求。15寫作規(guī)范符合學(xué)術(shù)論文的基本要求。10論文篇幅10000字左右。 湖南科技學(xué)院本科畢業(yè)論文(設(shè)計)答辯記錄表 論文題目特定人孤立詞語音識別的研究作者姓名周 剛所屬系、專業(yè)、年級物理與電子工程系 電子信息工程專業(yè) 2004年級指導(dǎo)教師姓名、職稱楊 熙答 辯 會 紀(jì) 要時間2008年5月15日地點第三教學(xué)樓317答辯小組成員姓 名職務(wù)(職稱)姓 名職務(wù)(職稱)姓 名職務(wù)(職稱)李春樹副教授楊熙助教李艷芳副教授周玲助教廖朝陽講師譚永宏講師盧卯旺教授答辯中提出的主要問題及回答的簡要情況記錄: 論文中改進(jìn)的DTW算法較傳統(tǒng)DTW算法有何優(yōu)點?答:由論文中圖6可看出,改進(jìn)的DTW算法更進(jìn)一步約束了搜索范圍,從而減少了數(shù)據(jù)計算量,加快識別速度并提高了計算準(zhǔn)確度,在仿真結(jié)果中能清楚的看出其改進(jìn)效果。一般要根據(jù)實際情況選取。會議主持人: 記 錄 人: 年 月 日答辯小組意見評語:評定等級: 負(fù)責(zé)人(簽名): 年 月 日系學(xué)位委員會意見評語:論文(設(shè)計)最終評定等級:負(fù)責(zé)人(簽名): 系部(公章) 年 月 日校學(xué)位委員會意見評語:評定等級: 負(fù)責(zé)人(簽名): 年 月 日目 錄緒 論 11 語音識別系統(tǒng)基本理論 3 語音識別系統(tǒng)的組成 3 預(yù)處理 3 特征參數(shù)的提取 4 MFCC參數(shù)計算流程 5 差分倒譜參數(shù) 52 Dynamic Time Warping算法 7 DTW算法原理 7 改進(jìn)的DTW算法 83 系統(tǒng)的軟件設(shè)計與仿真 12 語音預(yù)處理 12 改進(jìn)的端點檢測算法及仿真 12 改進(jìn)的端點檢測算法 12 端點檢測算法子程序流程圖 14 端點檢測仿真 15 特征參數(shù)提取子程序及仿真 16 DTW算法仿真 16 語音識別仿真 18結(jié) 論 19參 考 文 獻(xiàn) 20附錄A 部分程序 21致 謝 28插圖索引圖1 一般語音識別系統(tǒng)框圖 3圖2 用能量和過零率進(jìn)行端點檢測 4圖3 線性頻率上 fm 和 f 關(guān)系 5圖4 動態(tài)時間彎曲(DTW)算法求最小失真 7圖5 DTW算法搜索路徑 8圖6 匹配路徑約束示意圖 9圖7 對角線附近的帶狀區(qū)域圖 10圖8 放寬端點后的區(qū)域限制 11圖9 預(yù)加重后的語音效果 12圖10 四狀態(tài)轉(zhuǎn)移的端點檢測 13圖11 “停止”的短時能量和過零率 13圖12 基于四狀態(tài)轉(zhuǎn)移的端點檢測流程圖 14圖13 無噪聲環(huán)境下的端點檢測 15圖14 有噪聲環(huán)境下的端點檢測 15圖15 24維特征參數(shù)部分值 16圖16 數(shù)字1—6在MATLAB環(huán)境下的識別結(jié)果顯示 18 附表索引表1 實驗一在傳統(tǒng)DTW算法下的失真測度 16表2 實驗一在改進(jìn)DTW算法下的失真測度 17表3 實驗二在傳統(tǒng)DTW算法下的失真測度 17表4 實驗二在改進(jìn)DTW算法下的失真測度 17表5 實驗一傳統(tǒng)DTW算法和改進(jìn)DTW算法的用時比較 18表6 實驗二傳統(tǒng)DTW算法和改進(jìn)DTW算法的用時比較 18 特定人孤立詞語音識別的研究摘 要語音是人類進(jìn)行交流的手段,因此,使用語音作為人機(jī)交互的途徑對于使用者來說是最自然的一種方式,同時設(shè)備的小型化也要求省略鍵盤以節(jié)省體積。本文就是在這種情況下對特定人孤立詞語音識別系統(tǒng)做了一些探討。接著介紹了常用的孤立詞語音識別算法:DTW(Dynamic Time Warping,動態(tài)時間彎折)以及改進(jìn)的DTW,對兩種算法進(jìn)行了比較,根據(jù)比較結(jié)果,采用比較高效的改進(jìn)型DTW,以提高識別效率。利用這些算法對孤立詞的端點檢測效果,實驗結(jié)果表明,些算法具有抗噪聲能力。作為專門的研究領(lǐng)域,語音識別又是一門交叉學(xué)科,它與聲學(xué)、語音學(xué)、語言學(xué)、數(shù)字信號處理理論、信息論、計算機(jī)科學(xué)、人工智能、數(shù)理統(tǒng)計等眾多學(xué)科緊密相連。隨著計算機(jī)技術(shù)、模式識別和信號處理技術(shù)以及聲學(xué)技術(shù)等的發(fā)展,使得語音識別技術(shù)取得顯著進(jìn)步,開始從實驗室走向市場。當(dāng)今,語音識別產(chǎn)品在人機(jī)交互應(yīng)用中,已經(jīng)占到了越來越大的比例。語音識別系統(tǒng)從不同角度、不同的應(yīng)用范圍等都會有不同的分類。孤立詞識別是指說話人每次只說一個詞或短語,每個詞或短語在詞匯表中都算作一個孤立詞條。連續(xù)語音識別是指對說話人以日常自然的方式發(fā)音,通常特指用于語音錄入的聽寫機(jī)。特定人是指定只針對一個用戶的語音識別,比較簡單,能得到較高的識別率,但使用前必須由特定人的用戶輸入大量的發(fā)音數(shù)據(jù)對其進(jìn)行訓(xùn)練。 3.按識別的詞匯量可以分為小詞匯、中詞匯和大詞匯量語音識別。語音識別研究從二十世紀(jì)50年代開始到現(xiàn)在已經(jīng)歷半個多世紀(jì)的蓬勃發(fā)展,在這期間獲得了巨大的進(jìn)展。50年代,ATamp。60年代,提出了動態(tài)規(guī)劃(DP)和線性預(yù)測分析技術(shù)(LP),其中后者較好地解決了語音信號產(chǎn)生模型的問題,對語音識別的發(fā)展產(chǎn)生了深遠(yuǎn)影響。80年代,的最大特點是從基于模板的方法向統(tǒng)計模型方法的轉(zhuǎn)變,特別是轉(zhuǎn)向研究隱馬爾柯夫模型HMM的理論、方法和實現(xiàn)問題。同時,語音識別技術(shù)不斷應(yīng)用于電話網(wǎng)絡(luò),增強話務(wù)員服務(wù)和自動化。研究重點包括即興口語的識別和理解,自然口語對話,以及多語種的語音同聲翻譯[5]。在實驗室環(huán)境下,大詞匯量的朗讀式連續(xù)說話的寬帶語音信號的平均識別率可以達(dá)到90%以上。但語音識別技術(shù)要進(jìn)入成熟的商業(yè)運用還有一段艱難的路程,還必須在很多方面取得突破性進(jìn)展。語音識別ASR(Automatic Speech Recognition)系統(tǒng)的實用化研究是近十年語音識別研究的一個主要方向。本文主要是針對普通控制命令詞,小詞匯量的特定人孤立詞語音識別的研究。第2章:介紹了基于動態(tài)規(guī)劃(DP)思想的DTW算法,并在此算法的基礎(chǔ)上,討論了快速DTW算法的實現(xiàn)。第3章:針對本文采集的語音樣本,對預(yù)處理后的語音提出了基于動態(tài)噪聲有四狀態(tài)端點檢測法。1 語音識別系統(tǒng)基本理論 語音識別系統(tǒng)的組成語音識別系統(tǒng)的典型實現(xiàn)方案如框圖1所示。語音識別的過程可以被看作模式匹配的過程,模式匹配是指根據(jù)一定的準(zhǔn)則,使未知模式與模型庫中的某一個模型獲得最佳匹配的過程。 在訓(xùn)練階段,用戶將詞匯表中的每個詞依次說一遍作為模板保存為模板庫。同時,還可以在一些先驗知識的幫助下,提高識別的準(zhǔn)確率[3]。預(yù)加重通過濾波提升高頻分量并消除50Hz或60Hz的工頻干擾,使信號的頻譜變得平坦,保持在低頻到高頻的整個頻帶中,能用同樣的信噪比求頻譜,以便于頻譜分析或聲道參數(shù)分析。分幀采用可移動的有限窗口進(jìn)行加權(quán)的方法實現(xiàn),即用窗函數(shù)ω(n)來乘X(n),從而形成加窗語音信號Xω(n)=X(n)* ω(n)。本文中,8kHz采樣,幀長為256,幀移為80的漢明窗。 在實際應(yīng)用中,通常是利用過零率來檢測清音,用短時能量來檢測濁音,兩者配合實現(xiàn)可靠的端點檢測。如圖2所示。第n幀語音信號Xn(m)的短時能量En為:En = Σ |Xn(m)|N 1m=0 (13) 這里定義短時能量即短時幅值,它的主要作用:①區(qū)分濁音和清音,因為濁音的短時能量比清音大得多。③作為一種超音段信息,用于語音識別中。定義Xn(m)的短時過零率Zn為:Zn = — Σ |sgn [Xn(m)]sgn[Xn(m1)]|N 1m=012 (14) 上式中,sgn[ ] 是符號函數(shù)。第四將仔細(xì)介紹端點檢測算法。語音特征參數(shù)提取是語音識別的關(guān)鍵問題,特征參數(shù)的好壞對于語音識別精度和識別時間有很大影響。全極點線性預(yù)測模型(LPC)是基于發(fā)音模型建立的,并假設(shè)語音信號為自回歸信號,利用線性預(yù)測分析獲得倒譜參數(shù)。實際上,人的聽覺系統(tǒng)是一個特殊的非線性系統(tǒng),它響應(yīng)不同頻率信號的靈敏度是不同的,基本上是一個對數(shù)的關(guān)系。研究表明, Mel頻率的倒譜參數(shù)所含的信息量比其它參數(shù)多,能較好的表現(xiàn)語音信號,并且比較充分利用人耳特殊感知特性,性能優(yōu)于LPCC參數(shù)。 MFCC參數(shù)計算流程MFCC參數(shù)計算的要點是將線性功率譜S ( n)轉(zhuǎn)換成為mel頻率下的功率譜, 這需要在計算之前先在語音的頻譜范圍內(nèi)設(shè)置若干個帶通濾波器:Hm ( n) ,m = 0 … Y – 1,n = 0 … H /2 – 1Y為濾波器個數(shù),H為一幀語音信號的點數(shù)。在線性頻率上,當(dāng) m 較小時,相鄰的 fm 間隔很小,隨著 m 的增加相鄰的 fm 間隔逐漸拉開。如圖3所示:m圖3 線性頻率上 fm 和 f 關(guān)系MFCC參數(shù)的計算是以“bark”為頻率基準(zhǔn)的,Mel頻率與線性頻率的轉(zhuǎn)換關(guān)系為:f mel = 2595 log10 (1+ )f700 (15)其中,線性頻率 f 的單位是 Hz [8]。計算 FFT 之前,要把一幀數(shù)據(jù)(256點)乘以一個 hamming 窗,以克服 Gibbs 現(xiàn)象。( 3 ) 計算其離散余弦變換。ld (n) = Σ j ● C(n+j)j = 1√__∑ j 2j = ll1________差分參數(shù)的計算公式為: (17) 這里 c 和 d 都表示一幀語音信號參數(shù),l 為常數(shù),一般取2,這時差分參數(shù)就稱為當(dāng)前幀的前兩幀和后兩幀參數(shù)的線性組合。 在相同的參數(shù)維數(shù)下,Mel濾波器個數(shù)D對識別性能影響不大,這里取24,本文中,是將12階MFCC參數(shù)和它一階差分參數(shù)合并為一個矢量(24階),作為一幀語音信號的參數(shù),因為動態(tài)信息和靜態(tài)信息形成互補,所以能很大程度上提高系統(tǒng)的識別性能。這時一般是用單詞作為識別單元。但是語音具有相當(dāng)大的隨機(jī)性,即使是同一個人在不同的時刻所講的同一句話、發(fā)同一個音,也不可能具有完全相同的時間長度。對此,日本學(xué)者板倉將DP算法的概念用于解決孤立詞識別時的說話速度不均勻的難題,提出了著名的動態(tài)時間伸縮算法,即DTW算法。這是一個將時間規(guī)整和距離測度有機(jī)結(jié)合在一起的非線性規(guī)整技術(shù),保證了待識別特征與模板特征之間最大的聲學(xué)相似特性和最小的時差失真。 DTW算法原理在對每一幀語音信號提取MFCC 特征參數(shù)以后,就轉(zhuǎn)化成了一組MFCC 特征向量。在用DTW算法進(jìn)行識別判決時,由于測試語音與參考模式語音長短不同,因此需要通過DTW動態(tài)計算兩個長度不同的模式之間的相似程度,或者叫做失真距離。為了計算這一失真距離,要從T和R中各個對應(yīng)幀之間的距離算起。 設(shè)測試模板T共有N幀,參考模板R共有M幀,將測試模板和參考模板的幀號分別在坐標(biāo)系的橫坐標(biāo)和縱坐標(biāo)上標(biāo)出,則各個幀號之間的關(guān)系可以形成一個網(wǎng)格,網(wǎng)格中的任何一個交叉點(n,m)表示測試模板的T(n)和參考模板的R(m)相交,并且該交叉點擁有幀失真為D[T(n),R(m)]。DP算法就是尋找一條通過此網(wǎng)格中若干個格點的最佳路徑。如下圖所示:21 2 3 4 5 6 7 8 9 10 NM91345
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1