freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

特定人孤立詞語音識別的研究畢業(yè)論文-wenkub

2022-09-07 04:10:20 本頁面
 

【正文】 與技術 指導過程記錄 指導內容 記錄 (一 ) 建議畢業(yè)設計的選題方向,并提供一些參考課題及如何查閱資料。 學 生 簽 名: 200 年 月 日 指導教師簽名: 200 年 月 日 H 指導過程記錄 指導內容 記錄 (五 ) 對采集到的樣本進行處理,端點檢測算法的選擇和特征參數(shù)的選擇。 學 生 簽 名: 200 年 月 日 指導教師簽名: 200 年 月 日 答辯小組組長意見 組長 (簽名 ): 200 年 月 日 注:本表與畢業(yè)論文一起裝訂存檔。用 仿真了在有噪聲和無噪聲的情況下,利用 這 些算法對孤立詞的端點檢測效果,實驗結果表明,些算法具有抗噪聲能力。 5 能力水平40% 查閱文獻 資料能力 能獨立查閱相關文獻資料,歸納總結本論文所涉及的有關研究狀況及成果。 10 外 文應用 能力 能閱讀、翻譯一定量的本專業(yè)外文資料、外文摘要和外文參考書目(特殊專業(yè)除外)體現(xiàn)一定的外語水平。用語、格式、圖表、數(shù)據(jù)、量 和單位、各種資料引用規(guī)范化、符合標準。 10 理論意義或 實際價值 符合本學科的理論發(fā)展,有一定的學術意義;對經(jīng)濟建設和社會發(fā)展的應用性研究中的某個理論或方法問題進行研究,具有一定的實際價值。 10 研究方案的 設計能力 整體思路清晰;研究方案合理可行。 5 寫作水平 論點鮮明;論據(jù)充分; 條理清晰;語言流暢。 5 實評總分 成績等級 評閱教師評審意見: 評閱教師簽名: 說明:評定成績分為優(yōu)秀、良好、中等、及格、不及格五個等級,實評總分 90—100 分記為優(yōu)秀, 80— 89 分記為良好, 70— 79 分記為中等, 60— 69 分記為及格, 60 分以下記為不及格。 論文中只提到了對單個字的識別,能否實現(xiàn)對多字詞的識別? 答: DTW能實現(xiàn)對多字詞的識別, 但本文中的四端點檢測法是針對單字 詞設計的,不過根據(jù)本文中四端點檢測法的方法進行擴展,便能輕易實現(xiàn)對多字詞的識別。 論文中首先介紹了孤立詞語音識別系統(tǒng)的基本理論,分析了孤立詞語音識別的基本工作過程。 【關鍵詞】 語音識別 孤立詞 特定人 DTW V Research Of Speakerdependent Isolatedword Speech Recognition Abstract Speech is the means that human being carries on ,using speech as a humanputer interaction approach is the most natural way for the the same time,equipment miniaturization also demands omitting the keyboard to economize recent years,the speech recognition technology has been widely applied to industrial control,consuming product and mobile is a hot research spot in high technology application thesis makes some discussions on speakerindependent isolated word speech recognition system in this case. The thesis first introduces the elementary theory of isolated word speech recognition system and analyses the basic work process of isolated word speech it introduces two kinds of isolated word speech recognition algorithms in mon use,Dynamic Time Warping(DTW) and advanced DTW,carrying on the parison to the to the parison results and considering this system’s characteristic,it adopts advanced DTW at present to improve recognition this paper,it proposes a fourstate endpoint detection algorithm based on dynamic noise and gives the detailed algorithm flow chart as well as the concrete parameters also gives the isolatedword endpoint detection effect using the algorithm in noise and nonnoise situation with the software experimental results indicate that this algorithm has the antinoise ability. 【 Key words】 speech recognition isolated word speakerdependent DTW 1 緒 論 語音識別( Speech Recognition)是機器通過識別和理解過程把語音信號轉變?yōu)橄鄳奈谋疚募蛎畹母呒夹g。近二三十年來,語音識別技術在工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務、消費電子產(chǎn)品等領域有著廣泛應用。一般語音識別系統(tǒng)按不同的角度有下面幾種分類: 1. 按說話人的講話方式可以分為孤立詞( Isolated Word)識別連續(xù)語音( Continuous Speech)識別。 2. 按識別對象的類型可以分為特定人( Speaker Dependent)語音識別和非特定人( Speaker Independent)語音識別。一般來講, 1~20個詞匯屬于小詞匯量語音識別系統(tǒng)、 20~1000 個詞匯屬于中詞匯量語音識別系統(tǒng)、大于 1000個詞匯屬于大詞匯量語音識別系統(tǒng)。 T Bell 實驗室實現(xiàn)了第一個可識別十個英文數(shù)字的語音識別系統(tǒng)——Audry 系統(tǒng)。 90 年代,語音識別研究的重點轉向自然語言的識別 處理,任務轉移到航空旅行信息的索取。 語音識別技術經(jīng)過全球半個多世紀的研究,目前已經(jīng)發(fā)展到了接近實用的階段。主要包括高可靠性;增加詞匯量;應用拓展;降低成本減小體積四個方面。全文共分3 章,具體的研究內容如下: 第 1 章:介紹了語音識別系統(tǒng)的實現(xiàn)方案,給出了孤立詞識別 中需要的語音信號處理理論,如 預加重 、端點檢測和特征參數(shù)提取等。闡述了系統(tǒng)的軟件設計過程,對各部分給出了相應的軟件流程圖,并且對具體算法進行了 MATLAB 仿真論證。 模式匹配中需要用到的參考模板通過模板訓練獲得。 預處理 由于語音信號的平均功率譜受聲門激勵和口鼻輻射影響,高頻端大約在 800Hz 以上按6dB/倍頻程跌落,所以 在 語音信號頻譜時,頻率越高相應的成分越小,高頻部分的頻譜比低頻部分的難求,為此要在預處理中進行預加重( Preemphasis)處理。在語音信號處理中,常用的窗函數(shù)是矩形窗和漢明窗。用得比較多的是經(jīng)典的雙門限端點檢測算法。②區(qū)分聲母與韻母的邊界,無聲和有聲的分界,連字的分界等。 考慮到開始以后總會出現(xiàn)能量較大的濁音,設一個較高的門限 amp1 用以確定語音已開始,再取一比 amp1 稍低的門限 amp2,用以確定語音的起始點 N1,和結束點 N2,由于語音起始段往往存在著能量很弱的清輔音(如 [s]、 [f]等),只用能量去判斷,很難把它們和無聲區(qū)分開,但發(fā)現(xiàn)它們的過零率明顯高于無聲段,因此可以用過零率來精確起點 。 常用的參數(shù)有線性預測的倒譜系數(shù)( LPCC)和 Mel 頻率的倒譜系數(shù)( MFCC)。由于充分模擬幅值 amp2 amp1 0 N0 N1 N2 n 過零率 ZCR0 0 N0 N1 N2 n En = Σ |Xn(m)| N 1 m=0 Zn = — Σ |sgn [Xn(m)]sgn[Xn(m1)]| N 1 m=0 1 2 5 了人的聽覺特性,而且沒有任何前提假設,因此 MFCC 參數(shù)具有很好的識別性能和抗噪能力。 每個濾波器具有三角形特性,其中心頻率為 fm,它們在 Mel 頻率軸上是均勻分布的。 求 MFCC 參數(shù)的過程為: ( 1 ) 對輸入語音幀作快速傅利葉變換 FFT,將時域信號轉化為頻域信號 。 為每幀數(shù)據(jù)計算出 L 階 MFCC 參數(shù)后,一般還要為這 L 個系數(shù)分別乘以不同的權系數(shù),實際上是一個短窗口: ( 16) 差分倒譜參數(shù) 標準的 MFCC 參數(shù)反映了語音參數(shù)的靜音特特性,而人耳對語音的動態(tài)特征更為敏感,所以通常是用差分倒譜參數(shù)來描述語音特征的動態(tài)特性。 l d (n) = Σ j ● C(n+j) j = 1 √ __ ∑ j 2 j = l l 1 ________ 7 2 Dynamic Time Warping 算法 假定一個孤立詞語音識別系統(tǒng),利用模板匹配法進行識別。因此在進行模板匹配時,把識別 信號伸長或縮短至參考模板的長度是必不可少的,但研究表明,簡單的線性拉伸或壓縮并不能有效的提高識別率。 DTW 解決了發(fā)音長短不一的模板匹配問題,是語音識別中出現(xiàn)較早,較為經(jīng)典的一種算法 [10]。 圖 4 動態(tài)時間彎曲( DTW)算法求最小失真 假設參考模板和測試模板分別用 R 和 T 表示,它們之間的相似度用它們之間的距離D[T, R]來度量,距離越小相似度越高。如上 圖所示。路徑可以用函數(shù) mi =Φ (ni)來描述,其中 ni = i , i = 1, 2,?, N,Φ (1)=1,Φ (N)=M。 D[(ni, mi)] = d [T(ni), R(mi)] + D[(ni1, mi1)] ( 22) 其中的 D[(n i1, m i1)]由下式?jīng)Q定 D[(ni1, mi1)]=min{ D[(ni1, mi)], D[(ni1, mi1)], D[(ni1, mi2)]} ( 23) 從 (ni, mi) =(1, 1) 開始往下搜索 (n2, m2),再搜索 (n3, m3) ??,對每一個 (ni,mi) 都存儲相應的前一格點 (ni1, mi1) 及相應的幀匹配距離 d[ni, mi]。如圖 6 所示。 充分利用這兩個特點可以減少計算量和存儲空間的需求,形成一種高效的 DTW 算法。通過不斷更新數(shù)據(jù)來實現(xiàn),一直進行到待測模板的最后一幀,矢量 D 的最后一個元素即為兩個模板經(jīng)過動態(tài)規(guī)劃后的匹配距離,這樣可大大減小存儲空間,減小計算量,從而提高識別速度。 放寬端點限制的 DTW 算法 對于普通 DTW對端點檢測比較敏感,端點信息是作為一組獨立的參數(shù)提供給識別算法,它要求兩個比較模式起點對起點,終點對終點,對端點檢測的精度要求比較高,當環(huán)境噪聲1 2 — 1 2 — 1 2 — 1 2 — 1 2 — x → 2 x x ≤ Xa x → x + (M – N ) Xa < x ≤ Xb 2 x + (M – 2N ) → x + (M – N ) x > Xb 1 2 — 1 2 — 1 2 — 1 2 — 1 2 — 1 2 — x → 2 x
點擊復制文檔內容
高考資料相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1