freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于倒譜的大學生語音識別算法研究畢業(yè)論文(完整版)

2025-08-29 23:34上一頁面

下一頁面
  

【正文】 ................... 24 基于倒譜的共振峰的算法 ........................................... 24 第 5 章 倒譜法提取基音頻率和共振峰 ............................. 錯誤 !未定義書簽。 語音識別的關鍵技術是提取出語音特征,語音特征有很多,倒譜分析就是其中之一。要使機器聽的懂人話,就要對語音信號進行處理。 關鍵詞 :倒譜;語音識別;共振峰檢測;基音檢測;蘭州理工大學畢業(yè)論文 Abstract Voice is one of the most important human munication tools. With the widely application of electronic puters and artificially intellective machine, it was discovered that language munication is the best way to municate between man and machine and the voice was the reflection of the language. If we wanted us understood by the machines, it is necessary to deal with the signal. With the continuous development of IT, especially the popularity of work and perfect system, voice signal processing technology plays an increasingly important role. In order to find a good performance characteristics and extract important parameters to improve the performance of the recognition system, a variety of scientific algorithms have been emerged. The key technology of voice recognition is extracting voice features. While there are many voice features, cepstrum analyses is one of them. The cepstrum, as one of the important signal processing methods, can get better recognition performance. This paper mainly introduce the voice recognition technology. The basic idea is to casually input voice signal and transform the signal by using additive signal to linear transformation, and use the methods based on Mel(MFCC) frequency as well as some of the speech signal to cepstrum analyze. And then by the usage of the voice spectrum of applications in all aspects programs MATLAB simulation, it can get the simulation results of detect voice pitch and formant detection. Keywords: Cepstrum; Voice recognition; Resonance peak detection; Pitch detection; 蘭州理工大學畢業(yè)論文 目錄 第 1 章 緒論 .................................................................... 3 研究背景及意義 .......................................................... 1 語音信號研究現(xiàn)狀 ........................................................ 1 主要研究內(nèi)容 ............................................................ 3 第 2 章 語音識 別技術基本理論 ................................... 錯誤 !未定義書簽。人類開始進入信息化時代 ,用現(xiàn)代手段研究語音處理技術 ,使人們能更加有效地產(chǎn)生、傳輸、存儲和獲取語言信息 ,這對于促進社會的發(fā)展具有十分重要的意義。 語音識別技術,也稱為自動語音識別,其是為了將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入,例如二進制編碼、按鍵或者字符序列。語言聲學蘭州理工大學畢業(yè)論文 2 的發(fā)展和電子學以及計算機科學有著非常密切的關系。它的發(fā)展很快,在通信、自動控制等領域,解決了很多用傳統(tǒng)方法難以解決的問題。因此原有的模板匹配方法已不再適用。 我國語音識別研究工作起步于五十年代初,但近年來發(fā)展很快。 中科院自動化所及其所屬模式科技公司 20xx 年發(fā)布了他們共同推出的面向不同計算平臺和應用的“天語”中文語音系列產(chǎn)品 —— PattekASR,結(jié)束了中文語音識別產(chǎn)品自 1998 年以來一直由國外公司壟斷的歷史。 最后第 五章具體研究了倒譜在語音信號處理中的實現(xiàn)方法,主要是語音信號識別的參數(shù)提取。 LPCC 參數(shù)是根據(jù)聲管模型建立的特征參數(shù) ,主要反映聲道響應。 3)對音頻信號進行重疊分幀:為避免信號間斷一般取 256 點為一幀 ,幀間重疊為 128 點。同時,它一般包括了一些信號處理技術,以盡可能 的 降低環(huán)境噪聲、信道、說話人等因素對特征造成的影響。首先,統(tǒng)計語音識別的最基本問題是,給定輸入信號或特征序列,符號集(詞典),求解符號串使得: )0/(m a xa rg WPW ? ( 22) 通過貝葉斯公式,上式可寫為: )()/0(m a xa r g WPWPW ? ( 23) 由于對于確定的輸入串 P(O)[4]是確定的,因此省略它并不會影響上式的最終結(jié)果,因此,一般來說語音識別所討論的問題可以用 上 面的公式來表示,可以將它稱為語音識別的基本 公式。語音識別是一門交叉學科 , 近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。 語音識別的技術原理是找出特征參數(shù)。另外,語音信號的頻譜具有非常明顯的聲學特性,利用頻域分析獲得的語音特征具有實際的物理意義。 從識別系統(tǒng)的詞匯量大小考慮 : 也可以將識別系統(tǒng)分為 3類: (1)小詞匯量語音識別系統(tǒng) : 通常包括幾十個詞的語音識別系統(tǒng)。 通常認為常用語言中有有限個不同的語音 基 元,而且可以通過其語音信號的頻域或時域特性來區(qū)分。所謂 端點 檢測就是在語音信號中的各種段落 (如音素、音節(jié)、詞素 )的始點和終點的位置,從語音信號中排除無聲段。 HMM 是對語音信號的時間序列結(jié)構(gòu)建立 統(tǒng)計模型 ,將之看作一個數(shù)學上的雙重隨機過程:一個是用具有有限狀態(tài)數(shù)的Markov 鏈來模擬語音信號統(tǒng)計特性變化的隱含的隨機過程,另一個是與 Markov 鏈的每一個狀態(tài)相關聯(lián)的觀測序列的隨機過程。 矢量量化 器的設計就是從大量信號樣本中訓練出好的碼書,從實際效果出發(fā)尋找到好的失真測度定義 公式 ,設計出最佳的矢量量化系統(tǒng),用最少的搜索和計算失真的運算量,實現(xiàn)最大可能的平均信噪比 [9]。 語音識別系統(tǒng)基本結(jié)構(gòu) 一個完整的基于統(tǒng)計的語音識別系統(tǒng)可大致分為三部分: (1)語音信號預處理與 特征提取 ; (2)聲學模型 與模式匹配 ; (3)語言模型與語言處理 。實際應用中常把聲母依后續(xù)韻母的不同而構(gòu)成細化聲母,這樣雖然增加了模型數(shù)目,但提高了易混淆音節(jié)的區(qū)分能力。但線性 預測模型 是純數(shù)學模型,沒有考慮人類聽覺系統(tǒng)對語音的處理特點。 聲學模型 的目的是提供一種 有效的方法計算語音的 特征矢量 序列和每個發(fā)音模板之間的距離。漢語的一個音節(jié)就是漢語一個字的音,即音節(jié)字。 語言模型對中、大詞匯量的語音識別系統(tǒng)特別重要。 倒譜分析的優(yōu)點和缺點 對信號進行分析得出它的倒譜參數(shù)的過程稱為同態(tài)處理。我們稱其中的時域序列為信號序列的“復倒頻譜”,簡稱“復倒譜”,也叫對數(shù)復倒譜。這種頻率彎曲可以更好的表示 聲音,例如 音頻壓縮 [13] 。對頻率軸的不均勻劃分是 MFCC 特征的特點。 蘭州理工大學畢業(yè)論文 17 圖 MFCC參數(shù)提取基本流程 MFCC 算法流程 設某語音信號為 x(n) ,則算法處理流程為 1)預加重,其中 k 為預加重系數(shù),一般取 ; 2)加窗( hamming 窗),幀長為 N; 3) DFT 變 換; 4)設計一個具有 M 個帶通濾波器的濾波器組,采用三角濾波器,中心頻率從 0~F/2 之間按 Mel頻率分布; 5)計算每個濾波器組輸出的對數(shù)能量; 6)求得 MFCC 特征參數(shù)。由圖可知,信號幅值在 15 處上 下波動,與此同時,隨著采樣點的增多,信號幅值的上下波動減小,可以預測,在無窮遠處,信號幅值將在 15 處固定不變。為了能夠提取出這些參數(shù),就要借助一些工具,本節(jié)通過 MATLAB 完成倒譜在語音處理的各方面應用。由于對其進行如下處理: )(?)(?)(?)](?[ 21 zYzYzYnyZ ??? (46) )()()())(?e x p ( 21 zYzYzYzY ??? (47) )()()]()([)( 21211 nynyzYzYZny ???? ? (48) ( 4)特征系統(tǒng) D*[]和逆特征系統(tǒng) D*1[]的區(qū)別 。 2 基音的周期 基音是指發(fā)濁音時聲帶振動所引起的周期性,而基音周期是指聲帶振動頻率的倒數(shù)。 2)要從語音信號中去除聲道的影響,直接取出僅與聲帶振動有關的聲源信息并非易事。借此,可從倒譜波形中估計出基音周期。 基音檢測的實現(xiàn)框圖和流程 圖如圖 和 所示。倒譜分析技術可以較好地分離出語音信號頻譜包絡結(jié)構(gòu)。甚至在采用線性預測方法時,也并非沒有虛假峰值。即使采用線性預測進行頻譜包絡估計也會出現(xiàn)這個問題。包括波形自相關法,平均振幅差分函數(shù)法( AMDF),簡化逆濾波法( SIFT)等。 (程序見附錄 ) 0 0 . 0 0 5 0 . 0 1 0 . 0 1 5 0 . 0 2 0 . 0 2 5 0 . 0 3 0 . 0 3 500 . 10 . 20 . 30 . 40 . 50 . 60 . 7z = r c e p s ( y )振幅倒頻譜 圖 由 rceps 函數(shù)得到的倒譜圖 圖( )為運用 rceps 函數(shù)繪制的倒譜圖,在圖中可以清楚的發(fā)現(xiàn) 附近的峰值點即為所求點。雖然倒譜分析算法比較復雜,但基 音估計效果較好 [14]。 基于倒譜的共振峰的算法 倒譜將基音 諧波和聲道的頻譜包絡分離開來。 2)共振 峰合并。所以共振峰是語音信號處理中非常重要的特征參數(shù),已經(jīng)廣泛地用作語音識別的主要特征和語音編碼傳輸?shù)幕拘畔?。它是表征發(fā)音時聲道特性的關鍵參數(shù),也是區(qū)別不同韻母的重要依據(jù)。下面給出一種倒譜法求基音周期的框圖及流程圖。 3)在濁音段很難精確地確定每個基音周期的開始和結(jié)束位置,這不僅因為語音信號本身是準周期的,也是因為波形的峰受共振峰結(jié)構(gòu),噪聲等影響較大。對于漢語這種有調(diào)語音,基音的變化模式稱為聲調(diào),它攜帶著非常重要的具有辨意作用的信息,有區(qū)別意義的功能。(運算方式如圖 ) 線性系統(tǒng) 特征系統(tǒng) D*[] 逆特征系統(tǒng) D*1[] y(n) * + + x(n) * 蘭州理工大學畢業(yè)論文 21 圖 特征系統(tǒng)與逆特征系統(tǒng)的框圖表示 倒譜在基音檢測方面的應用 基音是語音信號的一個重要參數(shù),在語音產(chǎn)生的數(shù)字模型中也是激勵源的一個重要參數(shù),準確地檢測語音信號的基音周期對于高質(zhì)量的語音分析 與合成、語音壓縮編碼、語音識別和說話人確認等具有重要的意義。 MATLAB 仿真結(jié) 果如下:(程序見附錄 A) 0 50 100 150 200 250 300 350 4001 0 . 500 . 51截取的語音段樣點數(shù)幅度 2 0 0 1 5 0 1 0 0 5 0 0 50 100 150 200 0 . 2 0 . 100 . 10 . 2截取語音的倒譜
點擊復制文檔內(nèi)容
研究報告相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1