freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于倒譜的大學(xué)生語音識別算法研究畢業(yè)論文-文庫吧在線文庫

2025-08-24 23:34上一頁面

下一頁面
  

【正文】 倒譜參數(shù),因此同態(tài)分析也叫倒譜分析 [12]。 定義如下:其中假設(shè)信號為 x(n),則 復(fù)倒譜的 Z 變換定義 : )](?[) ) ](([ ln)(? 11 xXZnxZZnX ?? ?? ( 31) 復(fù)倒譜的傅 里葉變換定義 ]?[][ ln? ) j w n(eX= I F TF T ( x ( n ) )( n ) = I F TX ( 32) ?? ?1N 0Njω )(=)(=)(e X j w nenxx ( n )FT ( 33) ?? ?? deeXeXI F Tnx j w njwjw )(2 1)(()( ???? ( 34) 復(fù)倒譜的離散傅立葉變換定義 )]([))](([ ln)(? kXI D F TnxD F TI D F TnX ?? ( 35) 復(fù)倒譜的定義可以用圖 表示 蘭州理工大學(xué)畢業(yè)論文 14 圖 三種復(fù)倒譜定義的框圖表示 復(fù)倒譜與倒譜的關(guān)系 圖 復(fù)倒譜與倒譜關(guān)系框圖 可以將卷積信號轉(zhuǎn)變?yōu)槌朔e信號,而取對數(shù)運(yùn)算可以將乘法轉(zhuǎn)化為加法,卷積同態(tài)處理正是采用這樣的一種思路,具體過程如下這里 x1(n)和 x2(n)分別為聲門激勵(lì)信號和聲道沖激響應(yīng)序列: 1 輸入信號 (n) x(n) x=x(n) 21 ? ( 36) 2 Z變換 ( z )X( z )X=( n ) )Z ( x( n ) )Z ( x=( n ) )x( n )Z ( x=Z ( x ( n ) )=X ( z ) 21212 1 ??? ( 37) 3 取對數(shù)運(yùn)算 ( z )X?+( z )X?=( z ) )l n ( X+( z ) )l n ( X=( z ) )X( z )l n ( X=l n ( X ( z ) )=( z )X? 212121 ?( 38) 4 逆 Z變換 ( n )x?+( n )x?=( z ) )X?+( z )X?( Z=( z ) )X?( Z=( n )x? 212111 ( 39) 5 為加性信號, 經(jīng)過線性系統(tǒng)的處理得到: (n)y?+(n)y?=(n)y? 21 ( 310) ZT ln| | IZT ZT ln IZT c(n) x(n) Z ln Z1 FT ln IFT DFT ln IDFT x(n) x(t) x(n) ^ x(n) x(n) 蘭州理工大學(xué)畢業(yè)論文 15 6 對作 Z變換: ( z )Y?+( z )Y?=( n ) )y?+( n )y?Z(=( n ) )y?Z(=( z )Y? 2121 ( 311) 7 指數(shù)運(yùn)算 ( z )Y( z )Y=( z ) )Y?e x p (( z ) )Y?e x p (=( z ) )Y?+( z )Y?e x p (=( z ) )Y?e x p (=Y ( z ) 212121 ??( 312) 8 逆 Z變換 ( n )y( n )y=( z ) )Y( z )(Y Z=( Y ( z ) )Z=y ( n ) 212111 ?? ( 313) 步驟 1~4稱作特征系統(tǒng),記為; 6~8步驟稱為逆特征系統(tǒng),記為。 倒譜和梅爾頻率倒譜的區(qū)別在于,梅爾頻率倒譜的頻帶劃分是在梅爾刻度上等距劃分的,它比用于正常的對數(shù)倒頻譜中的線性間隔的頻帶更能近似人類的聽覺系統(tǒng)。根據(jù)這一原則,研究者根據(jù)心理學(xué)實(shí) 驗(yàn)得到了類似于耳蝸?zhàn)饔玫囊唤M濾波器組,就是 Mel 頻率濾波器組。因?yàn)椴煌恼f話人聲道具有區(qū)別于他人的特異性特征,所以在實(shí)際信號分析中常采用預(yù)加重技 術(shù),即在對信號取樣之后,插入一個(gè)一階的高通濾波器,這樣,就加強(qiáng)了聲道部分的特征,便于對聲道參數(shù)進(jìn)行分析; Mel濾波的作用是利用同人耳聽覺特性相似的三角濾波器組對語音信號的幅度平方譜進(jìn)行平滑;對數(shù)操作 (lg)的用途至少有兩點(diǎn),其一是壓縮語音譜的動(dòng)態(tài)范圍,其二是將頻域中的乘性成分變成對數(shù)譜域中的加性成分,以便濾除乘性噪聲;離散余弦變換 (DCT)主要用來對不同頻段的頻譜成份進(jìn)行解相關(guān)處理,使得各向量之間相互獨(dú)立。 圖 以 8000HZ 為采樣頻率,將信號幅度作為特征參數(shù)來區(qū)分不同的信號。 蘭州理工大學(xué)畢業(yè)論文 19 第 4 章 語音倒譜的應(yīng)用 表征一 個(gè)人聲音個(gè)性的參數(shù)主要有反映聲道特性的共振峰頻率和反映聲門特性的基音參數(shù)。 )()()( 21 nxnxnx ?? (41) )()()()]([ 21 zXzXzXnxZ ??? (42) )(?)(?)(?)(ln)(ln)(ln 2121 zXzXzXzXzXzX ????? (43) )(?)(?)(?)](?)(?[)](?[ 212111 nxnxnxzXzXZzXZ ????? ?? (44) ( 2)第二個(gè)子系統(tǒng)對加性信號進(jìn)行所需要的線性處理(滿足線性疊加原理等) )](?)(?[)](?[)(? 21 nxnxLTInxLTIny ??? (45) ( 3)第三個(gè)子系統(tǒng)是逆特征系統(tǒng) D*1[],使其恢復(fù)為卷積性信號。然而,盡管語音信號的基音檢測有許多困難但由于它在語音信號處理中的重要作用,促使廣大學(xué)者爭相涉足。在語言的頭,尾部并不具有聲帶振動(dòng)那樣的周期性,對有些清濁音的過渡幀很難判定它應(yīng)屬于周期性或非周期性,從而就無法估計(jì)出基音周期。 4 倒譜法求基音周期 語音的倒譜是將語音的短時(shí)譜取對數(shù)后再進(jìn)行 IDFT 得到的,所以語音信號的周期性激勵(lì)反映在倒譜上 式是同樣周期的沖激。一般每隔 10~20ms 計(jì)算一次倒譜,這是因?yàn)樵谝话阏Z音中激勵(lì)參數(shù)是緩慢變化的。如果直接在語音頻譜提取共振峰頻率,誤差會很大。但在線性預(yù)測分析方法出現(xiàn)之前的頻譜包絡(luò)估計(jì)器中,出現(xiàn)虛假峰值是相當(dāng)普遍的現(xiàn)象。高音調(diào)語音(如女聲和童生)的諧波間隔比較寬,因而為頻譜包絡(luò)估值所提供的樣點(diǎn)比較少,所以譜包絡(luò)的估計(jì)就不夠精確。 2)相關(guān)處理法:這種方法在語音信號處理中廣泛使用,這是因?yàn)橄嚓P(guān)處理法抗波形的相位失真能力強(qiáng),另外它在硬件處理上結(jié)構(gòu)簡單。為了實(shí)現(xiàn)此搜索,語音幀數(shù)至少應(yīng)該等于 200點(diǎn)(即等于 20ms) 。 倒譜分析算法的原理 對語音信號利用倒譜解卷原理,可以得出激勵(lì)序列的倒譜,它具有與基音周期相同的周期,因此可以容易且精確地求出基音周期。倒譜的低時(shí)部分可以分析聲道、聲門和輻射信息,而高頻部分可用來分析激勵(lì)源信息。相鄰共振峰的頻率可能會靠的太近而難以分辨。共振峰信息包含在頻率包絡(luò)中,因此共振峰參數(shù)提取的關(guān)鍵是估計(jì) 自然語音頻譜包絡(luò),一般認(rèn)為譜包絡(luò)中的最大值就是共振峰 [13]。尋求一種實(shí)時(shí)實(shí)現(xiàn)共振峰頻率檢測的算法,在語音合成、語音識別、說話人識別等領(lǐng)域中有重要的應(yīng)用價(jià)值。先計(jì)算倒譜,然后在預(yù)期的基音周期附近尋找峰值。 4)基音周期變化 范圍較大,從低音男聲的 80Hz 直到女孩的 500Hz,這也給基音周期的檢測帶來了一定的困難。根據(jù)加窗的短時(shí)語音幀來估計(jì)基音周期,在語音編解碼器,語音識別,說話人確認(rèn)和辨認(rèn),對生理缺陷人的輔助系統(tǒng)等許多領(lǐng)域都是重要的一環(huán)。 1 基音檢測的概念 基音是指發(fā)濁音時(shí)聲帶振動(dòng)所引起的周期性 ,而聲帶振動(dòng)頻率的倒數(shù)就是基音周期。 蘭州理工大學(xué)畢業(yè)論文 20 圖 按照被處理的信號來分類,大體上可以分為乘積同態(tài)信號處理和卷積同態(tài)信號處理。由仿真結(jié)果可知,隨著信號采樣點(diǎn)數(shù)量的增多,相鄰點(diǎn)幅值差不斷減小,可以預(yù)測,當(dāng)采樣點(diǎn)取無窮多時(shí),其相鄰幅值差必趨于零,這與實(shí)際理論以及客觀事實(shí)相符合,故該仿真結(jié)果良好。采用 Matlab 的語音分析工具箱 VoiceBox,可以很容易地對語音進(jìn)行分幀處理。 Nk0 ? ( 318) 其中 x(n)為 輸入的語音信號 , N 表示傅立葉 變換的點(diǎn)數(shù)。 人的耳朵具有一些特殊的功能,這些功能使得人耳能夠從嘈雜的背景噪聲中,以及各種變異情況下聽到語音信息,這是因?yàn)槿说膬?nèi)耳基礎(chǔ)膜對外來信號會產(chǎn)生調(diào)節(jié)作用。 arg(X(z))=? ( 315) 如果僅對實(shí)部作逆 Z變換: |))X (z)(ln(|Z=c (n) 1 ( 316) 稱為“倒頻譜”,簡稱“倒譜”,也稱“倒頻”。 復(fù)倒譜和倒譜的定義 在離散信號 x(n)情況下,用 z變換表示復(fù)倒 譜,可以寫作 復(fù)倒譜可以利用同態(tài)系統(tǒng)中一種特定的特征系統(tǒng)來求得,如圖所示。目前比較成功的語言模型通常是采用統(tǒng)計(jì)語法的語言模型和基于規(guī)則語法結(jié)構(gòu)命令的語言模型。按音素分類,漢語輔音共有 22個(gè),單元音 13 個(gè),復(fù)元音 13 個(gè),復(fù)鼻尾音 16 個(gè)。必須根據(jù)不同語言的特點(diǎn)、識別系統(tǒng)詞匯量的大小決定識別單元 [10]的大小。從目前使用的情況來看, 梅爾 刻度式 倒頻譜 參數(shù)已逐漸取代原本常用的線性預(yù)測編碼導(dǎo)出的倒頻譜參數(shù),原因是它考慮了人類發(fā)聲與接收聲音的特性,具有更好的 魯棒性 ( Robustness)。特征參數(shù)提取的目的是對語音信號進(jìn)行分析處理,去掉與語音識別無關(guān)的 冗余信息 ,獲得影響語音識別的重要信息,同時(shí)對語音信號進(jìn)行壓縮。 單詞(句)單元廣泛應(yīng)用于中小詞匯語音識別系統(tǒng),但不適合大詞匯系統(tǒng),原因在于模型庫太龐大,訓(xùn)練模型任務(wù)繁重,模型匹配 算法 復(fù)雜,難以滿足實(shí)時(shí)性要求。無記憶的 矢量量化 包括樹形搜索的矢量量化和多級矢量量化 [8]??梢?HMM 合 理地模仿了這一過程,很好地描 述了語音信號的整體非平穩(wěn)性和局部平穩(wěn)性 ,是較理想的一種 語音模型 。 日本 學(xué)者 Itakura 提出了動(dòng)態(tài)時(shí)間規(guī)整 算法 (DTW DynamicTimeWarping)。 第二步,得到詞序列 : 根據(jù)第一步所得語音標(biāo)號序列得到一個(gè)語音基元 網(wǎng)格 ,從詞典得到有效的詞序列,也可結(jié)合句子的文法和語義同時(shí)進(jìn)行。隨著計(jì)算機(jī)與 數(shù)字信號處理器 運(yùn)算能力以及識別系統(tǒng)精度的提高,識別系統(tǒng)根據(jù)詞匯量大小進(jìn)行分類也不斷進(jìn)行變化。本文給出 基于倒譜的 語音特性的提取 算法設(shè)計(jì)及其實(shí)現(xiàn)。而根據(jù)所分析的參數(shù)不同,語音信號分析可分為時(shí)域,頻域,倒譜域等方法。 語音識別技術(shù)原理 語音信號處理雖然包括語音通信 [4],語音合成和語音識別等方面的內(nèi)容,但其基本前提和基礎(chǔ)是對語言信號進(jìn)行分析。 為了將 聲學(xué)模型 建模單元串映射到符號集,就需要發(fā)音詞典發(fā)揮作用 , 它實(shí)際上定義了映射的映射。發(fā)音詞典實(shí)際提供了聲學(xué)模型建模單元與語言模型建模單元間的映射。有時(shí)在分析處理之前必須把分析的語音信號部分從輸入信號中找出來,這就是語音信號的端點(diǎn)檢測。 語音信號的數(shù)字化與預(yù)處理 對模擬語音信號進(jìn)行量化和采樣,獲得數(shù)字化的語音信號;然后將含噪的語音信號通過去噪處理,得到干凈的語音信號后并通過預(yù)加重技術(shù)濾除低頻干擾,尤其是 50Hz 到 60Hz之間的工頻干擾,提升語音信號的高頻部分,而且它還具有消除直流漂移、抑制隨機(jī)噪聲和提升清音部分能量的作用。 蘭州理工大學(xué)畢業(yè)論文 5 第 2 章 語音識別技術(shù)基本理論 語音識別技術(shù),也被稱為 自動(dòng)語音識別 Automatic Speech Recognition, (ASR)[2], 其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。簡要對其進(jìn)行了分類研究,詳細(xì)說明了語音信號的數(shù)字化和預(yù)處理、語音識別技術(shù)的基本原理、技術(shù)模型、以及處理所使用的基本方法。我國語音識別技術(shù)的研究水平已經(jīng) 基本上和國外同步,在漢語語音識別技術(shù)上還有自己的特點(diǎn)與優(yōu)勢,并達(dá)到國際先進(jìn)水平。語音識別技術(shù)有一個(gè)很好的評估機(jī)制,那就是識別的準(zhǔn)確率,而這項(xiàng)指標(biāo)在 20 世紀(jì) 90 年代中后期實(shí)驗(yàn)室研究中得到了不斷提高。T 貝爾實(shí)驗(yàn)室的 Audry 系統(tǒng),它是第一個(gè)可以識別十個(gè)英文數(shù)字的語音識別系統(tǒng)。從而使電聲學(xué)和語言聲學(xué)的一些研究成果,擴(kuò)展到通信和廣播部門。 在語音信號處理中可以 常 用 倒譜域 來提取語音的共振峰 與基音頻率 ,用于語音識別。學(xué)習(xí)外語存在的主要問題是發(fā)音不準(zhǔn)確 ,傳統(tǒng)的外語教學(xué)方法有著種種不足之處。 倒譜的 MATLAB 實(shí)現(xiàn) ...................................................... 19 倒譜在同態(tài)信號處理系統(tǒng)的應(yīng)用 ........................................... 19 倒譜在基音檢測方面的應(yīng)用 ............................................... 21 倒譜在共振峰檢測方面的應(yīng)用 ............................................. 23 共振峰的概念 ..................................
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1