freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

語音信號時域分析畢業(yè)設計論文(編輯修改稿)

2024-08-19 17:41 本頁面
 

【文章內容簡介】 漢明窗: hH={? (2nπN?1)), 0 ≤ n ≤ N? 1 0, 其余值 () 下圖是兩個窗函數(shù)的時域波形: 圖 25 矩形窗幅度特性 圖 26 漢明窗時域波形 圖 27 漢明窗幅度特性 西安工程大學畢業(yè)設計(論文) 13 本章小結:本章主要討論語音信號處理前對語音信號的準備工作,包括采集、分類預處理。主要是為了為語音信號的時域分析做好必要的準備工作 。西安工程大學畢業(yè)設計(論文) 14 第 3 章 語音信號的時域分析 語音信號分析技術 語音信號分析是語音信號處理的前提和基礎,只有分析出可表示語音信號本質特征的參數(shù),才有可能利用這些參數(shù)進行高效的語音通信、語音合成和語音識別等處理。而且 ,語音合成的音質好壞,語音識別率的高低,也都取決于對語音信號 的準確性和精確性。因此語音信號分析在語音信號處理應用中具有舉足輕重的地位。 語 音信號平穩(wěn)性、時變、離散性大、且其中蘊含著說話內容及說話人特征 ,處理難度大 , 語音信號可用其取樣波形描述 ,也可用信號參數(shù)和特征來描述 。 提取少量參數(shù)描述語音信號 ,即語音信號的參數(shù)表示 ,是語音處理的關鍵技術之一 .根據(jù)所分析的參數(shù)不 同 ,語音信號分析分為時域、頻域、倒頻譜、小波域、高階積累量域等方法 .時域分析具有最簡單、運算量小、物理意義明確等優(yōu)點 。 . 貫穿于語音分析全過程的是“短時分析技術”。因為,語音信號從整體來看其特性及表征其本質特征的參數(shù)均是隨時間而變化的,所以它是一個介于穩(wěn)態(tài)過程,不能用處理平穩(wěn)信號的數(shù)字信號處理技術對其進行分析處理。但是,由于不同的語音是由人的口腔肌肉運動構成聲道某種形狀而產生的響應,而這種口腔肌肉運動相對于語音頻率來說是非常緩慢的,所以從另一方面看,雖然語音信號號具有時變特性,但是在一個短時間范圍內 (一般認 為在 10~ 30ms 的短時間內 ),其特性基本保持不變即相對穩(wěn)定,因面可以將其看作是一個準穩(wěn)態(tài)過程,即語音信號具有短時平穩(wěn)性。所以任何語音信號的分析和處理必須建立在“短時”的基礎上.即進行“短時分析”,將語音信號分為一段一段來分析其特征參數(shù),其中每一段稱為一“幀”,幀長一般取為 10~ 30ms。這樣,對于整體的語音信號來講,分析出的是由每一幀特征參數(shù)組成的特征參數(shù)時間序列。 根據(jù)所分析出的參數(shù)的性質的不同,可將語音信號分析分為時域分析、頻域分析、線性預測、同態(tài)處理分析等;時域分析方法具有簡單、計算量小、物理意義明 確等優(yōu)點,但由于語音信號最重要的感知特性反映在功率譜中,而相位變化只起著很小的作用,所以相對于時域分析來說頻域分析更為重要。本文將簡要介西安工程大學畢業(yè)設計(論文) 15 紹時域分析以及語譜圖分析。 語音信號的時域分析 語音信號的時域分析就是分析和提取語音信號的時域參數(shù)。進行語音分析時,最先接觸到并且也是最直觀的是它的時域波形。語音信號本身就是時域信號,因而時域分析是最早使用,也是應用最廣泛的一種分析方法,這種方法直接利用語音信號的時域波形。時域分析通常用于最基本的參數(shù)分析及應用,如語音的分割、預處理、大分類等。這種分析方法的特點是: ① 表示語音信號比較直觀、物理意義明確。 ② 實現(xiàn)起來比較簡單、運算且少。 ③ 可以得到語音的一些重要的參數(shù)。④只使用示波器等通用設備,使用較為簡單等。 語音信號的時域參數(shù)有短時能量、短時過零率、短時自相關函數(shù)和短時平均幅度差函數(shù)等,這是語音信號的一組最基本的短時參數(shù),在各種語音信號數(shù)字處理技術中都要應用。在計算這些參數(shù)時使用的一般是方窗或漢明窗。 短時能量及短時平均幅度分析 設語音波形時域信號為 x(l)、加密分幀處理后得到的第 n 幀語音信號為 Xn(m),則 Xn(m)滿足下式: ( ) ( ) ( ) ( )nx m w m x n m m?? 01mN? ? ? (31) 1 0 ~ ( 1)( ) { mNmwm ???? , 0, 其 他 值 (32) 其中, n= 0, 1T, 2T,?,并且 N 為幀長, T 為幀移長度。 設第 n幀語音信號 Xn(m)的短時能量用 En 表示,則其計算公式如下: 1 20 ()NnnmE x m???? (33) En 是一個度量語音信號幅度值變化的函數(shù),但它有一個缺陷,即它對高電平非常敏感 (因為它計算時用的是信號的平方 )。為此可采用另一個度量語音信號幅度值變化的函數(shù).即短時平均幅度函數(shù) Mn,它定義為: 10 ()NMnnm xm???? (34) Mn 也是一種語音信號能量大小的表征,它與 En 的區(qū)別在于計算時小取樣值西安工程大學畢業(yè)設計(論文) 16 和大取樣值不會因取平方而造成較大差異,在某些應用領域里會帶來一些好處。 短時 能量可以度量語音信號的能量隨時間的變化情況, 短時能量和短時平均幅度函數(shù)的主要用途有:①可以區(qū)分濁音段與清音段,因為濁音時 En值比清音時大的多。 ② 可以用來區(qū)分聲母與韻母的分界,無聲與有聲的分界,連字 (指字之間無間隙 )的分界等。③作為一種超音段信息,用于語音識別中。 下圖為不同的窗長對短時能量的影響 (語音信號為(‘西安工程大學’) 圖 31 幀數(shù)為 50 的 短時能量 圖 32 幀數(shù)為 100 的短時能量 西安工程大學畢業(yè)設計(論文) 17 圖 33 幀數(shù)為 200 的短時能量 圖 34 幀數(shù)為 400 的短時能量 短時過零率分析 短時過零率表示一幀語音中語音信號波形穿過橫軸(零電平)的次數(shù)。過零率分析是語音時域分析中最簡單的一種。對于連續(xù)語音信號,過零即意味著時域波形通過時間軸;而對于離散信號,如果相鄰的取樣值改變符號則稱為過零。過零率就是樣本改變符號的次數(shù)。定義語音信號 Xn( m) 的短時過零率 Zn 為: ? ? ? ?101 s g n ( ) s g n ( 1 )2 Nn n nmZ x m x m??? ? ?? ( 35) 式中, sgn [ ]是符號函數(shù),即: 西安工程大學畢業(yè)設計(論文) 18 ? ? ?1,( 0 )1,( 0 )sgn x xx ???? ( 36) 在實際中求過零率參數(shù)時,需要十分注意的一個問題是如果輸入信號中包含有 50Hz 的工頻干擾或者 A/D 變換器的工作點有偏移 (這等效于輸入信號有直流偏移 ),往往會使計算的過零率參數(shù)很不準確。為了解決前一個問題, A/D 變換器前的防混疊帶通濾波器的低端截頻應高于 50Hz,以有效地抑制電源干擾。對于后一個問題除了可以采用低直流漂移器件外,也可以在軟件上加以解決,這就是算出每一幀的直流分量并予以濾除。 短 時平均過零數(shù)可應用于語音信號分析,它粗略的描述了信號頻譜特性 ,因而可用于區(qū)分清 /濁音 .發(fā)現(xiàn)發(fā)濁音時,盡管聲道有若干個共振峰,但由于聲門波引起譜的高頻跌落,所以其話音能量約集中在 3kHz以下。而發(fā)清音時,多數(shù)能量出現(xiàn)在較高頻率上。高頻就意味著高的平均過零率,低頻意味著低的平均過零率,所以可以認為濁音時具有較低的過零率,而清音時具有較高的過零率。當然,這種高低僅是相對而言,并沒方精確的數(shù)值關系。 利用短時平均過零率還可以從背景噪聲中找出語音信號,可用于判斷寂靜無聲段和有聲段的起點和終點位置。在孤立詞的語音識別 中,必須要在一連串連續(xù)的語音信號中進行適當分割,用以確定一個一個單詞的語音信號,即找出每一個單詞的開始和終止位置,這在語音處理中是一個基本問題。此時,在背景噪聲較小時用平均能量識別較為有效,而在背景噪聲較大時用平均過零率識別較為有效。但是研究表明,在以某些音為開始或結尾時.如當弱摩擦音 (如 [f]、 [h]等音素 )、弱燃破音 (如 [p]、 [t]、 [k]等音素 )為語音的開頭或結尾;以鼻音 (如 [n]、 [m]等音素 )為語音的結尾時.只用其中一個參量來判別語音的起點和終點是有困難的,必須同時使用這兩個參數(shù)。圖 31 是 用 MATLAB 仿真一段語音信號時域波形的短時平均過零率。 (語音信號為‘西安工程大學’) 西安工程大學畢業(yè)設計(論文) 19 圖 35語音信號的短時平均過零率 短時平均幅度與短時過零率的分布特點分析 短時平均幅度(或短時能量)與短時過零率都是隨機變量。研究發(fā)現(xiàn),它們的概率分布決定語音的性質。對于無聲 .清音和濁音而言,它們的短時平均幅度的概率分布不僅是不同的,而且他們的短時過零率的概率分布也是不同的。設用p( M/S)表示無聲的短時平均幅度的概率分布,用 p( M/U)表示清音的短時平均幅度的概率分布,則用下圖給出了它們的分布曲線 。 西安工程大學畢業(yè)設計(論文) 20 短時自相關函數(shù)分析 相關分析師語音信號的時域波形常用的分析方法,利用短時自相關函數(shù)可以求得語音波形的基音周期;在用線性預測分析語音信號時,也要用到短時自相關函數(shù)。其定義如下: Rn(K)=∑ Xn(m)Xn( m +k)N?1?Km=0 ( 0< k≤ K) ⑴ 式中, K 為最大延遲點數(shù), N為幀長 。 短時自相關函數(shù)具有如下性質:①若語音信號時周期的,則其短時自相關函數(shù)也是周期的;②若語音信號時偶函數(shù),則取、其短時自相關函數(shù)也是偶函數(shù);③ k=0時,短時自相關函數(shù)具有最大值,這是它表示語音信號的能量或平均功率。 由上式不難看出,隨著延遲 k的增加,式中相加的乘積項將減少,則導致短時自相關函數(shù)的幅度值下降;如果幀長不夠,就難于準確的確定語音信號波形序列的基音周期。對上式進行適當修改,則有修正的短時自相關函數(shù); Rn( k) =∑ X’n(m)X′n( m+k)N?1m=0 ( 0﹤ k≤ K) ⑵ 式二中的語音信 號序列不再由式( 2) 表示,而進行如下修正; {X‘n(m) = X(n+ m)w’( m)w‘(m) = { 1 ( m≤ m ≤ N ?1+ K)0 (m 0, m ?? ?1 +??) 對 N 點窗的 K點短時自相關函數(shù),如直接計算,約需 KN次乘法和加法;對很多實際應用, K與 N均較大(如 K=250,N=401) .為此提出一些減少運算量的方法。如 FFT,這是由于自相關函數(shù)為功率譜的 IDFT。為避免自相關計算的混疊,需 2N 點 DFT(用 FFT 實現(xiàn)),其中有 N點數(shù)據(jù)由 N個零點取樣來補足。構成一個西安工程大學畢業(yè)設計(論文) 21 平方幅度約需 2N 次乘法,而 2N 點 FFT 需 2N ㏒ 2N 次乘法,得到所 有 N 點自相關函數(shù)。因而, FFT 方法所需乘法總數(shù)為 : NF =2 2N ㏒ 2N+2N 另一方面,目前 DSP 可在一個很短的指令周期內完成一次乘加運算,且為卷積運算設計了一些效率很高的運算指令,所以如采用 DSP 實現(xiàn)自相關運算,通常是直接計算反而更加簡單,而不必采用結構復雜的快速算法。 下圖為一段語音信號分別加矩形窗和漢明窗的短時自相關分析 (語音信號為“西安工程大學”): 圖 38加矩形窗后的自相關函數(shù) 短時平均幅度差函數(shù)分析 短時平均幅度差函數(shù)其定義為: Fn( k) =∑ |XnN?1?Km=0 (m) ?Xn(m +k)| ( 0< k≤ K) 如果語音信號具有周期性,則由上式表示的短時平均幅度差函數(shù)的極小值也會周期的出現(xiàn);也就是說,若語音信號是周期的,則其短時平均幅度差函數(shù)也是周期的;這一點與短時自相關函數(shù)類似,因此可以用它代替短時自相關函數(shù)來檢測語音波形序列的基音周期。而且,短時平均幅度差函數(shù)與短時自相關函數(shù)的關系為 : Fn( k) =√2β( k)【 Rn(0)Rn( k)】 1/2 對于不同
點擊復制文檔內容
研究報告相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1