freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

論文-語音信號(hào)的基音頻率提取算法研究-在線瀏覽

2025-08-07 23:07本頁面
  

【正文】 通特性,應(yīng)用最為廣泛 [7]。在這一節(jié)中,主要對(duì)短時(shí)能量、短時(shí)平均過零率等特征及它們的應(yīng)用加以介紹。通常是將語音信號(hào)轉(zhuǎn)換成電信號(hào),再用 A/D 轉(zhuǎn)換器將其轉(zhuǎn)換成離散的數(shù)字信號(hào),然后存入計(jì)算機(jī)內(nèi)存中 [2]。采樣頻率為 8000Hz,采樣后進(jìn)行 16 位量化。從圖中可以看出,雖然無法辨別語音波形的細(xì)節(jié),但可以看出語音能量的起伏,以及語音信號(hào)隨時(shí)間變化的過程??梢钥闯?,這段語音信號(hào)具有很強(qiáng)的準(zhǔn)周期性,且具有較大的振幅。圖 c 是 /K/輔音的展開圖。 (a)語音信號(hào)“開始”的確時(shí)域波形 (b)元音 部分 /a/展開波形 (c)輔音部分 /k/的展開波形 圖 4 語音信號(hào)“開始”的時(shí)域波形及其展開圖 短時(shí)能量分析 語音信號(hào)的能量隨時(shí)間變化比較明顯,一般清音部分的能量比濁音的能量小得多。對(duì)方案論證 第 11 頁 (共 45 頁 ) 于信號(hào) {x(n)},短時(shí)能量的定義如下: ∞ ∞ En= ∑ [x(m)w(nm)]^2= ∑ x^2(m)h(nm)=x^2(n)*h(n) (33) m=∞ m=∞ 式 41 中 h(n)=w^2(n), En 表示在信號(hào)的第 n 個(gè)點(diǎn)開始加窗函數(shù)時(shí)的短時(shí)能量。為了反映窗函數(shù)的選擇對(duì)短時(shí)能量的影響 , 假設(shè)式 (21)中 h(n)非常長(zhǎng),且為恒定幅度,那么 En 隨時(shí)間的變化將變?yōu)楹苄?,這樣的窗函數(shù)等效為很窄的低通濾波器。因此出現(xiàn)了窗長(zhǎng)選取上的矛盾,這種矛盾將在語音信號(hào)的短時(shí)表示方法的研究中反復(fù)出現(xiàn)。如果用 xw (n) 表示 x (n) 經(jīng)過加窗處 理后的信號(hào),窗函數(shù)的長(zhǎng)度為 N,則短時(shí)能量可表示為: n+N1 En = ∑ x w^2(m) (34) m=n 短時(shí)能量主要有以下幾個(gè)方面的應(yīng)用:首先利用短時(shí)能量可區(qū)分清音和濁音,因?yàn)? 濁音的能量要比清音的能量要大得多;其次可以用短時(shí)能量對(duì)有聲段和無聲段進(jìn)行判定,對(duì)聲母和韻母分界,以及對(duì)連字分界等。解決這個(gè)問 題的方法是采用短時(shí)平均幅度值來表示能量的變語音信號(hào)的基音頻率提取算法研究 第 12 頁 (共 45 頁 ) 化。顧名思義,它是指每幀內(nèi)信號(hào)通過零值的次數(shù)。對(duì)于離散信號(hào),短時(shí)平均過零率實(shí)質(zhì)上就是信號(hào)采樣點(diǎn)符號(hào)變化的次數(shù)。短時(shí)平均過零率的公式為: ∞ Zn=1/2 ∑ |sgn[x(m)]sgn[x(m1)]| w(nm) (36) ∞ 其中: 1 , x(n)≥ 0 sgn[x(n)]= (37) 1, x(n)< 0 短時(shí)平均過零率可以用于語音信號(hào)分析。盡管聲道有若干個(gè)共振峰,但由于聲門的影響,其能量分布主要集中在 3KHz 頻率范圍內(nèi);反之,在清音段聲帶不振動(dòng)。由于短時(shí)平均過零率可以在一定程度上反映頻率的高低,因此在濁音段一般有較低的過零率,而在清音段具有較高的過零率,這樣就可以用短時(shí)平均過零率來初步判斷清音和濁音。其中共振峰就是一個(gè)典型的頻域參數(shù),它可以決定信號(hào)頻譜的總體輪廓或包絡(luò)。 在語音的發(fā)音過程中,聲道通常都處于運(yùn)動(dòng)狀態(tài),這個(gè)運(yùn)動(dòng)狀態(tài)的時(shí)變過程同振動(dòng) 過程相比要緩慢得多,因此一般假設(shè)語音信號(hào)是一種短時(shí)平穩(wěn)信號(hào),在一個(gè)很短的時(shí)間內(nèi) (10ms30ms)是相對(duì)平穩(wěn)的, 但在長(zhǎng)時(shí)間的周期中語音信號(hào)的特性會(huì)發(fā)生變化,這種變化的不同決定了產(chǎn)生語音的不同。圖 6 中給出了“開始”中 /a/的頻譜特性。這里短時(shí)分析采用漢明窗,進(jìn)行頻譜分析的窗長(zhǎng)為 300 個(gè)采樣點(diǎn)。因此,頻譜分析是認(rèn)識(shí)語音信號(hào)和處理語音信號(hào)的重要方法。 常用的頻域分析方法有帶通濾波器組法、傅立葉變換法、和線性預(yù)測(cè)法等,傅立葉分析是分析線性系統(tǒng)和平穩(wěn)信號(hào)穩(wěn)態(tài)特性的強(qiáng)有力手段,傅立葉變換可以將信號(hào)分解為各個(gè)不同頻率分量的組合,從而把信號(hào)的時(shí)域特征和頻域特征聯(lián)系起來。為了能夠分析和處理非平穩(wěn)信號(hào),人們對(duì)傅立葉變換進(jìn)行改進(jìn)提出了倒譜法,倒譜法是將對(duì)數(shù)功率譜進(jìn)行反傅立葉變化后得到的,它可以進(jìn)一步將聲道特性和激勵(lì)特性有效地分開,因此可以更好的 揭示語音信號(hào)的本質(zhì)特征。 幾種典型的基音檢測(cè)算法分析 準(zhǔn)確地檢測(cè)語音信號(hào)的基音周期,對(duì)于高質(zhì)量的語音分析與合成、語音壓縮編碼、語音識(shí)別和說話者確認(rèn)等方面具有重要的意義 [2]。因此,很難從復(fù)雜多樣的語音信號(hào)中提取僅和聲門振動(dòng)有關(guān)的音源信息。 本章節(jié)將對(duì)自相關(guān)函數(shù)法、平均幅度差函數(shù)法、小波變換法、倒譜法這四種傳統(tǒng)的基音周期估計(jì)方法的原理進(jìn)行分析。因此檢測(cè)自相關(guān)函數(shù)是否有峰值,就可以判斷是清 音還是濁音,且兩相鄰峰值之間對(duì)應(yīng)的時(shí)間段就是基音周期。 sw(n)的自相關(guān)函數(shù)稱為語音信號(hào) s(n)的短時(shí)自相關(guān)函數(shù),用 Rw(k )表示,它的計(jì)算分式為: ∞ Nk1 Rw(k) = ∑ sw(n)sw(n+k) = ∑ sw(n)sw(n+k) (38) n=∞ n=0 由短時(shí)自相關(guān)函數(shù)的定義可以看出其所具有的一些性質(zhì):① k=0 時(shí)函數(shù)取得最大值, 此 時(shí),自相關(guān)函數(shù)的取值就是該信號(hào)的短時(shí)能量;②如果原序列是周期為T的周期信號(hào),那么自相關(guān)函數(shù)也是周期為T的周期函數(shù)。但有時(shí)第一最大峰值位置并不一定與基音周期吻合。這是因?yàn)檎Z音信號(hào)包含豐富的諧波分量。同時(shí),由聲道特性決定的語音信號(hào)的第一共振峰通常在 3001000Hz 的范圍內(nèi),這樣就有可能導(dǎo)致語音的第 28 個(gè)諧波分量的幅度高于基頻分量。 語音信號(hào)的基音頻率提取算法研究 第 16 頁 (共 45 頁 ) 為了減少共振峰的影響,需要進(jìn)行一些前期的預(yù)處理。一般取最大信號(hào)幅度 60%~70%。經(jīng)過中心削波后只保留超過削波電平的部分,其結(jié)果是削去了許多和聲道響應(yīng)有關(guān)的波動(dòng)。 其削波特性如下: 圖 8 中心削波函數(shù) 方案論證 第 17 頁 (共 45 頁 ) 下圖畫出了未削波與削波后計(jì)算自相關(guān)函數(shù)的波形。這樣處理后的信號(hào)基本就只含有第一共振峰一下的基波和諧波分量。如圖所示原始信號(hào)的自相關(guān)函數(shù)和經(jīng)過 900Hz 低通濾波后的波形圖。但計(jì)算自 相關(guān)函數(shù)的運(yùn)算量很大,其原因是乘法運(yùn)算所需要的時(shí)間較長(zhǎng)。為了避免乘法運(yùn)算,常常采用另一種與自相關(guān)有類似作用的參量,即短時(shí)平均幅度差函數(shù) (AMDF)。 Tp,177。 Tp, 177。即當(dāng) k 與信號(hào)周期吻合時(shí),作為 d(n)的短時(shí)平均幅度值總是很小,因此短時(shí)平均幅度差函數(shù)的定義為: Nk1 Fn(k) = ∑ | Sw(n+k) Sw(n) | (311) n=0 由上式可知,對(duì)于周期性的 d(n), Fn(k) 也呈現(xiàn)周期性。因此在濁音信號(hào)的語音周期內(nèi), Fn(k) 值迅速下降,而在清音語音時(shí),不會(huì)有明顯的下降。而且計(jì)算上比短時(shí)自相關(guān)函數(shù)方法更為簡(jiǎn)單。同時(shí), AMDF 函數(shù)在基音周期點(diǎn)的谷值比自相關(guān)函數(shù)的峰值更加尖銳,因此錯(cuò)判率相對(duì)較小,穩(wěn)分建性更高。 小波變換法 小波變換是 20 世紀(jì) 80 年代中后期逐漸發(fā)展起來的一種數(shù)學(xué)分析方法?!靶 敝钙渌p性,“波”指其波動(dòng)性,小波理論采用多辯率分析的思想,非均勻地劃分時(shí)頻空間,這使得小波變換在非平穩(wěn)信號(hào)的分析和處理中發(fā)揮著重要的作用。下面將主要介紹其在基音檢測(cè)方面的應(yīng)用。一般地,平滑函數(shù)的能量通常集中在低頻段,所以, 平滑函數(shù)可看成低通濾波器的系統(tǒng)響應(yīng)函數(shù)。 由小波變換與信號(hào)奇異性的關(guān)系可知,如果選擇小波函數(shù)為平滑函數(shù)的一階導(dǎo)數(shù),則小波變換 Wf (s,x)的模極大值點(diǎn)對(duì)應(yīng)于 f (x)的突變點(diǎn) (奇異點(diǎn) )。 語音信號(hào)的基音頻率提取算法研究 第 20 頁 (共 45 頁 ) 圖 12 濁音段小波變換波形法進(jìn)行基音檢測(cè) 根據(jù)小 波變換的最大級(jí)數(shù)確定公式 I= log2(f s/ f 0),其中 f s 為信號(hào)的采樣頻率, f 0為欲在信號(hào)中保留的最高頻率。大多數(shù)的語音樣本,在采用小波變換階數(shù)為 5 或 6,連續(xù)進(jìn)行五級(jí)變換,一般可以得到滿意的分析效果。而小波變換法恰恰改正了這一固有的弱點(diǎn),它能動(dòng)態(tài)地隨語音信號(hào)的周期性變化而變化,不會(huì)因?yàn)檎Z音的準(zhǔn)周期性或某一段無周期性而影響提取效果。但當(dāng)檢測(cè)被噪聲污染的語音信號(hào)時(shí),隨著信噪比的減小,利用小波變換進(jìn)行基音檢測(cè)的誤差越來越大。在語音信號(hào)處理的實(shí)際應(yīng)用中,很多場(chǎng)合需要根據(jù)語 音信號(hào)反過來求解聲門信號(hào)或聲道沖激響應(yīng)。由于語音信號(hào)進(jìn)行同態(tài)分析后得到的是語音信號(hào)的倒譜參數(shù),因此同態(tài)分析也叫倒譜分析 [21]。我 們稱中的時(shí)域序列 x(n )為信號(hào)序列 x(n )的“復(fù)倒頻譜”,簡(jiǎn)稱“復(fù)倒譜”,也叫 做對(duì)數(shù) 復(fù)倒譜。又注意到,有 語音信號(hào)的基音頻率提取算法研究 第 22 頁 (共 45 頁 ) X^(z) = ln(X(z)) = ln(|X(z)|ejθ ) = ln(|X(z)|) – jθ,θ =argX(z) (321) 如果僅對(duì) X ^(z)實(shí)部作逆 Z 變換: c(n) = Z[ ln|Z[x(n)]|] 稱 c(n)為“倒頻譜”,簡(jiǎn)稱“倒譜”,也稱“倒頻”。 在絕大多數(shù)的應(yīng)用場(chǎng)合,特征系統(tǒng)和逆特征系統(tǒng)中的正反 Z 變換都可以用正反離散傅里葉變換來代替,此時(shí)倒譜的定義變?yōu)? c(n) = IDFT{ln|DFT[s(n)]|} (322) (a) 清音段倒譜圖 (b) 濁音段倒譜圖 圖 13 清音段與濁音段倒譜圖比較 在頻域內(nèi),語音信號(hào)的短時(shí)譜等于激勵(lì)源頻譜與濾波器頻譜的乘積,濁音信號(hào)的短時(shí)譜中 包含的快變化的周期性細(xì)致結(jié)構(gòu),必定對(duì)應(yīng)著周期性脈沖激勵(lì)的基頻和各次諧波。借此, 可從倒譜波形中估計(jì)出基音周期。過程論述 第 23 頁 (共 45 頁 ) 4 過程論述 基于 MATLAB 的基音測(cè)檢方法的實(shí)現(xiàn)與分析 軟件簡(jiǎn)介 MATLAB 是 Math Works 公司于 1982 年推出的一套高性能的數(shù)值計(jì)算和可視化軟件,它集數(shù)值分析、矩陣運(yùn)算、信號(hào)處理和 圖形顯示于一體,構(gòu)成了一個(gè)方便的、界面友好的用戶環(huán)境。主要涉及信號(hào)處理,控制系統(tǒng)、神經(jīng)網(wǎng)絡(luò)、圖像處理、魯棒性控制、非線性系統(tǒng)控制設(shè)計(jì)、系統(tǒng)辨識(shí)等工具箱,這些工具箱給各個(gè)領(lǐng)域的研究和工程提供了有力的工具。 自相關(guān)函數(shù)法進(jìn)行基音檢測(cè) 本實(shí)驗(yàn)的目的是找出一種能運(yùn)用自相關(guān)函數(shù)法準(zhǔn)確檢測(cè)出一幀語音信號(hào)基音周期 的算法,并測(cè)試此算法的抗噪能力。 本文所有實(shí)驗(yàn)均以采樣頻率為 10KHz、精度為 16 比特的 wav 文件作為聲源。因此,濁音信號(hào)可能含有三四十次諧波分量,而其基波分量往往不是最強(qiáng)的分量。為了提高檢測(cè)的準(zhǔn)確度,實(shí)驗(yàn)中引入了一個(gè) 900Hz 低通濾波模塊濾除語音幀的高次諧波分量。因?yàn)橐粠Z音信號(hào)有 300 個(gè)采樣點(diǎn),所以短時(shí)加窗處理時(shí)的窗函數(shù)的長(zhǎng)度也是 300。 (a) 窗長(zhǎng)為 150 的自相關(guān)函數(shù) (b) 窗長(zhǎng)為 300 的自相關(guān)函數(shù) 過程論述 第 25 頁 (共 45 頁 ) (c) 窗長(zhǎng)為 512 的自相關(guān)函數(shù) 圖 15 窗函數(shù) N 值的不同對(duì)基音周期檢測(cè)的影響 上圖采樣頻率為 10kHz 時(shí),一幀語音信號(hào)分別選取 150、 300、 512 樣點(diǎn)時(shí)短時(shí)自相關(guān)函數(shù)的波形圖。 實(shí)驗(yàn)過程及仿真結(jié)果 本次實(shí)驗(yàn)用短時(shí)自相關(guān)函數(shù)法共做了四次實(shí)驗(yàn)仿真。實(shí)驗(yàn)結(jié)果如下: 語音信號(hào)的基音頻率提取算法研究 第 26 頁 (共 45 頁 ) (1) 原始信號(hào)的自相關(guān)分析 (2) 低通濾波后的自相關(guān)分析 對(duì)比圖 (1)和圖 (2)可以看出原始信號(hào)波形不光滑,含有較多的高頻分量其自相關(guān)函數(shù)波形也不夠光滑,經(jīng)低通濾波后變得光滑,波形沒有較多的突變,但峰值仍然不夠尖銳。 (4) 加噪 (強(qiáng)度為 )后的自相關(guān)分析 (5) 加噪 (強(qiáng)度為 )后的自相關(guān)分析 語音信號(hào)的基音頻率提取算法研究 第 28 頁 (共 45 頁 )
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1