freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的優(yōu)秀很詳細(xì)很?chē)?yán)謹(jǐn)優(yōu)秀語(yǔ)音信號(hào)的采集與分析(編輯修改稿)

2025-01-12 09:51 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 物理量。具體振值用舍入法歸到靠近的量化電平上。 語(yǔ)音信號(hào)經(jīng)過(guò)預(yù)濾波和采樣后,由 A/ D變換器變換為二址制數(shù)字碼 。這種防混疊濾波通常與模數(shù)轉(zhuǎn)換器做在一個(gè)集成塊內(nèi),因此目前來(lái)說(shuō) ,語(yǔ)音信號(hào)的數(shù)字化的質(zhì)量還是有保證的。市面上購(gòu)買(mǎi)到的普通聲卡在這方面做的都很好,語(yǔ)音聲波通過(guò)話筒輸入到聲卡后直接獲得的是經(jīng)過(guò)防混疊濾波、 A/D 變換、量化處理的離散的數(shù)字信號(hào)。 在實(shí)際工作中,我們可以利用 windows 自帶的錄音機(jī)錄制語(yǔ)音文件 ,圖 23 是基于 PC河南農(nóng)業(yè)大學(xué)理學(xué)院本科 畢業(yè)論文 (設(shè)計(jì) ) 機(jī) 的語(yǔ)音信號(hào) 采集過(guò)程 ,聲卡可以完成語(yǔ)音波形的 A/D 轉(zhuǎn)換,獲得 WAVE 文件,為后續(xù)的處理儲(chǔ)備原材料。調(diào)節(jié)錄音機(jī)保存界面的“更改”選項(xiàng),可以存儲(chǔ)各種格式的 WAVE 文件。 圖 23 基于 PC 機(jī)的語(yǔ)音信 號(hào)采集過(guò)程 Figure 23 Voice PCbased signal acquisition process 采集到語(yǔ)音信號(hào)之后,需要對(duì)語(yǔ)音信號(hào) 進(jìn)行分析,如語(yǔ)音信號(hào)的時(shí)域分析、頻譜分析、語(yǔ)譜圖分析以及加噪濾波等 處理 。 第 3 章 語(yǔ)音信號(hào) 的 分析 語(yǔ)音信號(hào)分析 技術(shù) 語(yǔ)音信號(hào)分析是語(yǔ)音信號(hào)處理的前提和基礎(chǔ),只有分析出可表示語(yǔ)音信號(hào)本質(zhì)特征的參數(shù),才有可能利用這些參數(shù)進(jìn)行高效的語(yǔ)音通信、語(yǔ)音合成和語(yǔ)音識(shí)別等處理 [8]。而且,語(yǔ)音合成的音質(zhì)好壞,語(yǔ)音識(shí)別率的高低,也都取決于對(duì)語(yǔ)音信號(hào)分橋的準(zhǔn)確性 和精確性。因此語(yǔ)音信號(hào)分析在語(yǔ)音信號(hào)處理應(yīng)用中具有舉足輕重的地位。 貫穿于語(yǔ)音分析全過(guò)程的是“短時(shí)分析技術(shù)”。因?yàn)?,語(yǔ)音信號(hào)從整體來(lái)看其特性及表征其本質(zhì)特征的參數(shù)均是隨時(shí)間而變化的,所以它是一個(gè)非乎穩(wěn)態(tài)過(guò)程,不能用處理乎穩(wěn)信號(hào)的數(shù)字信號(hào)處理技術(shù)對(duì)其進(jìn)行分析處理。但是,由于不同的語(yǔ)音是由人的口腔肌肉運(yùn)動(dòng)構(gòu)成聲道某種形狀而產(chǎn)生的響應(yīng),而這種口腔肌肉運(yùn)動(dòng)相對(duì)于語(yǔ)音頻率來(lái)說(shuō)是非常緩慢的,所以從另一方面看,雖然語(yǔ)音倍號(hào)具有時(shí)變特性,但是在一個(gè)短時(shí)間范圍內(nèi) (一般認(rèn)為在 10~30ms 的短時(shí)間內(nèi) ),其特性基本保持不變即相對(duì) 穩(wěn)定,因面可以將其看作是一個(gè)準(zhǔn)穩(wěn)態(tài)過(guò)程,即語(yǔ)音信號(hào)具有短時(shí) 平 穩(wěn)性。所以任何語(yǔ)音信號(hào)的分析和處理必須建立在“短時(shí)”的基礎(chǔ)上.即進(jìn)行“短時(shí)分析”,將語(yǔ)音信號(hào)分為一段一段來(lái)分析其特征參數(shù),其中每一段稱(chēng)為一“幀”,幀長(zhǎng)一般取為 10~ 30ms。這樣,對(duì)于整體的語(yǔ)音信號(hào)來(lái)講,分 析 出的是由每一幀特征參數(shù)組成的特征參數(shù)時(shí)間序列。 根據(jù)所分析出的參數(shù)的性質(zhì)的不同,可將語(yǔ)音信號(hào)分析分為時(shí)域分析 、頻域分析、倒領(lǐng)域分析等; 時(shí)域分析方法具有簡(jiǎn)單、計(jì)算量小、物理意義明確等優(yōu)點(diǎn),但由于語(yǔ)音信號(hào)最重要的感知特性反映在功率譜中,而相位變化只 起著很小的作用,所以相對(duì)于時(shí)域分析來(lái)說(shuō) Windows 自帶的錄音機(jī) 聲音 麥克風(fēng) 聲卡 濾 波 采樣 A/D 轉(zhuǎn)換 Wav 河南農(nóng)業(yè)大學(xué)理學(xué)院本科 畢業(yè)論文 (設(shè)計(jì) ) 頻域分析更為重要。 本文將簡(jiǎn)要介紹時(shí)域分析、頻域分析以及語(yǔ)譜圖分析。 語(yǔ)音信號(hào)的時(shí)域分析 語(yǔ)音信號(hào)的時(shí)域分析就是分析和提取語(yǔ)音信號(hào)的時(shí)域參數(shù)。進(jìn)行語(yǔ)音分析時(shí),最先接觸到并且也是最直觀的是它的時(shí)域波形。語(yǔ)音信號(hào)本身就是時(shí)域信號(hào),因而時(shí)域分析是最早使用,也是應(yīng)用最廣泛的一種分析方法,這種方法直接利用語(yǔ)音信號(hào)的時(shí)域波形。時(shí)域分析通常用于最基本的參數(shù)分析及應(yīng)用,如語(yǔ)音的分割、預(yù)處理、大分類(lèi)等。這種分析方法的特點(diǎn)是: ① 表示語(yǔ)音信號(hào)比較直觀、物理 意義明確。 ② 實(shí)現(xiàn)起來(lái)比較簡(jiǎn)單、運(yùn)算且少 。 ③ 可以得到語(yǔ)音的一些重要的參數(shù)。④只使用示波器等通用設(shè)備,使用較為簡(jiǎn)單等。 語(yǔ)音信號(hào)的時(shí)域參數(shù)有短時(shí)能量、短時(shí)過(guò)零率、短時(shí)白相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)等,這是語(yǔ)音信號(hào)的一組最基本的短時(shí)參數(shù),在各種語(yǔ)音信號(hào)數(shù)字處理技術(shù)中都要應(yīng)用 [6]。在計(jì) 算這些參數(shù)時(shí)使用的一 般是方 窗 或漢明 窗 。 短時(shí)能量及短時(shí)平均幅度分析 設(shè)語(yǔ)音波形時(shí)域信號(hào)為 x(l)、加密分幀處理后得到的第 n 幀語(yǔ)音信號(hào)為 Xn(m),則 Xn(m)滿足下式: ( ) ( ) ( ) ( )nx m w m x n m m?? 01mN? ? ? (31) 1 0 ~ ( 1)( ) { mNmwm ???? , 0, 其 他 值 (32) 其中, n= 0, 1T, 2T,?,并且 N 為幀長(zhǎng), T 為幀移長(zhǎng)度。 設(shè) 第 n 幀語(yǔ)音信號(hào) Xn(m)的短時(shí)能量用 En 表示,則其計(jì) 算公式如下: 1 20 ()NnnmE x m???? (33) En 是一個(gè)度量語(yǔ)音信號(hào)幅度值變化的函數(shù),但它有一 個(gè)缺陷,即它對(duì)高電平非常敏感 (因?yàn)樗?計(jì)算時(shí)用的是信號(hào)的平方 )。為此可采用另一個(gè)度量語(yǔ)音信號(hào)幅度值變化的函數(shù).即短時(shí)平均幅度函數(shù) Mn, 它定義為: 10 ()NMnnm xm???? (34) Mn 也是一帕語(yǔ)音信號(hào)能量大小的表征,它與 En 的區(qū)別在于計(jì)算時(shí)小取樣值和大取樣值不會(huì)因取平方而造成較大差異,在某些應(yīng)用領(lǐng)域呻會(huì)帶來(lái)一些好處。 短時(shí)能量和短時(shí)平均幅度 函數(shù) 的主要用途有:①可以區(qū)分濁音段與清音段,因?yàn)闈嵋魰r(shí) En 值比清音時(shí)大的多。 ② 可以用來(lái)區(qū)分聲母與韻母的分界,無(wú)聲與有盧的分界,連字 (指河南農(nóng)業(yè)大學(xué)理學(xué)院本科 畢業(yè)論文 (設(shè)計(jì) ) 字之間無(wú)間隙 )的分界等。③作為一種超音段信息,用 于 語(yǔ)音識(shí)別 中 。 率 分析 短時(shí)過(guò) 零 率表示一幀語(yǔ)音中語(yǔ)音信號(hào)波形穿過(guò)橫軸 (零 電平 ) 的次數(shù)。過(guò) 零 分析是語(yǔ)音時(shí)域分析中最簡(jiǎn)單的一種 。 對(duì)于連續(xù)語(yǔ)音信號(hào),過(guò)零即意味著時(shí)域波 形通過(guò)時(shí)間軸;而對(duì)于離散信號(hào),如果相鄰的取樣值改變符號(hào)則稱(chēng)為過(guò)零。過(guò)零率就是樣本改變符號(hào)的次數(shù)。定義語(yǔ)音信號(hào) Xn( m) 的短時(shí)過(guò)零 率 Zn 為: ? ? ? ?101 s g n ( ) s g n ( 1 )2 Nn n nmZ x m x m??? ? ?? ( 35) 式中, sgn[ ]是符號(hào)函 數(shù),即: ? ? ?1,( 0 )1,( 0 )sg n x xx ???? ( 36) 在實(shí)際中求過(guò)零率參數(shù)時(shí),需要十分注意的一 個(gè)問(wèn)題是如果輸入信 號(hào)中包含有 50Hz 的工頻干擾或者 A/D 變換器的工作點(diǎn)有偏移 (這等效于輸入信號(hào)有直流偏移 ),往往會(huì)使計(jì)算的過(guò)零率參數(shù)很不 準(zhǔn) 確 。 為了解決前一個(gè)問(wèn)題, A/D 變換器前的防混疊帶通濾波器的低端截頻應(yīng)高于 50Hz,以有效地抑制電源干擾。對(duì)于后一個(gè)問(wèn)題除了可以采用低直流漂移器件外,也 可以在軟件上加以解決,這就是算出每一 幀的直流分 量 并予以濾除 。 對(duì)語(yǔ)音信號(hào)進(jìn)行分析,發(fā)現(xiàn)發(fā)濁音時(shí),盡管聲道有若干個(gè)共振峰,但由于聲門(mén)波引起譜的 高頻跌落,所以其話音能量約集中在 3kHz以下。而發(fā)清音時(shí),多數(shù)能量出現(xiàn)在較高頻率上。高頻就意味著高的平 均過(guò)零率,低頻意味著低的平均過(guò)零率,所以可以認(rèn)為濁音時(shí)具有較低的過(guò)零率,而清音時(shí)具有較高的過(guò)零率。當(dāng)然,這種高低僅是相對(duì)而言,并沒(méi)方精確的數(shù)值關(guān)系。 利用短時(shí)平均過(guò)零率還可以從背景噪聲中找出語(yǔ)音信號(hào),可用于判斷寂靜無(wú)聲段和有聲 段的起點(diǎn)和終點(diǎn)位置。在孤立詞的語(yǔ)音識(shí)別中,必須要在一 連串連續(xù)的語(yǔ)音信號(hào)中進(jìn)行適當(dāng)分割,用以確定一個(gè)一個(gè)單詞的語(yǔ)音信號(hào),即找出每一個(gè)單詞的開(kāi)始和終止位置,這在語(yǔ)音處理中是一個(gè)基本問(wèn)題。此時(shí),在背景噪聲較小時(shí)用平均能量識(shí)別較為有效,而在背景噪聲較大時(shí)用平均過(guò)零率識(shí)別較為有效。但是研究表明 ,在以某些音為開(kāi)始或結(jié)尾時(shí).如當(dāng)弱摩擦音 (如 [f]、 [h]等音素 )、弱燃破音 (如 [p]、 [t]、 [k]等 音素 )為語(yǔ)音的開(kāi)頭或結(jié)尾;以鼻音 (如[n]、 [m]等音素 )為語(yǔ)音的結(jié)尾時(shí).只用其中一個(gè)參量來(lái)判別語(yǔ)音的起點(diǎn)和終點(diǎn)是有困難的,必須同時(shí)使用這兩個(gè)參數(shù)。 圖 31 是用 Mtalab 仿真 一段語(yǔ)音信號(hào) 時(shí)域波形 的 短時(shí)能量和 短時(shí)平均過(guò)零率 。 河南農(nóng)業(yè)大學(xué)理學(xué)院本科 畢業(yè)論文 (設(shè)計(jì) ) 500 1000 1500 2021 2500 3000 3500 40001 0 . 500 . 51speech5 10 15 20 25 30 35 40 45010203040energy5 10 15 20 25 30 35 40 450102030zcr 圖 31 語(yǔ)音信號(hào)的短時(shí)能量和短時(shí)平均過(guò)零率 Figure 31 Shortterm speech signal energy and zerocrossing rate of the average shortterm 語(yǔ)音信號(hào)的頻域分析 語(yǔ)音信號(hào)的頻域分析就是分析語(yǔ)音信號(hào)的頻域持征。從 廣義 上講,語(yǔ)音信號(hào)的頻域分析包括語(yǔ)音信號(hào)的頻譜、 功率 譜、倒頻譜、頻譜包絡(luò)分析等,而常用的 頻域 分析方法有帶通濾波器組法、傅里葉變換法、線件預(yù)測(cè)法等幾種。本 文 介紹的是語(yǔ)音信號(hào)的傅里葉分析法 。因?yàn)檎Z(yǔ)音 波是一個(gè)非平穩(wěn)過(guò)程,因此適用于周期、瞬變或平穩(wěn) 隨機(jī)信號(hào)的標(biāo)準(zhǔn)傅里葉變換不能用來(lái)直接表示語(yǔ)音信號(hào), 而應(yīng)該用短時(shí)傅里葉變換對(duì)語(yǔ)音信號(hào)的頻譜進(jìn)行分析,相應(yīng)的頻譜稱(chēng)為“ 短時(shí) 譜 ” 短時(shí)博里葉變換求語(yǔ)音的短時(shí)譜 對(duì)第 n 幀語(yǔ)音信號(hào) Xn(m)進(jìn)行傅里葉變換 (離散時(shí)域傅里葉變換, DTFT),可得到短時(shí)傅里葉變換, 其定義如下: 10( ) ( )Njw jw nnnmX e x m e? ??? ? (37) 由定義可知,短時(shí)傅里葉變換實(shí)際就是 窗 選語(yǔ)音信號(hào)的標(biāo)準(zhǔn)傅里葉變換。這 里 ,窗 w(nm)是一個(gè)“滑動(dòng)的”窗口,它隨 n的變化而沿著序列 X(n)滑動(dòng)。由于窗口是有限長(zhǎng)度的,滿足絕對(duì)可和條件,所以這個(gè)變換是存在的。當(dāng)然窗口函數(shù)不 同,博里葉變換的結(jié)果也將不同。 我們還可以將式 (3— 27)寫(xiě)成另一種形式。設(shè)語(yǔ)音信號(hào)序列和 窗 口序列的標(biāo)準(zhǔn)傅早葉變換均存在。當(dāng) n 取固定值時(shí), w(nm)的傅里 葉 變換為: ( ) ( )jw n jw n jwm w n m e e W e? ? ? ?? ? ? ? ? ?? (38) 根據(jù)卷積定理, 有: 河南農(nóng)業(yè)大學(xué)理學(xué)院本科 畢業(yè)論文 (設(shè)計(jì) ) ( ) ( ) ( )jw jw jwn jwnX e X e e W e????? ? ??? (39) 因?yàn)樯鲜接疫厓蓚€(gè)卷積項(xiàng)均為關(guān)于角頻率 w 的以 2π為周期的連續(xù)函數(shù),所以也可將其寫(xiě)成以下的卷 積積分形式: ()1( ) ( ) ( )2j w j j n j wnX e W e e X e d? ? ? ?? ?? ? ? ? ???? ? ? ?? ? ( 310) 即,假設(shè) x(m)的 DTFT 是 ()jwXe , 且 ()wm 的 DTFT 是 ()jwWe , 那么 ()jwnXe 是 ()jwXe 和()jwWe 的的 周期 卷積。 根據(jù)信 號(hào)的時(shí)寬帶寬積為一常數(shù)這一基本性質(zhì),可知 ()jwWe 主瓣 寬度與窗口寬度成反比, N 越大, ()jwWe 的主瓣越窄。由式 (330)可知,為了使 ()jwnXe 忠實(shí)再現(xiàn) ()jwXe 的特性. ()jwWe 相對(duì)于 ()jwXe 來(lái)說(shuō)必須是 — 個(gè)沖激函數(shù)。所以為了使 ( ) ( )jw jwnX e X e? ,需N?? ;但是 N 值太大時(shí),倍號(hào)的分幀 又 失 去了意義 。尤其是 N大于語(yǔ)音的 音素 長(zhǎng)度時(shí) ,()jwnXe 已不能反映該語(yǔ)音 音素 的頻譜了。因此.應(yīng)折衷選擇 窗 的寬度 N。另外,窗的形狀也對(duì)短時(shí)博氏頻譜有影響,如矩形窗,雖然頻率分辨率很高 (即主辯狹窄尖銳 ),但由于第一旁瓣 的衰減很小,有較大的上下沖,采用矩形窗時(shí)求得的 ()jwnXe 與 ()jwXe 的偏差較大,這就是 Gibbs 效應(yīng),所以不適合用于 頻譜 成分很寬的語(yǔ)音分析中。而漢明窗在頻率范圍中的分辨率較高,而且旁辯的衰減大,具有頻譜泄漏少的優(yōu)點(diǎn).所以在求短時(shí)頻譜時(shí)一船采用具有較小上下沖的漢明 窗 [2]。 與離散傅里葉變換和連續(xù)博里葉變換的關(guān)系一 樣,如令角頻率 w=2πk/ N,則得離散的短時(shí)博里 葉 變換 (DFT).它實(shí)際上是 ()jwnXe 在頻域的取樣,如下所示: 22 10( ) ( ) ( ) ( 0 1 )k k mNjjNNn n nmX e X k x m e k N??? ??? ? ? ? ?? (311) 在語(yǔ)音信號(hào)數(shù)字處理中,都 是采用 ()nxm的離散博里葉變換 (DFT) ()nXk 來(lái)替代()jwnXe 并且可以用高效的快速傅里葉變換
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1