freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計(jì)基于dsp的語(yǔ)音信號(hào)處理系統(tǒng)設(shè)計(jì)(編輯修改稿)

2025-07-16 19:16 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 程,不能用處理平穩(wěn)信號(hào)的數(shù)字信號(hào)處理技術(shù)對(duì)其進(jìn)行分析處理。但是,由于不同的語(yǔ)音是由人的口腔肌肉運(yùn)動(dòng)構(gòu)成聲道某種形狀而產(chǎn)生的響應(yīng),而這種口腔肌肉運(yùn)動(dòng)相對(duì)于語(yǔ)音頻率來(lái)說(shuō)是非常緩慢的,所以從另一方面看,雖然語(yǔ)音信號(hào)具有時(shí)變特性,但是在一個(gè)短時(shí)間范圍內(nèi)(一般認(rèn)為在10~30ms的短時(shí)間內(nèi)),其特性基本保持不變即相對(duì)穩(wěn)定,因而可以將其看作是一個(gè)準(zhǔn)穩(wěn)態(tài)過(guò)程,即語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)性。所以任何語(yǔ)音信號(hào)的分析和處理必須建立在“短時(shí)”的基礎(chǔ)上.即進(jìn)行“短時(shí)分析”,將語(yǔ)音信號(hào)分為一段一段來(lái)分析其特征參數(shù),其中每一段稱為一“幀”,幀長(zhǎng)一般取為10~30ms。這樣,對(duì)于整體的語(yǔ)音信號(hào)來(lái)講,分析出的是由每一幀特征參數(shù)組成的特征參數(shù)時(shí)間序列。根據(jù)所分析出的參數(shù)的性質(zhì)的不同,可將語(yǔ)音信號(hào)分析分為時(shí)域分析、頻域分析、倒頻域分析等;時(shí)域分析方法具有簡(jiǎn)單、計(jì)算量小、物理意義明確等優(yōu)點(diǎn),但由于語(yǔ)音信號(hào)最重要的感知特性反映在功率譜中,而相位變化只起著很小的作用,所以相對(duì)于時(shí)域分析來(lái)說(shuō)頻域分析更為重要。本文將簡(jiǎn)要介紹時(shí)域分析、頻域分析以及語(yǔ)譜圖分析。 語(yǔ)音信號(hào)的時(shí)域分析語(yǔ)音信號(hào)的時(shí)域分析就是分析和提取語(yǔ)音信號(hào)的時(shí)域參數(shù)。進(jìn)行語(yǔ)音分析時(shí),最先接觸到并且也是最直觀的是它的時(shí)域波形。語(yǔ)音信號(hào)本身就是時(shí)域信號(hào),因而時(shí)域分析是最早使用,也是應(yīng)用最廣泛的一種分析方法,這種方法直接利用語(yǔ)音信號(hào)的時(shí)域波形。時(shí)域分析通常用于最基本的參數(shù)分析及應(yīng)用,如語(yǔ)音的分割、預(yù)處理、大分類等。這種分析方法的特點(diǎn)是:表示語(yǔ)音信號(hào)比較直觀、物理意義明確。實(shí)現(xiàn)起來(lái)比較簡(jiǎn)單、運(yùn)算且少。可以得到語(yǔ)音的一些重要的參數(shù)。只使用示波器等通用設(shè)備,使用較為簡(jiǎn)單等。語(yǔ)音信號(hào)的時(shí)域參數(shù)有短時(shí)能量、短時(shí)過(guò)零率、短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)等,這是語(yǔ)音信號(hào)的一組最基本的短時(shí)參數(shù),在各種語(yǔ)音信號(hào)數(shù)字處理技術(shù)中都要應(yīng)用。在計(jì)算這些參數(shù)時(shí)使用的一般是矩形窗或漢明窗。 短時(shí)能量及短時(shí)平均幅度分析設(shè)語(yǔ)音波形時(shí)域信號(hào)為x(l)、加密分幀處理后得到的第n幀語(yǔ)音信號(hào)為 Xn(m),則Xn(m)滿足下式: 其中,n=0,1T,2T,…,并且N為幀長(zhǎng),T為幀移長(zhǎng)度。設(shè)第n幀語(yǔ)音信號(hào)Xn(m)的短時(shí)能量用En表示,則其計(jì)算公式如下:En是一個(gè)度量語(yǔ)音信號(hào)幅度值變化的函數(shù),但它有一個(gè)缺陷,即它對(duì)高電平非常敏感(因?yàn)樗?jì)算時(shí)用的是信號(hào)的平方)。為此可采用另一個(gè)度量語(yǔ)音信號(hào)幅度值變化的函數(shù).即短時(shí)平均幅度函數(shù)Mn,它定義為: Mn也是一幀語(yǔ)音信號(hào)能量大小的表征,它與En的區(qū)別在于計(jì)算時(shí)小取樣值和大取樣值不會(huì)因取平方而造成較大差異,在某些應(yīng)用領(lǐng)域也會(huì)帶來(lái)一些好處。短時(shí)能量和短時(shí)平均幅度函數(shù)的主要用途有:①可以區(qū)分濁音段與清音段,因?yàn)闈嵋魰r(shí)En值比清音時(shí)大的多。②可以用來(lái)區(qū)分聲母與韻母的分界,無(wú)聲與有聲的分界,連字(指字之間無(wú)間隙)的分界等。③作為一種超音段信息,用于語(yǔ)音識(shí)別中。短時(shí)過(guò)零率表示一幀語(yǔ)音中語(yǔ)音信號(hào)波形穿過(guò)橫軸(零電平)的次數(shù)。過(guò)零分析是語(yǔ)音時(shí)域分析中最簡(jiǎn)單的一種。對(duì)于連續(xù)語(yǔ)音信號(hào),過(guò)零即意味著時(shí)域波形通過(guò)時(shí)間軸;而對(duì)于離散信號(hào),如果相鄰的取樣值改變符號(hào)則稱為過(guò)零。過(guò)零率就是樣本改變符號(hào)的次數(shù)。定義語(yǔ)音信號(hào)Xn(m)的短時(shí)過(guò)零率Zn為:式中,sgn[ ]是符號(hào)函數(shù),即:在實(shí)際中求過(guò)零率參數(shù)時(shí),需要十分注意的一個(gè)問(wèn)題是如果輸入信號(hào)中包含有50Hz的工頻干擾或者A/D變換器的工作點(diǎn)有偏移(這等效于輸入信號(hào)有直流偏移),往往會(huì)使計(jì)算的過(guò)零率參數(shù)很不準(zhǔn)確。為了解決前一個(gè)問(wèn)題,A/D變換器前的防混疊帶通濾波器的低端截頻應(yīng)高于50Hz,以有效地抑制電源干擾。對(duì)于后一個(gè)問(wèn)題除了可以采用低直流漂移器件外,也可以在軟件上加以解決,這就是算出每一幀的直流分量并予以濾除。對(duì)語(yǔ)音信號(hào)進(jìn)行分析,發(fā)現(xiàn)發(fā)濁音時(shí),盡管聲道有若干個(gè)共振峰,但由于聲門波引起功率譜的高頻跌落,所以其話音能量約集中在3kHz以下。而發(fā)清音時(shí),多數(shù)能量出現(xiàn)在較高頻率上。高頻就意味著高的平均過(guò)零率,低頻意味著低的平均過(guò)零率,所以可以認(rèn)為濁音時(shí)具有較低的過(guò)零率,而清音時(shí)具有較高的過(guò)零率。當(dāng)然,這種高低僅是相對(duì)而言,并沒(méi)有精確的數(shù)值關(guān)系。利用短時(shí)平均過(guò)零率還可以從背景噪聲中找出語(yǔ)音信號(hào),可用于判斷寂靜無(wú)聲段和有聲段的起點(diǎn)和終點(diǎn)位置。在孤立詞的語(yǔ)音識(shí)別中,必須要在一連串連續(xù)的語(yǔ)音信號(hào)中進(jìn)行適當(dāng)分割,用以確定一個(gè)一個(gè)單詞的語(yǔ)音信號(hào),即找出每一個(gè)單詞的開(kāi)始和終止位置,這在語(yǔ)音處理中是一個(gè)基本問(wèn)題。此時(shí),在背景噪聲較小時(shí)用平均能量識(shí)別較為有效,而在背景噪聲較大時(shí)用平均過(guò)零率識(shí)別較為有效。但是研究表明,在以某些音為開(kāi)始或結(jié)尾時(shí)。如當(dāng)弱摩擦音(如[f]、[h]等音素),弱爆破音(如[p]、[t]、[k]等音素)為語(yǔ)音的開(kāi)頭或結(jié)尾;以鼻音(如[n]、[m]等音素)為語(yǔ)音的結(jié)尾時(shí)。只用其中一個(gè)參量來(lái)判別語(yǔ)音的起點(diǎn)和終點(diǎn)是有困難的,必須同時(shí)使用這兩個(gè)參數(shù)。圖31是用Mtalab仿真一段語(yǔ)音信號(hào)時(shí)域波形的短時(shí)能量和短時(shí)平均過(guò)零率。 圖31語(yǔ)音信號(hào)的短時(shí)能量和短時(shí)平均過(guò)零率 語(yǔ)音信號(hào)的頻域分析語(yǔ)音信號(hào)的頻域分析就是分析語(yǔ)音信號(hào)的頻域持征。從廣義上講,語(yǔ)音信號(hào)的頻域分析包括語(yǔ)音信號(hào)的頻譜、功率譜、倒頻譜、頻譜包絡(luò)分析等,而常用的頻域分析方法有帶通濾波器組法、傅里葉變換法、線性預(yù)測(cè)法等幾種。本文介紹的是語(yǔ)音信號(hào)的傅里葉分析法。因?yàn)檎Z(yǔ)音波是一個(gè)非平穩(wěn)過(guò)程,因此適用于周期、瞬變或平穩(wěn)隨機(jī)信號(hào)的標(biāo)準(zhǔn)傅里葉變換不能用來(lái)直接表示語(yǔ)音信號(hào),而應(yīng)該用短時(shí)傅里葉變換對(duì)語(yǔ)音信號(hào)的頻譜進(jìn)行分析,相應(yīng)的頻譜稱為“短時(shí)譜”。對(duì)第n幀語(yǔ)音信號(hào)Xn(m)進(jìn)行傅里葉變換(離散時(shí)域傅里葉變換,DTFT),可得到短時(shí)傅里葉變換,其定義如下: (31)由定義可知,短時(shí)傅里葉變換實(shí)際就是窗選語(yǔ)音信號(hào)的標(biāo)準(zhǔn)傅里葉變換。這里,窗w(nm)是一個(gè)“滑動(dòng)的”窗口,它隨n的變化而沿著序列X(n)滑動(dòng)。由于窗口是有限長(zhǎng)度的,滿足絕對(duì)可和條件,所以這個(gè)變換是存在的。當(dāng)然窗口函數(shù)不同,博里葉變換的結(jié)果也將不同。我們還可以將式(3—1)寫成另一種形式。設(shè)語(yǔ)音信號(hào)序列和窗口序列的標(biāo)準(zhǔn)傅里立葉變換均存在。當(dāng)n取固定值時(shí),w(nm)的傅里葉變換為: (32)根據(jù)卷積定理,有: (33)因?yàn)樯鲜接疫厓蓚€(gè)卷積項(xiàng)均為關(guān)于角頻率w的以2π為周期的連續(xù)函數(shù),所以也可將其寫成以下的卷積積分形式: (34)即,假設(shè)x(m)的DTFT是,且的DTFT是,那么是和的周期卷積。根據(jù)信號(hào)的時(shí)寬帶寬積為一常數(shù)這一基本性質(zhì),可知主瓣寬度與窗口寬度成反比,N越大,的主瓣越窄。由式(34)可知,為了使忠實(shí)再現(xiàn)的特性。相對(duì)于來(lái)說(shuō)必須是—個(gè)沖激函數(shù)。所以為了使,需;但是N值太大時(shí),信號(hào)的分幀又失去了意義。尤其是N大于語(yǔ)音的音素長(zhǎng)度時(shí),已不能反映該語(yǔ)音音素的頻譜了。因此,應(yīng)折衷選擇窗的寬度N。另外,窗的形狀也對(duì)短時(shí)傅氏頻譜有影響,如矩形窗,雖然頻率分辨率很高(即主辯狹窄尖銳),但由于第一旁瓣的衰減很小,有較大的上下沖,采用矩形窗時(shí)求得的與的偏差較大,這就是Gibbs效應(yīng),所以不適合用于頻譜成分很寬的語(yǔ)音分析中。而漢明窗在頻率范圍中的分辨率較高,而且旁辯的衰減大,具有頻譜泄漏少的優(yōu)點(diǎn)。所以在求短時(shí)頻譜時(shí)一般采用具有較小上下沖的漢明窗。與離散傅里葉變換和連續(xù)博里葉變換的關(guān)系一樣,如令角頻率w=2πk/N,則得離散的短時(shí)傅里葉變換(DFT)。它實(shí)際上是在頻域的取樣,如下所示: (35)在語(yǔ)音信號(hào)數(shù)字處理中,都是采用的離散博里葉變換(DFT)來(lái)替代并且可以用高效的快速傅里葉變換(FFT)算法完成由至的轉(zhuǎn)換。當(dāng)然,這時(shí)窗長(zhǎng)N必須是2的倍數(shù)(L是整數(shù))。根據(jù)傅里葉變換的性質(zhì),實(shí)數(shù)序列的傅里葉變換的頻譜具有對(duì)稱性,因此,全部頻譜信息包含在長(zhǎng)度為N/2+1個(gè)里。另外,為了使具有較高的頻率分辨率,所取的DFT以及相應(yīng)的FFT點(diǎn)數(shù)應(yīng)該足夠多,但有時(shí)的長(zhǎng)度N要受到采樣率和短時(shí)性的限制,例如,在通常采樣率為8kHz且?guī)L(zhǎng)為20ms時(shí),N=而一般取25512或1024,為了將的點(diǎn)數(shù)從N擴(kuò)大力,可以采用補(bǔ)0的辦法,在擴(kuò)大的部分添若干個(gè)0取樣值,然后再對(duì)添0后的序列進(jìn)行FFT。例如、在10kHz的范圍內(nèi)采樣求頻譜,并要求頻率分辨率在30Hz以下。由10k/<30,得>333,所以=要取比333大的值,這時(shí)可取==512點(diǎn),不足的部分采用補(bǔ)0的辦法解決,此時(shí)頻率分辨率(即頻率間隔)為10Hz/512=,采樣后的該幀信號(hào)頻率處在0~之間,因此,原連續(xù)信號(hào)頻率就處在0~之間(即),所以我們要在0~頻率范圍內(nèi)求其頻譜。FFT的計(jì)算可以在通用計(jì)算機(jī)上由相應(yīng)的算法軟件來(lái)完成,這種方式一般只能實(shí)現(xiàn)非實(shí)時(shí)運(yùn)算。為了完成實(shí)時(shí)運(yùn)算可以采用先進(jìn)的數(shù)字信號(hào)處理芯片、陣列處理芯片或?qū)S肍FT芯片。為了完成1024點(diǎn)的FFT,這些專用芯片所需的運(yùn)算時(shí)間是幾十毫秒至幾毫秒,甚至可以降至1ms以下。在語(yǔ)音信號(hào)數(shù)字處理中,功率譜具有重要意義,在一些語(yǔ)音應(yīng)用系統(tǒng)中。往往都是利用語(yǔ)音信號(hào)的功率譜。根據(jù)功率譜定義,可以寫出短時(shí)功率譜與短時(shí)傅里葉變換之間的關(guān)系:或者: 式中*表示復(fù)共軛運(yùn)算。并且功率譜是短時(shí)自相關(guān)函數(shù)的傅里葉變換。圖32是用Matlab中的psdplot命令繪得的同一人兩次說(shuō)同一詞的功率譜比較(窗函數(shù)取窗長(zhǎng)度為
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1