freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音端點(diǎn)檢測算法的研究及matla程序仿真與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)(參考版)

2024-08-31 21:28本頁面
  

【正文】 (4)如上節(jié)設(shè)置短時(shí)能量和短時(shí)過零率的門限來確定倒譜距離判決門限。這 10 幀的前五幀作為估計(jì)當(dāng)前噪聲的倒譜系數(shù)的參考,而后幾幀則作為估計(jì)當(dāng)前噪聲的倒譜距離的參考。 (2)估計(jì)噪聲倒譜系數(shù)和倒譜距離 :在進(jìn)行語音端點(diǎn)檢測之前,需對(duì)當(dāng)前環(huán)境下的噪聲比進(jìn)行估計(jì),以便設(shè)置門限。 倒譜距離的檢測算法流程 在倒譜距離檢測的算法中,首先需計(jì)算出的每一幀的 LPC 系數(shù)、噪聲倒譜系數(shù)估計(jì)值等,然后由每幀信號(hào)的倒譜系數(shù)和噪聲倒譜系數(shù)估計(jì)值通過公式 ( 314) 計(jì)算出倒譜值,然后才能對(duì)語音信號(hào) 進(jìn)行端點(diǎn)檢測,其檢測算燕山大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 24 法思路如下: (1)預(yù)處理:本文采用的是 8kHz 的語音信號(hào),先兌取進(jìn)行預(yù)處理,是高頻和低頻的信噪比保持平滑。迭代時(shí) n 從大到 0 取值,最后求得的美爾倒譜系數(shù)放在)0(0MC , )0(1MC , )0(orderMC 里。 LPC 美爾倒譜系數(shù) 所謂的 LPC 美爾倒譜系數(shù)就是對(duì)原來的 LPC 倒譜系數(shù)按照美爾尺度進(jìn)行非線性變換而得出的倒譜系數(shù),進(jìn)一步提高了低信噪比環(huán)境中的語音端點(diǎn)檢測。用前幾幀的信號(hào)模擬后幾幀的信號(hào),大大縮短了計(jì)算量,且能夠表現(xiàn)出語音信號(hào)在頻譜上的特性,遠(yuǎn)遠(yuǎn)優(yōu)于用傅里葉變換而求得的倒譜,在實(shí)際上擁有了很好的應(yīng)用。其中 p 為 LPC 階數(shù)。 線性預(yù)測分析推定的聲道模型系統(tǒng)函數(shù)為語音信號(hào)的倒譜指的是信號(hào)能量譜密度函數(shù) )(?S 的對(duì)數(shù)的傅立葉變換用測量倒譜距離的方法來判斷每一幀信號(hào)是語音信號(hào)還是噪聲信號(hào),根據(jù)每一幀信號(hào)與噪聲的倒譜距離的軌跡就可以進(jìn)行語音端點(diǎn)檢測。計(jì)算時(shí) 可以選用 Durbin 算法、格型算法、協(xié)方差等算法進(jìn)行求解。這樣通過抽樣和線性組合得到的采樣值只有唯一的組合系數(shù)。 線性預(yù)測系數(shù) LPC LPC 為用線性預(yù)測法分析語音時(shí)得到的有關(guān)語音相鄰樣值間某些相關(guān)特性的參數(shù)組。 LPC倒譜特征與 FFT復(fù)倒譜特征相比,前者求出的頻譜包絡(luò)能更好地重現(xiàn)譜的峰值,而且運(yùn)算量僅是后者的一半,在實(shí)時(shí)語音識(shí)別中采用 LPC倒譜作為特征向量較好。 我們處理信號(hào)是用的倒譜特征是復(fù)倒譜特征,其是由語音信號(hào)先經(jīng)過傅里葉變化,然后求其復(fù)對(duì)數(shù)進(jìn)行逆傅立葉變換便就可以得到信 號(hào)復(fù)倒譜,我們稱之為 FFT復(fù)倒譜。 下式計(jì)算倒譜距離 21200 )(2)(3 4 2 ????????? pn nncepcccc (312) 式中 c′n為對(duì)應(yīng)于 c的噪聲倒譜系數(shù) ,計(jì)算所有測試幀與背景噪聲之間的倒譜距離可得到倒譜距離軌跡。 倒譜距離的測量法步驟類似于基于能量的端點(diǎn)檢測,但將倒譜距離代替短時(shí)能量來作為門限。信號(hào)倒譜的一種定義是信號(hào)的能量譜密第 3章 語音端點(diǎn)檢測算法研究 21 度函數(shù) s(ω) 的對(duì)數(shù)的傅里葉反變換 ,或者可以將信號(hào) s(n) 的倒譜 c(n) 看成是logS(ω) 的傅里葉級(jí)數(shù)展開 ,即: ????? ?? n jnencS ?? )()(lo g ??? ?? ??? dS )(lo g21)0(c (39) 式中 , c(n)為倒譜系數(shù) ,且 c(n)=c(n)是實(shí)數(shù) 對(duì)于一對(duì)譜密度函數(shù) S(w)與 S′(w),利用 Parseval定理 ,用譜的倒譜距離表示對(duì)數(shù)譜的均方距離為 : ?? ??????? ?????? n nn ccdSS 2cep2 )()(l o g)(l o g21d ?? ???? (310) 式中, 與 c′n分別表示譜密度 S(w)和 S′(w)的倒譜系數(shù),對(duì)數(shù)譜的均方距離表示兩個(gè)信號(hào)譜的差別,故可用來作為一個(gè)判決參數(shù)。本文這節(jié)也將倒譜特征參數(shù)用于在噪聲環(huán)境下的語音端點(diǎn)檢測。實(shí)驗(yàn)證明,倒譜特征能更好的表現(xiàn)語音信號(hào)的特征。如果降低語音信號(hào)的信噪比,再通過短時(shí)能量和過零率的方法檢測,不能夠檢測語音端點(diǎn)。從 圖 35中可以看出,在高信噪比的情況下,采用 短時(shí)能量和過零率相結(jié)合的語音端點(diǎn)算法能夠清晰的檢測出語音字的端點(diǎn)。隨后根據(jù)語音的長度,加一序列與語音長度相等的隨機(jī)幅度序列,以提高噪聲信號(hào)的短時(shí)能量和過零率,比較逼真的仿真噪聲環(huán)境下的基于短時(shí)能量和過零率的語音端點(diǎn)檢測。對(duì)其他參數(shù)進(jìn)行設(shè)置,如設(shè)置語音幀長度,幀移長度, FFT 取,門限閥值 設(shè) 置等。在語音端點(diǎn)檢測之前首先要對(duì)被測的語音信號(hào)進(jìn)行預(yù)處理等,包括分幀加窗等。 雙門限語音端點(diǎn)檢測實(shí)驗(yàn) 雙門限語音端點(diǎn)檢測是在 MATLAB 軟件環(huán)境下進(jìn)行仿真實(shí)驗(yàn)。當(dāng)超過較高門限后,信號(hào)進(jìn)入語音階段,但如果語音階段持第 3章 語音端點(diǎn)檢測算法研究 19 續(xù)時(shí)間小于設(shè)定的時(shí)間長度,則被認(rèn)為是突發(fā)性噪聲,所有 值歸零,并重新開始進(jìn)行語音檢測。我們說的話語有一定的幅度,短時(shí)能量就是根據(jù)語音信號(hào)的幅度檢測出語音端點(diǎn)的,而一些比較大的噪聲或者碰撞聲音也好導(dǎo)致短時(shí)能量或過零率的數(shù)值接近語音信號(hào)的數(shù)值,但是這種信號(hào)持續(xù)的時(shí)間比較短,在時(shí)域上表示出很短的又很高的一段語音。整個(gè)過程都 是以門限值為基礎(chǔ),最短語音和最短靜音為輔來進(jìn)行和提高語音端點(diǎn)檢測。在程序編寫過程中,常設(shè)置一個(gè)量來辨別當(dāng)前的狀態(tài),以決定下一個(gè)是什么階段。檢測過程中也要設(shè)置最低語音段和對(duì)短靜音段,這更有效的提高了語音端點(diǎn)檢測的準(zhǔn)確度。 (4)檢測的高低門限要通過多次實(shí)驗(yàn)并且根據(jù)當(dāng)時(shí)的信噪比環(huán)境而確定的。先是比較高一點(diǎn)的門限判決。再就是設(shè)置另一個(gè)高一點(diǎn)的門限,如果低于這個(gè)門限,則有可能不是語音信號(hào)。 由上述描述,可得其簡單步驟如下: (1)首先要計(jì)算每一幀的短時(shí)能量和短時(shí)過零率,然后又由每一幀的這兩個(gè)參數(shù)值得出特征參數(shù),即能零比。首先設(shè)一個(gè)比較低的門限,當(dāng)所測得的參數(shù)值大于這個(gè)門限,說明信號(hào)可能進(jìn)入語音階段,再設(shè)一個(gè)稍微高一點(diǎn)的門限,當(dāng)超過這個(gè)參數(shù)值的時(shí)候,說明 信號(hào)進(jìn)入語音段。 基于短時(shí)能量和短時(shí)過零率的雙門限端點(diǎn)檢測 這種方法是基于短時(shí)能量和短時(shí)過零率相結(jié)合的方法,既能分辨出清音燕山大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 18 和濁音,也能分辨出清音和靜音。在區(qū)分濁音和清音時(shí), 由于兩者在短時(shí)能量的區(qū)別,所以根據(jù)短時(shí)能量分辨出清音和濁音,而在區(qū)分清音和無聲片段時(shí),則由短時(shí)過零率來區(qū)分。 下面是語音信號(hào)通過 matlab 仿真顯示過零率,如圖 34 所示: 圖 34 語音 信號(hào)的過零率 從圖 34 中可以看出語音信號(hào)的過零率,在語音信號(hào)中清音段的過零率情況,圖中幅度變化反映了過零率次數(shù)的高低。而噪聲總是處于間斷等情況,所以其頻率會(huì)比較低,低頻就意味著低的短時(shí)過零率,所以認(rèn)為靜音時(shí)有低過零率,而清音具有高過零率。再個(gè)就是區(qū)分清音和靜音。過零率就是樣本改變符號(hào)的次數(shù)。 短時(shí)過零率 短時(shí)過零率表示一幀語音信號(hào)波形穿過橫軸的次數(shù)?!?23” 的值比較大所以其對(duì)應(yīng)于濁音段,而“ 145” 值相對(duì)較小所以其對(duì)應(yīng)于清音段。如圖 33 所示: 燕山大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 16 圖 33 語音信號(hào)的短時(shí)能量 從圖 33 中可以看出語音“ 12345”語音信號(hào)中語音部分的能量是最高的,由于語音部分又分 成靜音段、清音段、濁音段。雙門限則是先設(shè)置低一點(diǎn)的幅度進(jìn)行先判決,在選高一點(diǎn)的值進(jìn)行判決。 語音信號(hào)的短時(shí)平均幅度定義為: ????? ??? mn mnmxM )()( ? (33) 一般比較清晰的語音根據(jù)短時(shí)能量就能夠檢測出語音端點(diǎn),但是有的時(shí)候,一個(gè)字的后面為清音,而其的短時(shí) 能量又很小,很難跟隨后的無聲片段分開,有人提出了基于短時(shí)過零率的算法來區(qū)分清音和濁音,語音和噪聲在其幅度穿越橫軸的次數(shù)上有很大的區(qū)別,根據(jù)這點(diǎn),提出短時(shí)能量和短時(shí)過零率相結(jié)合的方法在高信噪比環(huán)境下的檢測。短時(shí)能量用來區(qū)分清音和濁音。因?yàn)閷?shí)際的語音信號(hào)是很長的,第 3章 語音端點(diǎn)檢測算法研究 15 我們不能也不 必對(duì)非常長的數(shù)據(jù)進(jìn)行一次性處理。語音信號(hào)一般在 10ms 到 30ms之間,我們可以把它看成是平穩(wěn)的。 n 時(shí)刻某語音信號(hào) {x(n)}的短時(shí)平均能量定義為: ? ?2)()(????? ??? mn mnmxE ? (31) 式中, )(n? 為漢明窗。通過分幀后,形成短時(shí)語音信號(hào),在短時(shí)內(nèi)語音信號(hào)是保持平穩(wěn)的,對(duì)每一幀的能量幅度進(jìn)行積和,得出每一幀的短時(shí)能量,根據(jù)每一幀的短時(shí)能量,設(shè)定一定的門限。 短時(shí)平均能量 從能量譜的實(shí)驗(yàn)結(jié)果可以看出,語音和噪聲的能量值有很大的差別,根據(jù)這實(shí)驗(yàn)結(jié)果就可以由能量值來區(qū)分噪聲和語音或者進(jìn)行語音端點(diǎn)檢測。但由過零率檢測能夠清晰的分辨出清音和無聲。 跟據(jù)語音信號(hào)的特性及各語言的發(fā)音特性,把語音可以分為清音、濁音和無聲三種特性,在短時(shí)能量和過零率相結(jié)合的算法過程中,短時(shí)能量檢測可以能夠分辨出濁音和清音。 算法對(duì)于輸入信號(hào)的檢測過程可分為短時(shí)能量檢測和短時(shí)過零率檢測兩個(gè)部分。 本文擬用短時(shí)能量和過零率相結(jié)合的方法檢測高信噪比,熵譜和倒譜系數(shù)來檢測低信噪比。倒譜能很好表示語音的特征,在強(qiáng)噪聲 環(huán)境下,常常采用倒譜系數(shù)來作為端點(diǎn)檢測的特征量。此外,還會(huì)有一些基于其他如多統(tǒng)計(jì)模型、似然檢驗(yàn)、模式識(shí)別、模糊邏輯等方法; 短時(shí)能量和過零率相結(jié)合的方法常用于高信噪比下,而現(xiàn)實(shí)生活中的語音信號(hào)常為低信噪比。此外,還包括一些基于 Walsh譜能量分布和 HilbertHuang變換的檢測方法; (3)信息論方法 主要是根據(jù)概率等得出信號(hào)所包含的信息量,放到端點(diǎn)檢測算法中去,本文所選取的譜熵也屬于這類。按照所采用的特征參數(shù)或分析方法的不同,本論文將語音端點(diǎn)檢測的算法或方法分為: (1)時(shí)域參數(shù)方法 主要是指基于短時(shí)能量、過零率和短時(shí)自相關(guān) 及一些其他時(shí)域參數(shù) (如最小均方參數(shù)、對(duì)數(shù)能量、絕對(duì)值能量等 )的方法。 語音端點(diǎn)檢測算法及實(shí)施方案 語音端點(diǎn)檢測算法是各種語音信號(hào)分析的綜合處理,到目前為止還沒有很正規(guī)的分類方法。一種較好的語音端點(diǎn)檢測算法通常應(yīng)具備如下四個(gè)特征: (1)語音端點(diǎn)檢測的準(zhǔn)確率高,尤其對(duì)于清音段端點(diǎn)能夠正確判決; (2)端點(diǎn) 檢測算法須具有對(duì)絕大多數(shù)噪聲魯棒性、抗干擾能力; (2)端點(diǎn) 判決準(zhǔn)應(yīng)具有自適應(yīng) 性,而不是僅僅簡單的門限判決; (4)檢測算法應(yīng)較簡單,而且運(yùn)算量較小,便于實(shí)現(xiàn)硬件仿真。當(dāng)最后幾幀值低于設(shè)定值,而且后幾幀的值低于設(shè)定值且大于最小噪聲信號(hào),則被認(rèn)為是語音結(jié)束。端點(diǎn)檢測時(shí)通過估計(jì)后噪聲比 基于不同的噪聲而設(shè)定的不同門限。所以參數(shù)的提取,直接影響到語音端點(diǎn)檢測的性能。如本文采用的短時(shí)能量和短時(shí)過零率相結(jié)合的算法 是基于能量差別,而倒譜和譜熵則是基于其他的特征參數(shù)。而噪聲一般是源于外界物理碰撞所引起的振動(dòng)。本文所進(jìn)行的語音端點(diǎn)檢測,其就是檢測出噪聲與語音信號(hào)的差別,并標(biāo)記出來。在檢測過程中,參數(shù)提取和端點(diǎn)的判決尤為顯得重要。再后面就是 對(duì)特征參數(shù)的提取,不同信噪比會(huì)有不同的易于區(qū)別噪聲和語音的特征參數(shù)。然后加窗分幀,使之在短時(shí)特性上表現(xiàn)的連續(xù)、平滑。 語音端點(diǎn)檢測原理 語音端點(diǎn)檢測的原理就是基于語音段和噪聲段對(duì)于一些語音信號(hào)的參數(shù)會(huì)表現(xiàn)出不同的特征,通過對(duì)特征參數(shù)的區(qū)別就能對(duì)語音信號(hào)進(jìn)行端點(diǎn)檢測。 除此之外,在語音合成、編碼等一系列語音信號(hào)處理系統(tǒng)中,較好的語音端點(diǎn)檢測會(huì)影 響語音識(shí)別系統(tǒng)的主要性能。理想的端點(diǎn)檢測算法應(yīng)當(dāng)具有以下幾個(gè)特征 :可靠性、自適應(yīng)性、實(shí)時(shí)性、魯棒性和精確性。 燕山大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 10 第 3 章 語音端點(diǎn)檢測算法研究 本章將重點(diǎn)介紹語音端點(diǎn)檢測的原理,本章還對(duì)語音端點(diǎn)檢測算法的進(jìn)一步研究,列舉了三種不同的語音端點(diǎn)檢測算法,并對(duì)每一種語音端點(diǎn)檢測算法進(jìn)行了實(shí)驗(yàn)仿真,最后對(duì)各種算法優(yōu)缺點(diǎn)進(jìn)行了比較。有時(shí)要恢復(fù)原信號(hào),則需要從 做過預(yù)加重的信號(hào)頻譜來求實(shí)際的頻譜時(shí),并且要對(duì)測量值去加重處理,即加上 6dB/倍頻程的下降的頻率特性來還原成原來的頻譜特性。 本章小結(jié) 本章分析了語音信號(hào)的時(shí)域和頻域的一些特征,并列舉了語音的幾個(gè)特征參數(shù),如熵、短時(shí)能量、倒譜特征等。用得最多的三種窗函數(shù)是矩形窗、漢明窗 (Hamming)和漢寧窗 (Hanning)。前一幀和后一幀的交疊部分稱為幀移,幀移與幀長的比值一般在 0~ 之間。為了能夠符合實(shí)際而且能精準(zhǔn)的描述語音信號(hào)能量的實(shí)際中的變化規(guī)律,通常將窗寬選為幾十毫秒左右。幀和幀之間可以連續(xù) ,也可以重疊。 在進(jìn)行了預(yù)加重后,要對(duì)語音信號(hào)進(jìn)行加窗分幀處理。 所以 我們?cè)谡Z音 端點(diǎn)檢測 時(shí),采用 適量 的窗 , 可以確切判斷語音的起始 點(diǎn),會(huì)有比較快的速度,也不會(huì)有太大的運(yùn)算量。 而 在 語音 端點(diǎn)檢測時(shí)如果采用大的窗長 , 則幀長長,幀數(shù)少 , 這樣計(jì)算量會(huì)小些 , 而且進(jìn)行 語音 端點(diǎn)檢測時(shí)速度會(huì)快些,但是這樣 語音 端點(diǎn)檢測的誤差 會(huì) 增加。 有時(shí)需要恢復(fù)原信號(hào),需要從做過預(yù)加重的信號(hào)來求實(shí)際的頻譜,需要對(duì)測量值進(jìn)行去加重處理,即加上 6dB/倍頻程的下降的頻率特性來恢復(fù)原來的特性。 為此在預(yù)處理中先進(jìn)行預(yù)加重處理。但是由于消息信號(hào)中較高頻率分 量的能量小
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1