freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

強(qiáng)背景噪聲環(huán)境下語(yǔ)音增強(qiáng)算法的研究及應(yīng)用畢業(yè)論文(完整版)

  

【正文】 算法研究 本章引論人們?cè)谡f(shuō)話過(guò)程中,不可避免地存在很多間歇和停頓,因此語(yǔ)音是不連續(xù)的媒介。 白噪聲干擾下(INSNR=5dB)本文算法和MS算法性能比較 babble噪聲干擾下(INSNR=5dB)本文算法和MS算法性能比較,輸入信噪比由15dB迅速下降為5dB時(shí),本文快速估計(jì)算法和MS算法性能比較。把代入式( 320 ) 計(jì)算新的時(shí)頻變化因子。當(dāng)噪聲功率突然增大時(shí),噪聲幀的功率譜必然會(huì)大于功率譜最小值,這樣根據(jù)式(318)得到的關(guān)于語(yǔ)音存在概率的判定勢(shì)必會(huì)有較大誤差,這部分功率比較大的噪聲很容易誤判為語(yǔ)音。當(dāng)語(yǔ)音不存在時(shí),帶噪語(yǔ)音功率譜應(yīng)等于或接近于式(317)所得的功率譜最小值。由長(zhǎng)時(shí)信噪比計(jì)算得到: ( 316 )其中,為幀長(zhǎng)。可以看出,(60幀)以上的延時(shí),而且存在著對(duì)噪聲過(guò)估計(jì)的情況,容易造成對(duì)微弱語(yǔ)音信號(hào)的抑制。 最小統(tǒng)計(jì)(MS)算法測(cè)試結(jié)果將標(biāo)準(zhǔn)語(yǔ)音庫(kù)的語(yǔ)音材料與NOISEX92噪聲庫(kù)的噪聲材料根據(jù)SNR合成作為測(cè)試材料。為減少延時(shí),將長(zhǎng)窗分成個(gè)子窗,每個(gè)子窗長(zhǎng)為。下面簡(jiǎn)要介紹方法。 簡(jiǎn)單的直接噪聲統(tǒng)計(jì)特性估計(jì)簡(jiǎn)單的直接噪聲統(tǒng)計(jì)特性估計(jì)方法如下: ( 32 )其在形式上與基于語(yǔ)音激活檢測(cè)的噪聲統(tǒng)計(jì)特性估計(jì)方法在噪聲幀的處理相同,只是通常設(shè)置為一個(gè)接近1的數(shù)值,并且在語(yǔ)音增強(qiáng)的全過(guò)程進(jìn)行更新。當(dāng)語(yǔ)音誤判為噪聲時(shí),必然使得噪聲統(tǒng)計(jì)特性的估計(jì)失真,進(jìn)而在語(yǔ)音增強(qiáng)處理中造成對(duì)語(yǔ)音的損傷,在低信噪比時(shí),甚至?xí)霈F(xiàn)切音現(xiàn)象,這將極大地降低增強(qiáng)語(yǔ)音的可懂度。本章剩余章節(jié)按照如下方式組織:;;;最后是本章小結(jié)。 本章小結(jié)本章對(duì)語(yǔ)音增強(qiáng)的相關(guān)算法做了全面論述,尤其對(duì)基于短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)算法做了詳細(xì)分析,指出了各種算法的優(yōu)缺點(diǎn)。此時(shí),合流超幾何函數(shù)可以近似為: ( 236 )代入式(235),得到 ( 237 )與式(226)中維納濾波法增益式比較,可以看出此時(shí)與維納濾波法相同。這兩種估計(jì)準(zhǔn)則都存在一定的缺陷:最大似然準(zhǔn)則完全放棄了對(duì)語(yǔ)音頻譜的分布假設(shè);維納濾波法將最小均方誤差準(zhǔn)則應(yīng)用于時(shí)域波形估計(jì),但對(duì)人耳來(lái)說(shuō),頻譜分量的幅度才是最重要的。當(dāng)然,此時(shí)引起的失真也可能會(huì)增大。如果不給定的分布,則此時(shí)的最大似然估計(jì)式可以用如下方法求得:由于 ( 216 )通過(guò)積分消去后,有 ( 217 )其中,為第0階修正貝塞爾函數(shù),令 ( 218 )則解方程后就可以得到的估計(jì)式。 一般形式的譜相減法的結(jié)構(gòu)框圖FFT變換后有 ( 25 )由此可得: ( 26 )由于與相互獨(dú)立,而近似滿足零均值的高斯分布,所以: ( 27 )對(duì)于一個(gè)分析幀內(nèi)的短時(shí)平穩(wěn)過(guò)程,則有: ( 28 )其中為無(wú)語(yǔ)音時(shí)的統(tǒng)計(jì)平均值,由此可得原始語(yǔ)音的估計(jì)值: ( 29 )其中為增強(qiáng)后語(yǔ)音信號(hào)譜幅度。相應(yīng)的頻域表示為 ( 24 )其中,分別為,和的傅里葉變換系數(shù)。此類算法運(yùn)算量相對(duì)較小,適用信噪比范圍比較大,并且易于實(shí)時(shí)處理,因而得到廣泛應(yīng)用。 語(yǔ)音的全極點(diǎn)生成模型Lim和Oppenheim[8]采用了MAP準(zhǔn)則來(lái)估計(jì)聲道的全極點(diǎn)參數(shù)。同時(shí)對(duì)兩個(gè)語(yǔ)音進(jìn)行梳狀濾波的主要問(wèn)題是:存在另一個(gè)人說(shuō)話干擾時(shí),如何跟蹤并準(zhǔn)確估計(jì)出講話者的基音。當(dāng)延時(shí)與周期一致時(shí),這個(gè)平均過(guò)程將使周期性分量得到加強(qiáng),而會(huì)使其他非周期性分量或與語(yǔ)音信號(hào)周期不同的其他周期性分量受到抑制。因而,采集到的噪聲必須經(jīng)過(guò)自適應(yīng)濾波,以得到盡可能接近于帶噪語(yǔ)音中的噪聲。本章剩余章節(jié)將按照如下方式組織:;;;最后是本章小結(jié)。 本章小結(jié)本章首先介紹了語(yǔ)音增強(qiáng)在語(yǔ)音處理系統(tǒng)中的作用,指出了選題背景和選題意義,并給出了加性噪聲情況下的帶噪語(yǔ)音模型,闡述了與語(yǔ)音增強(qiáng)密切相關(guān)的語(yǔ)音和噪聲的主要特性、人耳的感知特性以及背景噪聲對(duì)語(yǔ)音的影響。 論文研究工作基于單麥克的語(yǔ)音增強(qiáng)一直是各種語(yǔ)音增強(qiáng)方法中研究的熱點(diǎn),相關(guān)理論也相對(duì)成熟。此類算法運(yùn)算量相對(duì)較小,適用信噪比范圍比較大,并且易于實(shí)時(shí)處理,因此得到廣泛應(yīng)用,譜減法、維納濾波法以及MMSE 法等方法都屬于此類。因此,要結(jié)合語(yǔ)音特性、人耳感知特性及噪聲特性,根據(jù)實(shí)際情況選用合適的語(yǔ)音增強(qiáng)方法。統(tǒng)計(jì)方法中最典型的是隱馬爾可夫模型(HMM一Hiddnen Markov Mdel)方法,它既是語(yǔ)音識(shí)別的主要方法,也可以以概率方式將語(yǔ)音增強(qiáng)問(wèn)題納入其模型框架[13]。1978年,Lim和Oppoenheim[8]提出了語(yǔ)音增強(qiáng)的維納濾波算法。掩蔽的程度是聲音強(qiáng)度與頻率的二元函數(shù),對(duì)頻率臨近分量的掩蔽程度大于對(duì)頻差大的分量的掩蔽;5)語(yǔ)音短時(shí)譜中的共振峰對(duì)語(yǔ)音的感知十分重要,特別是第二共振峰比第一共振峰更為重要,因此對(duì)語(yǔ)音信號(hào)進(jìn)行一定程度的高通濾波不會(huì)對(duì)可懂度造成影響;6)人耳在兩人以上的講話環(huán)境中有能力分辨出需要聆聽(tīng)的聲音。目前的語(yǔ)音增強(qiáng)主要是針對(duì)這種噪聲的處理。加性噪聲大致上有:周期性噪聲、脈沖噪聲、寬帶噪聲和同聲道其它語(yǔ)音的干擾等。在高斯模型假設(shè)下,傅立葉展開(kāi)系數(shù)被認(rèn)為是獨(dú)立的高斯隨機(jī)變量,均值為0,方差時(shí)變。2)語(yǔ)音大體上可以分為清音和濁音兩大類。這個(gè)帶噪語(yǔ)音模型將作為本文語(yǔ)音增強(qiáng)分析的基礎(chǔ)。但目前的識(shí)別系統(tǒng)大都是在安靜環(huán)境中工作的,在噪聲環(huán)境中尤其是強(qiáng)噪聲環(huán)境,語(yǔ)音識(shí)別系統(tǒng)的識(shí)別率將受到嚴(yán)重影響。其中,語(yǔ)音增強(qiáng)是語(yǔ)音數(shù)字信號(hào)處理系統(tǒng)進(jìn)入實(shí)用階段的重要環(huán)節(jié)。語(yǔ)言是人類交流的重要手段,它自然方便,準(zhǔn)確高效。首先, 提出了一種快速估計(jì)噪聲統(tǒng)計(jì)特性的算法,減小了噪聲估計(jì)的跟蹤延時(shí),在一定程度上改善了噪聲過(guò)估計(jì)的現(xiàn)象,因而能夠在低輸入信噪比以及非平穩(wěn)噪聲干擾環(huán)境下快速準(zhǔn)確地跟蹤噪聲特性。密級(jí):內(nèi)部★ 2 年強(qiáng)背景噪聲環(huán)境下語(yǔ)音增強(qiáng)算法的研究及應(yīng)用Research and Application of Speech Enhancement in Strong Noise Environment(申請(qǐng)清華大學(xué)工學(xué)碩士學(xué)位論文)培 養(yǎng) 單 位:學(xué) 科:研 究 生:指 導(dǎo) 教 師:關(guān)于學(xué)位論文使用授權(quán)的說(shuō)明本人完全了解清華大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,即:清華大學(xué)擁有在著作權(quán)法規(guī)定范圍內(nèi)學(xué)位論文的使用權(quán),其中包括:(1)已獲學(xué)位的研究生必須按學(xué)校規(guī)定提交學(xué)位論文,學(xué)??梢圆捎糜坝 ⒖s印或其他復(fù)制手段保存研究生上交的學(xué)位論文;(2)為教學(xué)和科研目的,學(xué)??梢詫⒐_(kāi)的學(xué)位論文作為資料在圖書(shū)館、資料室等場(chǎng)所供校內(nèi)師生閱讀,或在校園網(wǎng)上供校內(nèi)師生瀏覽部分內(nèi)容;(3)根據(jù)《中華人民共和國(guó)學(xué)位條例暫行實(shí)施辦法》,向國(guó)家圖書(shū)館報(bào)送可以公開(kāi)的學(xué)位論文。根據(jù)對(duì)短時(shí)譜幅度估計(jì)算法進(jìn)行分析,指出了影響其性能的關(guān)鍵技術(shù):噪聲統(tǒng)計(jì)特性的估計(jì)、語(yǔ)音激活檢測(cè)算法、先驗(yàn)信噪比估計(jì)、增益函數(shù)的修正等,為算法改進(jìn)指明了研究方向。關(guān)鍵詞:語(yǔ)音增強(qiáng) 非平穩(wěn)噪聲 短時(shí)譜幅度估計(jì) 噪聲估計(jì) 語(yǔ)音激活檢測(cè) 先驗(yàn)信噪比II Abstract AbstractIn voice munications, speech signals can be contaminated by various noises inevitably, which affects the munication quality. Furthermore, noise interference degrades the performance of speech processing systems, such as low bitrate vocoder and speech recognition. Speech enhancement is an effective preprocessing method to reduce the disturbance of noise.Among the speech enhancement techniques, the methods based on ShortTime Spectral Amplitude(STSA) estimation have been well investigated and brought into wide use. In this dissertation, a lot of research work has been done to improve the performance of STSA estimation against the environments of low SignaltoNoise Ratio(SNR) input and nonstationary noise. The proposed robust approach of speech enhancement has been implemented on the TMS320C55x DSP platform. According to the analysis of the STSAbased speech enhancement algorithm, the key techniques are summarized, including the estimation of noise statistic characteristics, voice activity detection(VAD) algorithm, the estimation of a priori SNR, and the modification of gain function,etc.Firstly, a fast estimation method of noise statistic characteristics is proposed. The method decreases the adaptation time of tracking noise, avoids the overestimation phenomenon to some extent, thus can track the noise characteristics with higher accuracy and less time in low SNR input and nonstationary noise environments.Secondly, a voice activity detector based on Gaussian model and Uniformly Most Powerful(UMP) test is designed. Because of detection threshold related to the noise estimation, the algorithm provides higher detection perfomance, especially in nonstationary noise environments. Furthermore, utilizing the spectral information of DFT in the VAD algorithm, the dual tone multiple frequency(DTMF) signal detector and generator are realized conveniently.Thirdly,to balance the stability and the tracking ability in the estimation of a priori SNR, the feedback factor of a priori SNR estimation is optimally adjusted and the estimation result is limited above an adaptive threshold related to long time statistic information. Moreover, the softdecision modified gain function is obtained by introducing speech presence probability to a priori SNR and a priori SNR. These methods effectively eliminate the“musical” noise and make the enhanced speech smooth, natural and acceptable.Finally, The algorithm mentioned above has been implemented in both C language and assembler language on the PC and TMS320C55 DSP hardware platform. Both simulation experiments and realtime tests show that the improved speech enhancement algorithm is effective in suppressing background noise and increasing the SNR without apparently impairing the intelligibility of speech .The perfomance is significantly enhanced
點(diǎn)擊復(fù)制文檔內(nèi)容
數(shù)學(xué)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1