freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語(yǔ)音信號(hào)端點(diǎn)檢測(cè)技術(shù)的研究畢業(yè)論文(完整版)

  

【正文】 用的核心技術(shù)之一。語(yǔ)音信號(hào)端點(diǎn)檢測(cè)技術(shù)的研究畢業(yè)論文目 錄摘要 IAbstract II第1章 緒論 1 1 2 4 5第2章 語(yǔ)音信號(hào)處理基礎(chǔ) 7 語(yǔ)音信號(hào)的數(shù)學(xué)模型 7 8 8 8 8 9 10 10 10 11 11 11 13 13 13 14 16第3章 語(yǔ)音端點(diǎn)檢測(cè)的相關(guān)算法 17 17 21 25 25 28 本章小結(jié) 32第4章 基于距離熵的語(yǔ)音端點(diǎn)檢測(cè)算法 33 33 33 34 34 36 39 42結(jié)論 43參考文獻(xiàn) 44致謝 48附錄1 開題報(bào)告附錄2 文獻(xiàn)綜述附錄3 中期報(bào)告附錄4 英文文獻(xiàn)附錄5 英文翻譯第1章 緒論第1章 緒論語(yǔ)言是人類特有的功能,聲音是人類常用的工具,通過(guò)聲音傳遞信息是人類最重要、最有效、最準(zhǔn)確、最方便的信息交換的方式。經(jīng)過(guò)幾十年的努力,語(yǔ)音信號(hào)處理在語(yǔ)音識(shí)別、語(yǔ)音增強(qiáng)、語(yǔ)音編碼、說(shuō)話人識(shí)別、說(shuō)話人情感識(shí)別、語(yǔ)音合成等方面取得了巨大的進(jìn)步,然而,一旦這些技術(shù)應(yīng)用在實(shí)際環(huán)境中,由于環(huán)境噪聲、信道、說(shuō)話人自身因素等方面的影響, 性能急劇下降,因?yàn)樵趯?shí)際環(huán)境中沒(méi)有完全純凈的語(yǔ)音信號(hào),一般都會(huì)伴有噪聲或其它干擾[2]。在背景噪聲存在的情況下,無(wú)音片斷中主要以噪聲為主,所攜帶的有用信息相對(duì)于有音片斷要小得多,所以,如果能將無(wú)音片斷檢測(cè)出來(lái),則可以使用相對(duì)較少的比特?cái)?shù)來(lái)表示,而不會(huì)改變解碼端的語(yǔ)音質(zhì)量,從而降低語(yǔ)音編碼的平均編碼比特率。當(dāng)時(shí)是在一個(gè)實(shí)時(shí)語(yǔ)音翻譯系統(tǒng)中,為了解決語(yǔ)音段和無(wú)語(yǔ)音段的檢測(cè)問(wèn)題而提出來(lái)的在語(yǔ)音識(shí)別和說(shuō)話人識(shí)別中,背景噪聲使得端點(diǎn)檢測(cè)變得復(fù)雜,同時(shí),長(zhǎng)距離電話傳輸信道中還存在人順嘴,呼吸等類似的噪聲。由于基于模型的檢測(cè)方法的復(fù)雜性和不穩(wěn)定性,研究者們一般傾向于使用第二類方法,基于特征的端點(diǎn)檢測(cè)方法主要是通過(guò)尋找能夠區(qū)分語(yǔ)音和噪聲的特征參數(shù)來(lái)進(jìn)行判斷。文獻(xiàn)[13]對(duì)所有子帶的SNR進(jìn)行融合,形成SAF(sum of activation function)函數(shù),此算法充分利用頻域特征,并減少對(duì)噪聲的頻域能量分布的依賴,當(dāng)噪聲是非固定的時(shí)候,該方法也能可靠的執(zhí)行。論文組織結(jié)構(gòu)如下所示。聲音是從肺部呼出的直氣流通過(guò)在喉至嘴唇的器官的各種作用而發(fā)出的。由于語(yǔ)音信號(hào)的平均功率受聲門激勵(lì)和口鼻輻射的影響,高頻端大約在80Hz以上按6dB倍頻程跌落,所以當(dāng)求語(yǔ)音信號(hào)頻譜時(shí),頻率越高相應(yīng)的成分越小,高頻部分的頻譜比低頻部分難求,因此要對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)加重(Preemphasis)處理。一般每秒的幀數(shù)約為33~100幀,幀移一般取幀長(zhǎng)的1/3~2/3。在頻域要有較寬的帶寬以及較小的邊帶最大值。(3)作為一種超音段信息,用于語(yǔ)音識(shí)別中。圖23 濾波器示意圖傅里葉頻譜變換是語(yǔ)音信號(hào)頻域分析中廣泛使用的方法,對(duì)分幀加窗后的語(yǔ)音信號(hào),進(jìn)行傅里葉變換和逆傅里葉變換,可以相應(yīng)的得到頻譜,功率譜,倒譜距離,熵等特征。 (212)即為倒譜系數(shù),通過(guò)倒譜系數(shù)求得倒譜距離為 (213)熵(用H表示)是物質(zhì)的復(fù)雜程度的一種反映。(4)端點(diǎn)檢測(cè):確定門限后就可以進(jìn)行端點(diǎn)檢測(cè),根據(jù)門限值來(lái)區(qū)分有語(yǔ)音段和噪聲段,得出檢測(cè)結(jié)果。根據(jù)發(fā)音時(shí)聲帶是否振動(dòng),語(yǔ)音分為清音和濁音,發(fā)濁音時(shí)聲帶振動(dòng),發(fā)清音時(shí)聲帶不振動(dòng),清音的波形類似噪聲,很難區(qū)別清音和噪聲。根據(jù)噪聲能量變化的特點(diǎn),一般可以粗略地將它分為五類[21]。白噪聲在各個(gè)頻段上的功率是一樣的,由于白光是由各種頻率(顏色)的單色光混合而成,因而此信號(hào)的這種具有平坦功率譜的性質(zhì)被稱作是“白色的”。特別當(dāng)=0,=1時(shí),X的分布為標(biāo)準(zhǔn)正態(tài)分布。由于我們主要以加性噪聲作代表進(jìn)行研究,帶噪語(yǔ)音的短時(shí)能量為干凈語(yǔ)音的能量再加上噪聲的能量,因此,語(yǔ)音段的能量大于噪聲段的能量,可根據(jù)此特性來(lái)區(qū)別語(yǔ)音和噪聲。因?yàn)楹茈y保證有足夠高的信噪比,僅憑短時(shí)能量特征無(wú)法有效的區(qū)分語(yǔ)音和背景噪聲。 (310)2. 頻域方差語(yǔ)音和噪聲的頻譜特性差異是很大的在噪聲的頻譜中,各頻帶之間變化很平緩,這與“白噪聲”的稱謂相符,而語(yǔ)音則是“有色”的,各頻帶之間變化較激烈。產(chǎn)生這種現(xiàn)像的原因之一是這些算法只利用了語(yǔ)音的某一個(gè)特征,并沒(méi)有充分利用它的相關(guān)信息,有些語(yǔ)音特征只能在個(gè)別噪聲環(huán)境下具有較好的魯棒性。對(duì)于連續(xù)語(yǔ)音信號(hào),過(guò)零意味著時(shí)域波形通過(guò)時(shí)間軸,而對(duì)于離散信號(hào),如果相鄰兩點(diǎn)符號(hào)改變一次則為過(guò)零[29]。圖313 “長(zhǎng)度”語(yǔ)音的仿真圖圖314 “圖像”語(yǔ)音的仿真圖在高噪聲環(huán)境下由于噪聲太大,語(yǔ)音檢測(cè)的準(zhǔn)確率往往很低,為了改善檢測(cè)結(jié)果的準(zhǔn)確率,在進(jìn)行端點(diǎn)檢測(cè)之前先進(jìn)行一定的去噪處理文獻(xiàn)[32]提出了一種降噪和端點(diǎn)檢測(cè)同步的方法,先利用譜減法進(jìn)行降噪。 (317)其中帶噪語(yǔ)音信號(hào), 為純凈語(yǔ)音,()進(jìn)行傅立葉變換則相應(yīng)的得到則有: (318) (319)、表示對(duì)應(yīng)的帶噪語(yǔ)音、干靜語(yǔ)音和噪聲的功率譜,表示和的復(fù)共扼。文獻(xiàn)[35]提出了使用六種能量特征:全能量、聽覺頻率范圍的能量、高頻噪聲、峰值、LPC誤差能量和噪聲濾波后的能量。先來(lái)看一個(gè)例子。熵是一個(gè)重要的物理概念,隨著科學(xué)交叉與綜合化的發(fā)展,它又遠(yuǎn)遠(yuǎn)超出了物理學(xué)范圍,在自然科學(xué)和社會(huì)科學(xué)眾多領(lǐng)域里得到了廣泛應(yīng)用,并成為一些新學(xué)科的理論基礎(chǔ)。但實(shí)際上,語(yǔ)音譜熵隨語(yǔ)音隨機(jī)性而變化,與能量特征相比,譜熵的變化是很小的。對(duì)分幀后的每一幀語(yǔ)音加漢明窗。 (47)計(jì)算矩陣H每一行所有點(diǎn)的和并用Psum表示,則Psum是長(zhǎng)度為N的向量Psum的計(jì)算方法見式48。為了消除這個(gè)缺陷,可以對(duì)特征進(jìn)行平滑。,tmin、tmax為兩個(gè)閥值,且tamxtmin。true_begin是起點(diǎn)檢測(cè)準(zhǔn)確的聲音個(gè)數(shù),true_end是終點(diǎn)檢測(cè)準(zhǔn)確的聲音個(gè)數(shù),count是用于測(cè)試的聲音總數(shù),p_begin表示起點(diǎn)檢測(cè)結(jié)果的準(zhǔn)確率,p_end表示終點(diǎn)檢測(cè)結(jié)果的準(zhǔn)確率,起點(diǎn)檢測(cè)準(zhǔn)確率采用式(412)計(jì)算,終點(diǎn)檢測(cè)準(zhǔn)確率采用式(413)計(jì)算。圖44 純凈語(yǔ)音距離熵算法仿真結(jié)果圖45 15分貝火車噪聲距離熵算法仿真結(jié)果圖46 10分貝火車噪聲距離熵算法仿真結(jié)果圖47 5分貝火車噪聲距離熵算法仿真結(jié)果圖48 0分貝火車噪聲距離熵算法仿真結(jié)果本章在基于譜熵的端點(diǎn)檢測(cè)方法的基礎(chǔ)上,提出了一種基于距離熵的檢測(cè)算法。最開始是靜音段,如果距離熵超過(guò)低門限tmin,就開始標(biāo)記起點(diǎn),進(jìn)入過(guò)渡段。本實(shí)驗(yàn)對(duì)距離熵進(jìn)行相鄰五幀動(dòng)態(tài)平滑。 (49)將每一點(diǎn)的概率密度代入熵的計(jì)算公式,則可以得到每一幀語(yǔ)音的距離熵DE為: (410)基于距離熵的端點(diǎn)檢測(cè)算法總共分為五部分,如圖42所示。從圖中可以看出,通過(guò)對(duì)預(yù)處理后的帶噪語(yǔ)音的時(shí)域信號(hào)進(jìn)行傅里葉變換,可以得到其頻域譜,對(duì))進(jìn)行自乘操作,則可得到頻域功率譜,對(duì)功率譜取對(duì)數(shù),然后進(jìn)行逆傅里葉變換,則可得到帶噪語(yǔ)音每一點(diǎn)的倒譜系數(shù)。熵是一種具有魯棒性的特征,具有一定的抗噪能力,因此很多研究者對(duì)熵進(jìn)行研究,例如:一種叫做近似熵的端點(diǎn)檢測(cè)方法。1948年,香農(nóng)()把關(guān)于熵的概念引入信息論中,把熵作為一個(gè)隨機(jī)事件的不確定性的量度。反之,如果是最混亂的情況,有5個(gè)正面5個(gè)反面,排列構(gòu)型可以有252種?;谧V減法端點(diǎn)檢測(cè)在不同分貝噪聲下的仿真圖如圖。 (321)為避免出現(xiàn)負(fù)功率,減譜時(shí),如果小于,則令為零,即 (322)通常用最開始十幀信號(hào)的平均功率譜來(lái)近似代替,通過(guò)開方,則可以得到。譜減法假定加性噪聲和短時(shí)平穩(wěn)的語(yǔ)音信號(hào)相互獨(dú)立的條件下,從帶噪語(yǔ)音的功率譜中減去噪聲功率譜,從而得到較為純凈的語(yǔ)音頻譜。圖312 短時(shí)過(guò)零在清音無(wú)聲和濁音三種情況下條件概率密度函數(shù)示意圖對(duì)于短時(shí)過(guò)零率,由于清音的多數(shù)能量出現(xiàn)在較高的頻率上,因此清音的過(guò)零率較高,而濁音語(yǔ)音具有高頻跌落的頻譜,所以濁音的過(guò)零率低,噪聲的過(guò)零率大小處于清音和濁音之間。使用多種特征進(jìn)行端點(diǎn)檢測(cè),能在不同信噪比下檢測(cè)效果更好[27]。對(duì)時(shí)域中的語(yǔ)音信號(hào)進(jìn)行FFT變換,則得到頻域信號(hào),頻域方差的計(jì)算方法與時(shí)域方差的計(jì)算方法一樣,先定義一個(gè)矢量 (311)對(duì)平滑后得到 (312)頻域的均值為 (313)頻域的方差為 (314)對(duì)取對(duì)數(shù)后得到 (315)進(jìn)一步平滑得到 (316)通過(guò)分別對(duì)時(shí)域和頻域求得方差后,再把時(shí)域方差和頻域方差進(jìn)行相加,則可求得時(shí)頻方差和特征。由于系統(tǒng)是時(shí)變的,所以實(shí)際計(jì)算的同樣是短時(shí)時(shí)頻方差和。 (31) (32) (33)由第二章可知,公式(32)計(jì)算短時(shí)能量時(shí)是求信號(hào)的平方,這樣得到的短時(shí)能量對(duì)高電頻比較敏感,所以,在通常情況下,用公式(3
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1