freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

一種改進(jìn)的cg-gmm和譜激勵聯(lián)合語音轉(zhuǎn)換技術(shù)研究碩士論文(編輯修改稿)

2025-07-15 23:37 本頁面
 

【文章內(nèi)容簡介】 iiiOSmscore??其中 是總共的票數(shù), 是得某種分的票數(shù), 是其中的某個分值,其值為Mi i。1,2345iscore? 本文的研究內(nèi)容和組織結(jié)構(gòu)語音轉(zhuǎn)換是語音處理領(lǐng)域一個比較新的研究課題,本文首先對語音的兩種推演參數(shù)LPC倒譜和LSF參數(shù)的轉(zhuǎn)換性能進(jìn)行比較;接著在現(xiàn)有的基音周期檢測的基礎(chǔ)上,提出一種新的基于Hilbert 變換的殘差倒譜基音周期檢測方法;其次對現(xiàn)有的CGGMM方法進(jìn)行改進(jìn),通過引入后驗概率門限將GMM和VQ很好地結(jié)合起來,既避免了VQ的非連續(xù)性又減輕了CGGMM 的過平滑;然后對譜激勵轉(zhuǎn)換方法進(jìn)行改進(jìn):以MMSE準(zhǔn)則為基礎(chǔ),將預(yù)測目標(biāo)激勵和殘差波形轉(zhuǎn)換兩種方法結(jié)合起來,獲取比較好的激勵信號;最后從主、客觀兩個方面對改進(jìn)后的性能進(jìn)行評價。本文的內(nèi)容安排如下:第一章:緒論,首先簡單介紹了語音轉(zhuǎn)換的研究意義與研究現(xiàn)狀;其次簡要描述語音產(chǎn)生機(jī)理和數(shù)學(xué)模型;最后給出語音轉(zhuǎn)換的主、客觀評價標(biāo)準(zhǔn)。第二章:語音轉(zhuǎn)換技術(shù)研究,首先給出語音轉(zhuǎn)換的系統(tǒng)框架,其次研究了轉(zhuǎn)換中的各個關(guān)鍵部分:模型的選取、語音的預(yù)處理、參數(shù)提取涉及到的線性預(yù)測分析、訓(xùn)練函數(shù)、語音合成;最后對 LPC 倒譜和 LSF 參數(shù)的轉(zhuǎn)換性能進(jìn)行比較。第三章:基音檢測方法研究,首先對基音周期的轉(zhuǎn)換方法均值法和高斯轉(zhuǎn)換法進(jìn)行比較;其次在現(xiàn)有的基音周期檢測方法的基礎(chǔ)上提出了一種新的基 Hilbert 變換的殘差倒譜基音檢測方法,該方法能夠提高基音檢測的準(zhǔn)確性。第四章:一種改進(jìn)的CGGMM和譜激勵聯(lián)合轉(zhuǎn)換研究,首先對現(xiàn)有的CGGMM方法進(jìn)行改進(jìn),通過引入后驗概率門限將GMM和VQ很好的結(jié)合起來,既避免了VQ的非連續(xù)南京郵電大學(xué)碩士研究生學(xué)位論文 第一章 緒論9性又減輕了CGGMM的過平滑; 然后對譜激勵轉(zhuǎn)換方法進(jìn)行改進(jìn):以MMSE準(zhǔn)則為基礎(chǔ),引入一個權(quán)重優(yōu)化因子,將預(yù)測目標(biāo)激勵和殘差波形轉(zhuǎn)換這兩種結(jié)合起來,獲取比較好的激勵信號。第五章:實驗結(jié)果及性能研究,本章給出課題的實驗平臺、實驗框圖和實驗結(jié)果,并從主、客觀兩個方面對轉(zhuǎn)換后的語音進(jìn)行評價。仿真結(jié)果表明,本文提出的改進(jìn)方法無論在頻譜包絡(luò)方面還是譜激勵方面都好于傳統(tǒng)的CGGMM算法。第六章:總結(jié)與展望。南京郵電大學(xué)碩士研究生學(xué)位論文 第二章 語音轉(zhuǎn)換技術(shù)研究10第二章 語音轉(zhuǎn)換技術(shù)研究 語音轉(zhuǎn)換框架一般來說整個語音的分析合成系統(tǒng)框架如圖 21 所示:首先對語音進(jìn)行參數(shù)提取;然后對語音的基音、聲門波形狀、共振峰、增益控制各個部分進(jìn)行處理;最后合成語音。語音信號參數(shù)提取清濁音判斷改變波形改變形狀改變參數(shù)修正波形增加/減少基音抖動合成語音提取濁音增益擾動增益包絡(luò)基音波形基音周期增益控制聲門波形狀共 振 峰基音部分增加/減少增加/減少分析階段 修正階段 合成階段圖 21 語音的分析合成框架下面我們給出具體的語音轉(zhuǎn)換框圖即圖 22。一般來說語音轉(zhuǎn)換分為兩個階段:訓(xùn)練階段和轉(zhuǎn)換階段。訓(xùn)練階段:首先提取源、目標(biāo)說話人的特征參數(shù);其次對這兩組特征參數(shù)進(jìn)行對齊;最后訓(xùn)練對齊后的特征參數(shù),得到源、目標(biāo)說話人之間的轉(zhuǎn)換規(guī)則。轉(zhuǎn)換階段:提取源語音的特征參數(shù),用訓(xùn)練階段得到的轉(zhuǎn)換規(guī)則進(jìn)行轉(zhuǎn)換,最后合成語音。南京郵電大學(xué)碩士研究生學(xué)位論文 第二章 語音轉(zhuǎn)換技術(shù)研究11源說話人語音 語音轉(zhuǎn)換規(guī)則特征參數(shù)提取訓(xùn)練目標(biāo)說話人語音 特征參數(shù)提取對齊源語音 特征參數(shù)提取 語音轉(zhuǎn)換 語音合成轉(zhuǎn) 換 階 段訓(xùn)練階段圖 22 語音的轉(zhuǎn)換框圖從圖 22 中可以看出,語音轉(zhuǎn)換的關(guān)鍵部分包括:語音模型的選取、語音特征參數(shù)的提取、語音訓(xùn)練方法的選擇、語音合成。接下來分別介紹這幾個部分。 語音轉(zhuǎn)換的系統(tǒng)模型語音模型的選取在語音轉(zhuǎn)換中起著關(guān)鍵作用,一個好的模型的標(biāo)準(zhǔn)是最能夠描述語音的個性特性,當(dāng)然模型的選擇也受很多因素的影響,例如模型復(fù)雜度、計算量大小、訓(xùn)練數(shù)據(jù)的多少,因此選擇一個模型要綜合考慮各個因素。聲源濾波模型:語音轉(zhuǎn)換的研究大都基于聲源濾波模型,具體來說,聲源濾波模型主要有 LPC 分析合成模型和基于倒譜包絡(luò)的語音模型。LPC 分析合成模型是應(yīng)用較多的語音模型,該模型基于線性預(yù)測分析原理,符合語音的產(chǎn)生原理,它將語音有效地分解為譜包絡(luò)和激勵兩個部分,一般來說,譜包絡(luò)部分由 LPC 系數(shù)及其推演參數(shù)描述,激勵部分由 LPC 殘差描述,這樣譜包絡(luò)的轉(zhuǎn)換可以通過對 LPC 及其推演參數(shù)來實現(xiàn),韻律轉(zhuǎn)換也可以通過對 LPC 殘差的轉(zhuǎn)換來實現(xiàn),而且該模型簡單、方便、計算量小。正弦模型:該模型將語音信號看作是由一系列正弦波疊加而成: (21()cos()LlllsnAwn????1)其中 是角頻率, 是相位, 是幅值, 是正弦波的個數(shù)。在實際應(yīng)用中一般采lwl?lL用諧波+噪聲模型(HNM) ,這是因為諧波+噪聲模型能更準(zhǔn)確地反映語音波形信息,更容南京郵電大學(xué)碩士研究生學(xué)位論文 第二章 語音轉(zhuǎn)換技術(shù)研究12易實現(xiàn)語音音色轉(zhuǎn)換的合成輸出。一些研究表明該方法比 LPC 方法得到更多的譜包絡(luò)細(xì)節(jié),但是該模型比較復(fù)雜,而且計算量比較大。STRAIGHT 模型:STRAIGHT(Speech Transformation and Representation using Adaptive Interpolation of weighted spectrum)模型是近年來提出的一種新模型,利用該模型進(jìn)行語音轉(zhuǎn)換有三大優(yōu)點:(1)在時頻域利用音節(jié)自適應(yīng)重建語音信號;(2)能夠可靠且準(zhǔn)確地提取 參數(shù),在提取 參數(shù)時一般采用 1ms 間隔;(3)利用人為的相位全0f0f通濾波器來提取源語音的特征參數(shù)。同樣,該模型比較復(fù)雜、計算量大、對語音的建模要求也比較嚴(yán)格。本文采用簡單、方便而且計算量小的 LPC 分析合成模型,該模型基于線性預(yù)測分析,關(guān)于線性預(yù)測分析在 節(jié)介紹。由于語音是時變的連續(xù)信號,因此在對語音進(jìn)行分析研究前首先要對語音進(jìn)行相關(guān)的預(yù)處理,接下來介紹語音的預(yù)處理。 語音預(yù)處理雖然語音信號具有時變特性,但是在一個短時間范圍內(nèi)(一般認(rèn)為 10~30ms) ,其特性基本保持不變,因此可以將語音看作是一個準(zhǔn)穩(wěn)態(tài)過程,即語音信號具有短時平穩(wěn)性。所以任何語音信號的分析和處理都必須建立在“短時”的基礎(chǔ)上,即要進(jìn)行“短時分析”[40]。圖 23 是語音短時分析的前期處理部分,該部分包括語音的放大濾波、采樣量化、預(yù)加重和分幀加窗。聲音源放大、濾波 A/D 預(yù)加重分幀、加窗端點檢測特征提取圖 23 語音預(yù)處理過程預(yù)處理:語音信號的平均功率譜受聲門激勵和口鼻輻射的影響,高端在 800HZ 以上按 6dB/倍頻程跌落,運用預(yù)處理技術(shù)可以提升高頻分量,使信號的頻譜變得平坦,保持在整個頻帶中能用同樣的信噪比求頻譜,便于頻譜分析或聲道參數(shù)分析。預(yù)處理一般用一階的數(shù)字濾波器表示: ,在本文中我們?nèi)?。 1()HZz?????分幀:一般每秒的幀數(shù)約為 33~100 幀,本文所用的語音均采用 16KHZ 采樣、16bit量化,選取的語音幀長為 320 個采樣點(20ms) ,為了使幀與幀之間平滑過渡,保持連續(xù)南京郵電大學(xué)碩士研究生學(xué)位論文 第二章 語音轉(zhuǎn)換技術(shù)研究13性,我們采用 160 個采樣點作為幀移實現(xiàn)語音的交疊分段。加窗:在時域,一般是用一個長度有限的窗函數(shù) 截取一段語音信號來進(jìn)行分析,()wn并讓這個窗滑動以便分析任一時刻附近的信號。一個好的窗函數(shù)的標(biāo)準(zhǔn)是:窗口邊緣兩端不應(yīng)急劇變化、減小截斷效應(yīng)、頻域要有較寬的帶寬及較小的邊帶最大值。在進(jìn)行語音分析時,用的比較多的窗函數(shù)是矩形窗、漢寧(Hanning)窗和漢明(Hamming )窗。分別介紹如下:( 為窗長):N矩形窗: (22)101()nNw??????其 他漢寧窗: (23)[1cos(2/)]01()nLNn????????其 他也可以寫為: (24)221112()[cos()](().()(1nnjjNwNNnwnRneRN????????漢明窗: (25).46cos(2/)0()0Lnn?????其 他也可以寫為: (26)2()[()](1NnwR??表 21 幾種窗函數(shù)的性能比較窗函數(shù) 主瓣寬度 旁瓣峰值衰減(dB) 阻帶最小衰減(dB)矩形窗 4π/N -13 -21漢寧窗 8π/N -31 -44漢明窗 8π/N -41 -53本文的實驗均基于移動的漢明窗(Hamming)來實現(xiàn)語音的分幀加窗。端點檢測:端點檢測的目的是確定一段語音的起始點和終止點。有效的端點檢測不但能使處理時間減到最少(分析幀數(shù)減少) ,而且能排除無聲段的噪聲干擾,提高處理質(zhì)量。 。對于前端本文采用雙門限(過零率和南京郵電大學(xué)碩士研究生學(xué)位論文 第二章 語音轉(zhuǎn)換技術(shù)研究14短時能量)檢測算法代替?zhèn)鹘y(tǒng)的單門限(過零率)檢測法;對于后端我們用短時能量進(jìn)行處理,一般只要短時平均幅度值降低到該音節(jié)最大短時平均幅度的 1/16 左右就可以認(rèn)為該音節(jié)結(jié)束。圖 24 端點檢測前后語音波形圖對比 線性預(yù)測分析 線性預(yù)測分析原理線性預(yù)測分析是用過去的 個樣點值來預(yù)測現(xiàn)在或未來的樣點值: p (27)1?()()isnas???則預(yù)測誤差 為:()en (28)1?()()()pienssnas???,語音抽樣信號 和激勵信號 之間的關(guān)系可()en以用下列的差分方程來表示:南京郵電大學(xué)碩士研究生學(xué)位論文 第二章 語音轉(zhuǎn)換技術(shù)研究15 (29)1()()pisnGeasn????從公式(29)中可以看出,語音樣點間存在相關(guān)性,因此可以用過去的樣點值來預(yù)測未來得樣點值。在模型參數(shù)估計過程中,把下面的系統(tǒng)稱為線性預(yù)測器: (210)1?()()pisnas??式中 稱為線性預(yù)測系數(shù)。這樣, 階線性預(yù)測器的系統(tǒng)函數(shù)具有如下形式:ia (211)1()piiPza??? (212)1()()piiGEzAS??公式(212)中, 稱為逆濾波器。通常在最小均方誤差準(zhǔn)則(MMSE)下求預(yù)()z測系數(shù) 的最佳估值。ia在求解線性預(yù)測方程時, 的選擇是非常重要的,應(yīng)該從頻譜估計精度、計算量、p存儲量等多方面考慮。選取 的原則是首先保證有足夠的極點來模擬聲道特性的諧振結(jié)構(gòu)。南京郵電大學(xué)碩士研究生學(xué)位論文 第二章 語音轉(zhuǎn)換技術(shù)研究16圖 25 預(yù)測誤差(縱軸)和階數(shù) (橫軸)的關(guān)系圖p從圖 25 中可以看出:隨著 的增加預(yù)測誤差會有所下降,但是到一定的程度基本p趨于平緩。本文取預(yù)測階數(shù) 。16? 兩種推演參數(shù)的比較1)LPC 倒譜LPC 倒譜一般通過信號的傅立葉變換,取模的對數(shù),再求反傅立葉變換得到,如圖29 所示:信號 DFT 取對數(shù) IDFT圖 26 LPC 倒譜的定義 (213)1/1nknknkpacpC????????????當(dāng) 當(dāng)其中 為倒譜系數(shù), 為 LPC 系數(shù)。na南京郵電大學(xué)碩士研究生學(xué)位論文 第二章 語音轉(zhuǎn)換技術(shù)研究17 (214)11?()?()()1?()nkkpkhaahnp???????????公式(213)給出倒譜系數(shù)和 LPC 系數(shù)的關(guān)系式,也可以直接利用公式(214)從預(yù)測系數(shù) 中求倒譜系數(shù) 。ka?()hn2)線譜對 LSF 參數(shù)線譜對參數(shù)是線性預(yù)測參數(shù)的另一種表示形式,首先它是頻域參數(shù),所以和信號的譜包絡(luò)有更緊密的聯(lián)系;其次它具有良好的量化特性和內(nèi)插特性,使 LSF 在整個頻率軸上的稀疏直接對應(yīng)頻譜的峰與谷;最后使用 LSF 產(chǎn)生的誤差只會影響到局部的譜結(jié)構(gòu),不會擴(kuò)散到整個頻譜上,使得相同質(zhì)量的合成語音所需的數(shù)碼率得以降低。圖 27 LPC 參數(shù)轉(zhuǎn)換的基音頻率圖(女轉(zhuǎn)男)南京郵電大學(xué)碩士研究生學(xué)位論文 第二章 語音轉(zhuǎn)換技術(shù)研究18圖 28 LPC 倒譜轉(zhuǎn)換的基音頻率圖(女轉(zhuǎn)男)圖 29LSF 參數(shù)轉(zhuǎn)換的基音頻率圖(女轉(zhuǎn)男)圖 2
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1