freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于vq的大學(xué)生語音識別算法研究畢業(yè)論文-文庫吧資料

2025-06-25 12:41本頁面
  

【正文】 G算法的設(shè)計仿真及結(jié)果分析利用MATLAB編程,采用隨機(jī)選取法實現(xiàn)LBG算法碼書的生成,初始碼書從訓(xùn)練序列中每隔5個樣本選取一組。由于MATLAB是一種面向科學(xué)和工程計算的高級語言,允許用數(shù)學(xué)形式的語言編程,同時又具有大量的庫函數(shù),所以編程簡單、效率高、簡單易學(xué)易用。(2) 通過MATLAB可以對數(shù)字化語音信號進(jìn)行估計和評判。由于MATLAB具有大量數(shù)字信號處理工具箱,并能利用非線性動態(tài)系統(tǒng)分析工具Simulink等優(yōu)點,因此其已成為學(xué)習(xí)、研究數(shù)字語音信號處理的有力的仿真工具軟件。 第四章 仿真結(jié)果及性能分析 MATLAB開發(fā)平臺簡介MATLAB是由MATrix和LABoratoy兩詞的前三個字母組合而成,于20 世紀(jì)70年代后期出于減輕編程負(fù)擔(dān)考慮而設(shè)計的一款功能強(qiáng)大、效率高、交互性好的數(shù)據(jù)計算和可視化計算機(jī)高級語言,它將信號處理、數(shù)值分析、圖形顯示有機(jī)融合為一體,形成了一個極其方便、用戶界面良好的操作環(huán)境。 非典型碼字問題及處理方法在隨機(jī)選擇方法中,存在一些非典型矢量,利用其形成胞腔時,胞腔中常常只有少數(shù)幾個矢量,甚至有可能只有他們自己本身一個矢量。為更精確起見可再計算胞腔的形心,利用類似LBG的算法構(gòu)成含2個碼字的碼書的方法來進(jìn)行分裂。隨機(jī)選取法產(chǎn)生的初始碼書中不存在空胞腔的問題。 LBG算法常見的問題LBG算法中,常遇到的一些問題是空胞腔和隨機(jī)選取法中的非典型碼字如何處理。 乘積碼書法隨機(jī)碼書的初始化方法是用若干個低維數(shù)的碼書作為乘積碼,求得所需的高維數(shù)的碼書,即維數(shù)為、大小為的碼書乘以維數(shù)為、大小為的碼書,得到一個k維碼書,其大小為。若最終的碼書容量為(r為整數(shù)),則需做r輪循環(huán)處理,直至聚類完畢,此時各類質(zhì)心即為所需的碼字。 分裂法分裂法是由Linde,Buzo,Gray在1980年提出來的,該方法生成初始碼書時先取一個較少碼字的碼書,用LBG算法對其優(yōu)化,對優(yōu)化的結(jié)果進(jìn)行分裂,得到較大的體積、較優(yōu)化的碼書,重復(fù)優(yōu)化、分裂、再優(yōu)化過程。與其他多媒體信息比較,語音信息之間的冗余較少。隨機(jī)選取法還具有形成初始碼書過程所需時間較短的特性。 隨機(jī)選取法 隨機(jī)選取法最初是運用在聚類算法中,它是從訓(xùn)練序列中隨機(jī)選取N個矢量作為初始碼字從而構(gòu)成初始碼書。 LBG算法流程如圖31所示: 用給定碼書劃分成N個胞腔 開 始給定碼書大小N,初始碼書訓(xùn)練序列TS置n=0,起始平均失真 以及給定計算停止門限 計算平均失真和相對失真 ; 求出新碼書結(jié) 束 NY 圖31 LBG算法流程圖 LBG算法初始碼書的選取對于初始碼書的選取在最佳碼書的設(shè)計中有很大的影響,要求碼書在開始時對要編碼的數(shù)據(jù)來說要具有一定的代表性,直接取輸入信號矢量作為碼子就是方法之一。 第三步 計算平均失真與相對失真:平均失真為 , (34) 相對失真為 (35)若 ,則停止計算,當(dāng)前的碼書就是設(shè)計好的 ,否則進(jìn)行第四步。第一步 初始化:給定初始碼書,即給定碼書的大小N和碼字,并設(shè)置n=0,設(shè)起始平均失真 ,以及給定計算停止門限。由于實際情況中信源確定多維的概率分布很難,所以利用訓(xùn)練序列建立碼本的LBG算法用得比較多一些。 LBG算法實現(xiàn)流程設(shè)計LBG算法根據(jù)最佳矢量量化器設(shè)計的最佳劃分和最佳碼書這兩個必要條件提出,它的特點是算法理論嚴(yán)密,物理概念清晰和算法實現(xiàn)容易。從對初始碼書進(jìn)行迭代優(yōu)化時開始,直到該系統(tǒng)的性能滿足要求或不再有明顯的改進(jìn)截止。 LBG算法的實現(xiàn)LBG算法在矢量量化中是一個基本算法,它是由標(biāo)量量化器中的Lloyd算法推廣而來,1980年由Linde ,Buzo和 Gray首次提出。 最佳碼書對于給定的區(qū)域邊界,找出最佳碼書矢量,為了使碼書的平均失真最小,碼字必須為相應(yīng)給定的形心,即滿足 centroid質(zhì)心條件: (32)其中,為集合中矢量的個數(shù)。對于給定的碼書可以采用最鄰近準(zhǔn)則NNR(Nearest Neighbor Rule),即對于信源空間的任一矢量X,如果它與矢量的失真小于它和其它碼子之間的失真,則X應(yīng)屬于某區(qū)域邊界: (31)為最佳劃分,即為一個胞腔。在矢量量化器的最佳設(shè)計中,對如何劃分量化區(qū)間和確定量化矢量是其存在的最主要的問題,即要達(dá)到最佳劃分和最佳碼書這兩個條件。由于碼書的設(shè)計也是在這一過程中產(chǎn)生的,所以同時也是最佳碼書的設(shè)計過程。本設(shè)計主要選取LBG算法進(jìn)行矢量量化器的算法設(shè)計。其中為加權(quán)因子,、和要進(jìn)過實驗確定。研究表明,頻譜與能量均攜帶有語音信號的信息,如果僅以功率譜作為失真比較的參數(shù),則語音識別的性能不夠理想。設(shè)x(n)(n=0,1,...,N1)是一幀N長信號,是其p階最佳線性預(yù)測系數(shù),并組成特征矢量,再設(shè)碼書中的某特征矢量為。此時,直接用由這些系數(shù)所描述的信號模型的功率譜進(jìn)行比較是適宜的。為了比較用這種參數(shù)表征的矢量,如果直接使用Euclid失真,顯然意義不大。 (2)線性預(yù)測失真測度用全極點模型表示語音信號的線性預(yù)測方法廣泛應(yīng)用于語音信號處理中。在本畢業(yè)論文設(shè)計中,各種算法中涉及到計算失真的部分均采用的是歐氏距離均方誤差。在矢量量化器的設(shè)計過程中,失真測度的選擇是很重要的,選用的是否得當(dāng)直接影響著系統(tǒng)的性能。編碼的過程中,需要引入失真測度的概念。由于信道中傳輸?shù)牟⒎鞘噶勘旧?,而是其序列號的編碼信號,所以理論上傳輸速率還可以進(jìn)一步提高。在編碼端,輸入矢量X與碼書(a)中的每一個或部分碼字進(jìn)行比較,分別計算它們的失真,檢索到失真最小碼字的序號(或碼書中此碼字所在的地址),并將的編碼信號通過信道傳輸?shù)阶g碼端;在譯碼端,先把信道傳來的編碼信號譯成序號,再根據(jù)序號 (或碼字所在地址),從碼書(b)中查出相應(yīng)的碼字。第一個實際的矢量量化器1978年發(fā)明至今,隨著發(fā)展矢量量化技術(shù)被不斷的推出新的設(shè)計。矢量量化反映在實際中的應(yīng)用就是矢量量化器,矢量量化器在實際生產(chǎn)生活中應(yīng)用非常廣泛,特別是在多媒體信息中更加突出。碼字索引進(jìn)行重新分配可以有效的減少這種失真對于矢量量化來說,設(shè)計性能好的碼書是矢量量化最為關(guān)鍵的問題。 碼字搜索矢量量化碼字搜索算法是當(dāng)碼書已經(jīng)設(shè)計好的時候,輸入給定矢量,在碼書中搜索與輸入碼字間失真最小的碼字。如果用平方誤差測度作為失真測度,且訓(xùn)練矢量數(shù)為N,想要生成含有M(MN)個碼字的碼書,那么設(shè)計碼書的過程就要找到一種最佳方案,把N個訓(xùn)練矢量分成M類,而把這M類的質(zhì)心矢量作為碼書的碼字。矢量量化系統(tǒng)一般情況下可以分解為兩個集合的映射,即 (23) 式中,是編碼器,它是將輸入矢量映射為信道符號中的一個元;是譯碼器,它是將信道符號映射為碼書中的一個碼字,即 (24) (25) 碼書設(shè)計、碼字搜索和碼字索引分配是矢量量化的三個關(guān)鍵技術(shù),其中碼書設(shè)計和碼字搜索尤為重要。不同的劃分或不同的量化矢量的選取就可以構(gòu)成不同的矢量量化器。通常把所有M個量化矢量(重構(gòu)矢量或恢復(fù)矢量)構(gòu)成的集合稱之為碼書或碼本。 若要對一個落在二維矢量空間中的模擬矢量X進(jìn)行量化,首先要選擇一個合適的失真測度,而后利用最小失真原則,分別計算用量化矢量替代X所帶來的失真。如圖22(a)所示,矢量量化就是將平面分成M個如的小區(qū)域,從每個小區(qū)域中找出代表向量,這些代表向量的集合就是有M個區(qū)間的二維矢量量化器。其中,量化矢量構(gòu)成的集合稱為碼書或碼本,碼書中的每個矢量稱為碼字或碼矢。矢量維數(shù)越大,矢量量化的性能就越優(yōu)越。矢量量化是對矢量進(jìn)行量化,它把矢量空間分成若干個小區(qū)域,每個小區(qū)域?qū)ふ乙粋€代表矢量,量化時落入小區(qū)域的矢量就用這個代表矢量代替,或者稱之為被量化為這個代表矢量。因為此時的信號量是一維的標(biāo)量,所以稱之為標(biāo)量量化。 標(biāo)量量化整個信號的動態(tài)范圍被分成若干個小區(qū)間,每個小區(qū)間有一個代表值。 量化的實質(zhì)是把一個模擬信號值的連續(xù)范圍分為若干個相鄰并且具有唯一量值的區(qū)間,凡落在某區(qū)間的抽樣信號樣值都指定為該區(qū)間量值的過程。人們試圖努力找到各種新的碼書優(yōu)化的算法和策略,多種理論研究都應(yīng)用到了碼書算法,例如神經(jīng)網(wǎng)絡(luò),模糊集合論,遺傳算法等。碼書設(shè)計可以視其為一個類似于函數(shù)優(yōu)化的問題,所以設(shè)計時要搜索最優(yōu)化的全局碼書,需要一種全局算法。矢量量化的三大關(guān)鍵步驟和技術(shù)是:碼書設(shè)計、碼字搜索和碼字索引分配,其中碼書設(shè)計和碼字搜索是矢量量化過程中的關(guān)鍵。由于矢量量化高壓縮比的特性,使得它可以應(yīng)用在國防軍事的遙感衛(wèi)星、雷達(dá)監(jiān)測等方面,可以應(yīng)用在高清電視、網(wǎng)絡(luò)視頻等民用設(shè)施的實時傳輸上。矢量量化的研究涉及到許多學(xué)科的技術(shù)和理論知識,應(yīng)用范圍非常廣泛。這些門限值與語種有著密切的關(guān)系。 判決對于輸入信號通過計算而得的測度,根據(jù)若干準(zhǔn)則及專家知識庫,判決選出可能的結(jié)果中最好的那個,由識別系統(tǒng)輸出,這一過程便稱之為判決。知識庫中的知識需要具有便于修改和擴(kuò)充的特點。 專家知識庫用來存儲各種語言學(xué)知識。VQ主要適用于小詞匯量、孤立詞的語音識別中,其過程是將對欲處理的大量語音K維幀矢量通過統(tǒng)計實驗進(jìn)行統(tǒng)計劃分,即將K維無限空間聚類劃分為M個區(qū)域邊界,每個區(qū)域邊界對應(yīng)一個碼字,所有M個碼字構(gòu)成碼本。其算法適合于語音本身易變的特點,適用于非特定人的語音識別,同時也適用于特定人的語音識別。它使用Markov鏈來模擬信號的統(tǒng)計特性變化。它不能對樣本作動態(tài)的訓(xùn)練,不適合于非特定人的語音識別。DTW算法的匹配過程比較細(xì),計算量比較大。此外還有一些混合派生出來的方法,如VQ/DTW法、FSVQ/HMM法等。測度估計是語音識別的核心。 參考模式庫用訓(xùn)練與聚類的方法,由單講話或多講話者的多次重復(fù)的語音參數(shù),從原始語音樣本中去除冗余信息,保留關(guān)鍵數(shù)據(jù),經(jīng)過長時間的訓(xùn)練,再按照一定的規(guī)則對數(shù)據(jù)加以聚類得到的。由于某些參數(shù)的提取較復(fù)雜,因而要折衷考慮選用哪些參數(shù)并確定采用哪種識別方法。同時,還需要考慮到特征參數(shù)的計算量,在保持高識別率的情況下,應(yīng)盡可能減少特征維數(shù),以利于減少存儲的要求和實時實現(xiàn)。特征參數(shù)的好壞對語音識別的精度有很大影響,特征參數(shù)應(yīng)盡可能多的反映出用于識別的信息,之后系統(tǒng)中所有的處理都是建立在特征參數(shù)之上,一旦特征參數(shù)不能很好地反映語音信號的本質(zhì),識別就不能成功。與特征提取相關(guān)的內(nèi)容是特征間的距離測度。特征提取即參數(shù)分析,是指從語音信號波形中獲取一組能夠描述該語音信號特征的參數(shù)的過程。 預(yù)處理預(yù)處理包括反混疊濾波、模數(shù)變換、自動增益控制、去除聲門激勵及口唇輻射影響,以及去除個體發(fā)音的差異和設(shè)備、環(huán)境引起的噪聲影響等,涉及語音識別基元的選取和端點檢測問題。圖21中測度估計、判決和專家知識庫三部分的功能是完成模式匹配。輸入語音 參考模式庫距離測度 測度估計 特征提取預(yù)處理判決 專家知識庫識別結(jié)果訓(xùn)練,聚類 圖21 語音識別的原理框圖圖21所示為語音識別系統(tǒng)的模式匹配原理構(gòu)成圖,它是一種統(tǒng)計模式識別,這里采用的是模板匹配法。根據(jù)該原理,未知語音的模式要與已知語音的參考模式逐一進(jìn)行比較,最佳匹配的參考模式將被作為識別結(jié)果輸出。其中,模式匹配法是將兩個模式直接進(jìn)行比較的方法,是最基本、最原理性的模式識別方法,在實際應(yīng)用中是最廣泛的。模式識別的基本原理是將一個輸入模式與保存在系統(tǒng)中的多個標(biāo)準(zhǔn)模式進(jìn)行比較,找出最近似的標(biāo)準(zhǔn)模式,然后將該標(biāo)準(zhǔn)模式所代表的類名作為輸入模式的類名輸出。 第二章 基本原理模式識別是指計算機(jī)對事物的認(rèn)知,包活語音、文字、圖像、機(jī)器的運行狀態(tài)等。1983年,美國BBN公司研制出了一種采用矢量量化技術(shù)的分段式聲編碼器,可以用150b/s的速率來傳送可懂的話音。這一階段,人們對各種矢量量化系統(tǒng)展開了全面的研究,其中主要是對失真測度的探討,碼書的設(shè)計,快速搜索算法的尋找等等。第二階段:1978年Buzo第一個提出矢量量化器的概念,他提出的量化系統(tǒng)組成分為兩步,首先是將語音信號做線性預(yù)測分析,求出預(yù)測系數(shù);其次對這些系數(shù)做矢量量化,得到了壓縮數(shù)據(jù)的語音編碼器。1977年Berger出版了《率失真理論》一書。幾乎與此同時,Max也得出了同樣的結(jié)論,雖然他們的結(jié)論基本上都是關(guān)于標(biāo)量量化問題的,但他們的算法對后來矢量量化的發(fā)展有著深刻的影響。第一階段:1956年Steinhaus首次系統(tǒng)的闡述了關(guān)于最佳矢量量化的問題。語音是通信系統(tǒng)中最自然的通信媒介,語音識別技術(shù)的應(yīng)用前景是無限的。語音識別和語音合成相結(jié)合,可以構(gòu)成“人機(jī)通信系統(tǒng)”。(5) 因在輸入終端可使用麥克風(fēng)、電話機(jī)等,所以非常經(jīng)濟(jì),還可直接利用現(xiàn)有的電話網(wǎng),并能遙控輸入信息。語音信息輸入速度比打字機(jī)大約快34倍,比人工抄寫文字大約快81
點擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1