freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

20xx新編機器人的語音識別技術(shù)-文庫吧

2025-09-09 12:38 本頁面


【正文】 函數(shù) 。 矢量量化器和碼書的設(shè)計 矢量量化器和碼書設(shè)計方法是采用遞推算法,這個算法就是 LBG算法。整個算法實際上就是最佳設(shè)計和最佳碼書兩個條件的反復(fù)迭代過程,即由初始碼書尋找最佳碼書的迭代過程。它從對初始碼書進行迭代優(yōu)化開始,一直到系統(tǒng)性能滿足要求或不再有明顯的改進為止。 隱馬爾可夫模型 隱馬爾可夫模型( Hidden Markov Models,簡稱為 HMM),作為語音信號的一種統(tǒng)計模型,今天正在語音處理的各個領(lǐng)域中獲得廣泛 14 的應(yīng)用 。 大約 100 年前,數(shù)學(xué)家和工程師們就已經(jīng)知道馬爾可夫鏈了。但是,只是在近三十幾年里,它才被用到語音信號處理中來,其主要原因在于當時缺乏一種能使該模型參數(shù)與語音信號處理達到最佳匹配的有效方法。直到 20 世紀 60 年代后期,才有人提出了這種匹配方法,而有關(guān)它的理論基礎(chǔ),是在 1970 年前后由 Baum 等人建立起來的,隨后由 CMU 的 Baker 和 IBM 的 Jelinek 等人將其應(yīng)用到語音 識別之中。由于 Bell實驗室 Rabiner 等人在 20 世紀 80 年代中期對 HMM 的深入淺出的介紹,才逐漸使 HMM 為世界各國從事語音信號處理的研究人員所了解和熟悉,進而成為公認的一個研究熱點。近幾十年來,隱馬爾可夫模型技術(shù)無論是在理論上或是實踐上都有許多進展。其基本理論和各種實用算法是現(xiàn)代語音識別等的重要基礎(chǔ)之一。 HMM 的基本參數(shù) 對于語音識別, HMM 可以用下面六個模型參數(shù)來定義,即: M= {S,O,A,Bπ ,F} S:模型中狀態(tài)的有限集合,即模型由幾個狀態(tài)組成。設(shè)有 N 個狀態(tài), S= {iS |i = 1, 2,? ,N}。記 t 時刻模型所處狀態(tài)為 ts ,顯然 ts ∈ (1s , ? , Ns )。 O:輸出的觀測值符號的集合,即每個狀態(tài)對應(yīng)的可能的觀察值數(shù)目。記 M 個觀察值為 1O ,?, MO ,記 t 時刻觀察到的觀察值為 tO ,其中 tO ∈ ( 1O ,? , MO )。 A:狀態(tài)轉(zhuǎn)移概率的集合。所有轉(zhuǎn)移概率可以構(gòu)成一個轉(zhuǎn)移概率矩 15 陣,即: A= 1... ...1ai ainan ann?????? 其中 ija 是從狀態(tài) iS 到狀態(tài) jS 轉(zhuǎn)移時的轉(zhuǎn)移概率, 1≤ i, j≤ N 且有 0≤ ija ≤ 1,1 1Nj aij? ?? 。 B:輸出觀測值概率的集合。 B= {ijb (k)},其中 ijb (k)是從狀態(tài) iS到狀態(tài) jS 轉(zhuǎn)移時觀測值符號 k 的輸出概率。根據(jù) B 可將 HMM 分為連續(xù)型 HMM和離散型 HMM 等。 ( ) 1ijk bk?? (離散型 HMM) ( ) 1ijb k dk???? ?? (連續(xù)型 HMM) π:系統(tǒng)初始狀態(tài)概率的集合,π= {i? }, i? 表示初始狀態(tài)是 is 的概率,即: 1[ ] , (1 )tiP S s i N? ? ? ? ? 1j? ?? F:系統(tǒng)終了狀態(tài)的集合。 這里需要說明的是,嚴格地說 Markov 模型是沒有終了狀態(tài)的,只是在語音識別里用的 Markov 模型要設(shè)定終了狀態(tài)。 這樣,可以記一個 HMM 為 M={S, O, A, B,π, F},為了便于表示,常用下面的形式表示一個 HMM,即簡寫為 M={A, B,π }。所以形象地說, HMM 可以分為兩部分,一個是 Markov 鏈,由π、 A 描述,產(chǎn)生的輸出為狀態(tài)序列。另一個是一 個隨機過程,由 B 描述,產(chǎn)生的輸出為觀察值序列, T 為觀察值時間長度 。 16 隱馬爾可夫模型的基本算法 欲使所建立的 HMM 對于實際應(yīng)用有效,下面三個問題必須加以解決: ( 1) 識別問題:給定觀察符號序列 0=o1,o2,? , oT和模型 M={A,B,π },如何快速有效地計算觀察符號序列的輸出概率 P(O|M); ( 2) 尋找與給定觀察字符序列對應(yīng)的最佳的狀態(tài)序列:給定觀察字符號序列和輸出該符號序列的模型 M={ A, B,π },如何有效地確定與之對應(yīng)的最佳的狀態(tài)序列。即估計出模型產(chǎn)生觀察字符號序列時最有可能 經(jīng)過的路徑。它可以被認為是所有可能的路徑中,概率最大的路徑。這種算法的指導(dǎo)思想就是概率最大的路徑是最有可能經(jīng)過的路徑,即最佳的狀態(tài)序列路徑; ( 3) 模型訓(xùn)練問題:實際上是一個模型參數(shù)估計問題,即對于初始模型和給定用于訓(xùn)練的觀察符號序列 0=o1,o2,? , oT 如何調(diào)整模型 M={ A, B,π }的參數(shù),使得輸出概率 P (O M)最大 [18]。下面結(jié)合討論這三個問題的解法,介紹 HMM 的基本算法。 前向 后向算法 前向 后向算法( ForwardBackward,簡稱為 FB 算法)是用來計算給定一 個觀察值序列 0=o1,o2,? , oT 以及一個模型 M={ A,B,π }時,由模型 M 產(chǎn)生出 O 的概率 P (O|M)的。設(shè) S1 是初始狀態(tài), SN 是終了狀態(tài),則前向 后向算法可以介紹如下: 1.前向算法 17 前向算法即按輸出觀察值序列的時間,從前向后遞推計算輸出概率。首先說明下列符號的定義: 0=o1,o2,? , oT 輸出的觀察符號序列 P(O|M) 給定模型 M 時,輸出符號序列 O 的概率 ija 從狀態(tài) iS 到狀態(tài) jS 的轉(zhuǎn)移概率 ()ij tbo 從狀態(tài) iS 到狀態(tài) jS 發(fā)生轉(zhuǎn)移時輸出 to 的概率 ()taj 輸出部分符號序列 o1,o2,? , ot 并且到達狀態(tài) jS 的概率,即前向概率 由上面符號的定義,則 ()taj可由下面的遞推公式計算得到: ( 1)初始化 (1) 1 ( ) 0 ( 1)ooa a j j? ? ?, ( 2)遞推公式 1( ) ( ) ( )t t ij ij ta j a i a b o??? ( t=1,2,? ,T;i,j=1,2,? ,N) ( 3)最后結(jié)果 P( O|M)= ()TaN t 時刻的 ()taj等于 t1 時刻的所有狀態(tài)的 1( ) ( )t ij ij ta i a b o? 之和,當然如果當狀態(tài) iS 到狀態(tài) jS 沒有轉(zhuǎn)移時 ija =0。這樣在 t 時刻對所有狀態(tài) jS (j=1,2,? , N)的 ()taj都計算一次,則每個狀態(tài)的前向概率都更新了一次,然后進入 t+1 時刻的遞推過程。 與前向算法 類似,后向算法即按輸出觀察值序列的時間,從后向前遞推計算出概率的方法。首先說明下列符號的定義: 18 0=o1,o2,? , oT 輸出的觀察符號序列 P(O|M) 給定模型 M 時,輸出符號序列 O 的概率 ija 從狀態(tài) iS 到狀態(tài) jS 的轉(zhuǎn)移概率 ()ij tbo 從狀態(tài) iS 到狀態(tài) jS 發(fā)生轉(zhuǎn)移時輸出 ot的概率 ()t i? 從狀態(tài) iS 開始到狀態(tài) NS 結(jié)束輸出部分符號序列 ot+1, ot+2,?, oT 的概率,即后向概率。 ()t i? 可由下面的遞推公式計算得到: ( 1)初始化 ( ) 1 , ( ) 0 ( )TTN j j N??? ? ? ( 2)遞推公式11( ) ( ) ( )t t ij ij tji j a b o?? ??? ? ( t=T,T+1,?, 1; i,j=1,2, ?, N) ( 3)最后結(jié)果 P(O|M)= 11 ( ) (1)Nioi i? ? ?? ?? 根據(jù)定義的前向和后向概率,有如下關(guān)系成立: 1111P ( O | M ) = ( ) ( ) ( ) ,1 1NNt ij ij i iij a i a b o j t T????? ? ? ??? 維特比( Viterbi)算法 如何有效地確定與之對應(yīng)的最佳的狀態(tài)序列。這可以由另一個 HMM 的基本算法 Viterbi 算法來解決。 Viterbi 算法解決了給定一個觀察值序列 120 , ,..., To o o? 和一個模型 M={A, B,π }時,在最佳意義上確定一個狀態(tài)序列 12, ,..., TS s s s? 的問題。這里討論的最佳意義上的狀 19 態(tài)序列,是指使 P( S, O/M)最大時確定的狀態(tài)序列。即 HMM 輸出一個觀察值序列 120 , ,..., To o o? 時,可能通過的狀態(tài)序列 12, ,..., TS s s s? 路徑有多種,這里面使輸出概率最大的狀態(tài)序列就是我們的所求。Viterbi 算法可以敘述如下: ( 1)初始化 39。39。00(1) 1, ( ) 0a a j?? ( j≠ 1) ( 2)遞推公式 39。39。1( ) m a x ( ) ( )t t ij ij ta j a j a b o?? (t=1,2,?, T;i,j=1,2,?, N) ( 3)最后結(jié)果 39。m a x ( , 0 / ) ( )TP S M a N? 在這個遞推公式中,每一次使 39。()taj最大的狀態(tài) i 組成的狀態(tài)就是所求的最佳狀態(tài)序列。所以利用 Viterbi 算法求取最佳狀態(tài)序列的步驟如下: ( 1) 給每個狀態(tài)準備一個數(shù)組變量 39。()taj,初始化時令初始狀態(tài) S1 的數(shù)組變量 39。0(1)a 為 1,其他狀態(tài)的數(shù)組 39。0()aj為 0; ( 2)根據(jù) t 時刻輸出的觀察符號 ot 計算 39。39。 139。 39。 39。1 1 1 1 2 2 1( ) m a x ( )m a x { ( 1 ) ( ) , ( 2) ( ) , .. ., ( ) ( ) }t i ij ij iii j j i i j j i i Nj Nj iia j a a b oa a b o a a b o a N a b o?? ? ??? ( j=1,2,?, N) 當狀態(tài) iS 到狀態(tài) jS 沒有轉(zhuǎn)移時 0ija? ;設(shè)計一個符號數(shù)組變量,稱為最佳狀態(tài)序列寄存器,利用這個最佳狀態(tài)序列寄存器把每一次使 39。()taj最大的狀態(tài) i 保存下來; ( 3) t≠ T 時轉(zhuǎn)移到 ( 2),否則執(zhí)行( 4); ( 4)把這時的終了狀態(tài)寄存器 39。 ()TaN內(nèi)的值取出,則: 39。Pm a x( S,O /M )= ( )TaN 輸出最佳狀態(tài)序列寄存器的值,即為所求 20 的最佳狀態(tài)序列。 軟件設(shè)計 主程序的設(shè)計 語音識別系統(tǒng)功能的實現(xiàn)大部 分是由軟件來完成的。因此,語音識別系統(tǒng)的軟件設(shè)計是十分復(fù)雜的。 本次程序的設(shè)計是依靠 C 語言和匯編語言共同完成的 21 開 始初始化是否第一次下載 ?語音訓(xùn)練與存儲語音識別初始化是否觸發(fā)命令 ?是否起始命令執(zhí)行相應(yīng)命令第幾條命令 ?是否超時 ?播放無語音信號提示音EN DNYYYYNN 主程序流程圖。在主程序中開始是對 RAM 存儲器進行清除,這為存放提取的語音信號的特征矢量和模板庫做準備。播放第一條提示音是為了提醒用戶系統(tǒng)的語音訓(xùn)練己啟動,現(xiàn)在可以進行訓(xùn)練。訓(xùn)練首先是此系統(tǒng)的觸發(fā)名稱,即系統(tǒng)的名字。接下來就是依次對各條命令進行訓(xùn)練。在訓(xùn)練過程中,如訓(xùn)練成功,則有語音提示進行下一條的 22 訓(xùn)練 :如出現(xiàn)訓(xùn)練失敗也會提示用戶繼續(xù)訓(xùn)練此條語 音。直到全部命令訓(xùn)練完畢后,系統(tǒng)將準備進行語音識別。識別初始化是確定語音輸入來源于 A/D 轉(zhuǎn)換器的 MIC 通道。播放開始識別的提示音是為了讓用戶明確現(xiàn)在可以向系統(tǒng)下達命令了。系統(tǒng)接到命令后就開始進行識別,如識別成功,則系統(tǒng)會按命令執(zhí)行,如識別失敗,系統(tǒng)也會通過語音提示用戶。 系統(tǒng)的主程序是依靠調(diào)用各子程序來完成的,而系統(tǒng)的子程序主要有語音訓(xùn)練程序、語音識別程序、語音播放程序及機器人運動程序。其中語音部分主要依靠語音壓縮程序來完成。 語音壓縮算法的研究 壓縮編碼的目的是通過對資料的壓縮, 達到高效率存儲和轉(zhuǎn)換資料的結(jié)果,即在保證一定聲音質(zhì)量的條件下,以最小的資料率來表達和傳送聲音信息。壓縮編碼是必要的,實際應(yīng)用中,未經(jīng)壓縮編碼的音頻資料量很大,直接進行傳播或存儲是不現(xiàn)實的,所以要通過對信 23 號趨勢的預(yù)測和冗余信息處理,進行資料的壓縮,這樣就可以使用較少的資源建立更多的信息。常用的壓縮編碼有波形編碼、參數(shù)編碼和混合編碼 。 用于 SPCE 系列芯片語音功能的語音壓縮與解壓縮算法有 SACM_A2020, SACM_S480, 和 SACM_S240, 其對應(yīng)的語音壓縮編碼率類型分別為 16 Kb/s, 20 Kb/s, 24 Kb/s; 418 Kb/s, 712 Kb/s;214 Kb/s。 本設(shè)計用到的壓縮算法有 SACM_A2020和 SACM_S480。 SACM_
點擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1