freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

20xx新編機(jī)器人的語(yǔ)音識(shí)別技術(shù)-文庫(kù)吧

2025-09-09 12:38 本頁(yè)面


【正文】 函數(shù) 。 矢量量化器和碼書的設(shè)計(jì) 矢量量化器和碼書設(shè)計(jì)方法是采用遞推算法,這個(gè)算法就是 LBG算法。整個(gè)算法實(shí)際上就是最佳設(shè)計(jì)和最佳碼書兩個(gè)條件的反復(fù)迭代過(guò)程,即由初始碼書尋找最佳碼書的迭代過(guò)程。它從對(duì)初始碼書進(jìn)行迭代優(yōu)化開(kāi)始,一直到系統(tǒng)性能滿足要求或不再有明顯的改進(jìn)為止。 隱馬爾可夫模型 隱馬爾可夫模型( Hidden Markov Models,簡(jiǎn)稱為 HMM),作為語(yǔ)音信號(hào)的一種統(tǒng)計(jì)模型,今天正在語(yǔ)音處理的各個(gè)領(lǐng)域中獲得廣泛 14 的應(yīng)用 。 大約 100 年前,數(shù)學(xué)家和工程師們就已經(jīng)知道馬爾可夫鏈了。但是,只是在近三十幾年里,它才被用到語(yǔ)音信號(hào)處理中來(lái),其主要原因在于當(dāng)時(shí)缺乏一種能使該模型參數(shù)與語(yǔ)音信號(hào)處理達(dá)到最佳匹配的有效方法。直到 20 世紀(jì) 60 年代后期,才有人提出了這種匹配方法,而有關(guān)它的理論基礎(chǔ),是在 1970 年前后由 Baum 等人建立起來(lái)的,隨后由 CMU 的 Baker 和 IBM 的 Jelinek 等人將其應(yīng)用到語(yǔ)音 識(shí)別之中。由于 Bell實(shí)驗(yàn)室 Rabiner 等人在 20 世紀(jì) 80 年代中期對(duì) HMM 的深入淺出的介紹,才逐漸使 HMM 為世界各國(guó)從事語(yǔ)音信號(hào)處理的研究人員所了解和熟悉,進(jìn)而成為公認(rèn)的一個(gè)研究熱點(diǎn)。近幾十年來(lái),隱馬爾可夫模型技術(shù)無(wú)論是在理論上或是實(shí)踐上都有許多進(jìn)展。其基本理論和各種實(shí)用算法是現(xiàn)代語(yǔ)音識(shí)別等的重要基礎(chǔ)之一。 HMM 的基本參數(shù) 對(duì)于語(yǔ)音識(shí)別, HMM 可以用下面六個(gè)模型參數(shù)來(lái)定義,即: M= {S,O,A,Bπ ,F} S:模型中狀態(tài)的有限集合,即模型由幾個(gè)狀態(tài)組成。設(shè)有 N 個(gè)狀態(tài), S= {iS |i = 1, 2,? ,N}。記 t 時(shí)刻模型所處狀態(tài)為 ts ,顯然 ts ∈ (1s , ? , Ns )。 O:輸出的觀測(cè)值符號(hào)的集合,即每個(gè)狀態(tài)對(duì)應(yīng)的可能的觀察值數(shù)目。記 M 個(gè)觀察值為 1O ,?, MO ,記 t 時(shí)刻觀察到的觀察值為 tO ,其中 tO ∈ ( 1O ,? , MO )。 A:狀態(tài)轉(zhuǎn)移概率的集合。所有轉(zhuǎn)移概率可以構(gòu)成一個(gè)轉(zhuǎn)移概率矩 15 陣,即: A= 1... ...1ai ainan ann?????? 其中 ija 是從狀態(tài) iS 到狀態(tài) jS 轉(zhuǎn)移時(shí)的轉(zhuǎn)移概率, 1≤ i, j≤ N 且有 0≤ ija ≤ 1,1 1Nj aij? ?? 。 B:輸出觀測(cè)值概率的集合。 B= {ijb (k)},其中 ijb (k)是從狀態(tài) iS到狀態(tài) jS 轉(zhuǎn)移時(shí)觀測(cè)值符號(hào) k 的輸出概率。根據(jù) B 可將 HMM 分為連續(xù)型 HMM和離散型 HMM 等。 ( ) 1ijk bk?? (離散型 HMM) ( ) 1ijb k dk???? ?? (連續(xù)型 HMM) π:系統(tǒng)初始狀態(tài)概率的集合,π= {i? }, i? 表示初始狀態(tài)是 is 的概率,即: 1[ ] , (1 )tiP S s i N? ? ? ? ? 1j? ?? F:系統(tǒng)終了狀態(tài)的集合。 這里需要說(shuō)明的是,嚴(yán)格地說(shuō) Markov 模型是沒(méi)有終了狀態(tài)的,只是在語(yǔ)音識(shí)別里用的 Markov 模型要設(shè)定終了狀態(tài)。 這樣,可以記一個(gè) HMM 為 M={S, O, A, B,π, F},為了便于表示,常用下面的形式表示一個(gè) HMM,即簡(jiǎn)寫為 M={A, B,π }。所以形象地說(shuō), HMM 可以分為兩部分,一個(gè)是 Markov 鏈,由π、 A 描述,產(chǎn)生的輸出為狀態(tài)序列。另一個(gè)是一 個(gè)隨機(jī)過(guò)程,由 B 描述,產(chǎn)生的輸出為觀察值序列, T 為觀察值時(shí)間長(zhǎng)度 。 16 隱馬爾可夫模型的基本算法 欲使所建立的 HMM 對(duì)于實(shí)際應(yīng)用有效,下面三個(gè)問(wèn)題必須加以解決: ( 1) 識(shí)別問(wèn)題:給定觀察符號(hào)序列 0=o1,o2,? , oT和模型 M={A,B,π },如何快速有效地計(jì)算觀察符號(hào)序列的輸出概率 P(O|M); ( 2) 尋找與給定觀察字符序列對(duì)應(yīng)的最佳的狀態(tài)序列:給定觀察字符號(hào)序列和輸出該符號(hào)序列的模型 M={ A, B,π },如何有效地確定與之對(duì)應(yīng)的最佳的狀態(tài)序列。即估計(jì)出模型產(chǎn)生觀察字符號(hào)序列時(shí)最有可能 經(jīng)過(guò)的路徑。它可以被認(rèn)為是所有可能的路徑中,概率最大的路徑。這種算法的指導(dǎo)思想就是概率最大的路徑是最有可能經(jīng)過(guò)的路徑,即最佳的狀態(tài)序列路徑; ( 3) 模型訓(xùn)練問(wèn)題:實(shí)際上是一個(gè)模型參數(shù)估計(jì)問(wèn)題,即對(duì)于初始模型和給定用于訓(xùn)練的觀察符號(hào)序列 0=o1,o2,? , oT 如何調(diào)整模型 M={ A, B,π }的參數(shù),使得輸出概率 P (O M)最大 [18]。下面結(jié)合討論這三個(gè)問(wèn)題的解法,介紹 HMM 的基本算法。 前向 后向算法 前向 后向算法( ForwardBackward,簡(jiǎn)稱為 FB 算法)是用來(lái)計(jì)算給定一 個(gè)觀察值序列 0=o1,o2,? , oT 以及一個(gè)模型 M={ A,B,π }時(shí),由模型 M 產(chǎn)生出 O 的概率 P (O|M)的。設(shè) S1 是初始狀態(tài), SN 是終了狀態(tài),則前向 后向算法可以介紹如下: 1.前向算法 17 前向算法即按輸出觀察值序列的時(shí)間,從前向后遞推計(jì)算輸出概率。首先說(shuō)明下列符號(hào)的定義: 0=o1,o2,? , oT 輸出的觀察符號(hào)序列 P(O|M) 給定模型 M 時(shí),輸出符號(hào)序列 O 的概率 ija 從狀態(tài) iS 到狀態(tài) jS 的轉(zhuǎn)移概率 ()ij tbo 從狀態(tài) iS 到狀態(tài) jS 發(fā)生轉(zhuǎn)移時(shí)輸出 to 的概率 ()taj 輸出部分符號(hào)序列 o1,o2,? , ot 并且到達(dá)狀態(tài) jS 的概率,即前向概率 由上面符號(hào)的定義,則 ()taj可由下面的遞推公式計(jì)算得到: ( 1)初始化 (1) 1 ( ) 0 ( 1)ooa a j j? ? ?, ( 2)遞推公式 1( ) ( ) ( )t t ij ij ta j a i a b o??? ( t=1,2,? ,T;i,j=1,2,? ,N) ( 3)最后結(jié)果 P( O|M)= ()TaN t 時(shí)刻的 ()taj等于 t1 時(shí)刻的所有狀態(tài)的 1( ) ( )t ij ij ta i a b o? 之和,當(dāng)然如果當(dāng)狀態(tài) iS 到狀態(tài) jS 沒(méi)有轉(zhuǎn)移時(shí) ija =0。這樣在 t 時(shí)刻對(duì)所有狀態(tài) jS (j=1,2,? , N)的 ()taj都計(jì)算一次,則每個(gè)狀態(tài)的前向概率都更新了一次,然后進(jìn)入 t+1 時(shí)刻的遞推過(guò)程。 與前向算法 類似,后向算法即按輸出觀察值序列的時(shí)間,從后向前遞推計(jì)算出概率的方法。首先說(shuō)明下列符號(hào)的定義: 18 0=o1,o2,? , oT 輸出的觀察符號(hào)序列 P(O|M) 給定模型 M 時(shí),輸出符號(hào)序列 O 的概率 ija 從狀態(tài) iS 到狀態(tài) jS 的轉(zhuǎn)移概率 ()ij tbo 從狀態(tài) iS 到狀態(tài) jS 發(fā)生轉(zhuǎn)移時(shí)輸出 ot的概率 ()t i? 從狀態(tài) iS 開(kāi)始到狀態(tài) NS 結(jié)束輸出部分符號(hào)序列 ot+1, ot+2,?, oT 的概率,即后向概率。 ()t i? 可由下面的遞推公式計(jì)算得到: ( 1)初始化 ( ) 1 , ( ) 0 ( )TTN j j N??? ? ? ( 2)遞推公式11( ) ( ) ( )t t ij ij tji j a b o?? ??? ? ( t=T,T+1,?, 1; i,j=1,2, ?, N) ( 3)最后結(jié)果 P(O|M)= 11 ( ) (1)Nioi i? ? ?? ?? 根據(jù)定義的前向和后向概率,有如下關(guān)系成立: 1111P ( O | M ) = ( ) ( ) ( ) ,1 1NNt ij ij i iij a i a b o j t T????? ? ? ??? 維特比( Viterbi)算法 如何有效地確定與之對(duì)應(yīng)的最佳的狀態(tài)序列。這可以由另一個(gè) HMM 的基本算法 Viterbi 算法來(lái)解決。 Viterbi 算法解決了給定一個(gè)觀察值序列 120 , ,..., To o o? 和一個(gè)模型 M={A, B,π }時(shí),在最佳意義上確定一個(gè)狀態(tài)序列 12, ,..., TS s s s? 的問(wèn)題。這里討論的最佳意義上的狀 19 態(tài)序列,是指使 P( S, O/M)最大時(shí)確定的狀態(tài)序列。即 HMM 輸出一個(gè)觀察值序列 120 , ,..., To o o? 時(shí),可能通過(guò)的狀態(tài)序列 12, ,..., TS s s s? 路徑有多種,這里面使輸出概率最大的狀態(tài)序列就是我們的所求。Viterbi 算法可以敘述如下: ( 1)初始化 39。39。00(1) 1, ( ) 0a a j?? ( j≠ 1) ( 2)遞推公式 39。39。1( ) m a x ( ) ( )t t ij ij ta j a j a b o?? (t=1,2,?, T;i,j=1,2,?, N) ( 3)最后結(jié)果 39。m a x ( , 0 / ) ( )TP S M a N? 在這個(gè)遞推公式中,每一次使 39。()taj最大的狀態(tài) i 組成的狀態(tài)就是所求的最佳狀態(tài)序列。所以利用 Viterbi 算法求取最佳狀態(tài)序列的步驟如下: ( 1) 給每個(gè)狀態(tài)準(zhǔn)備一個(gè)數(shù)組變量 39。()taj,初始化時(shí)令初始狀態(tài) S1 的數(shù)組變量 39。0(1)a 為 1,其他狀態(tài)的數(shù)組 39。0()aj為 0; ( 2)根據(jù) t 時(shí)刻輸出的觀察符號(hào) ot 計(jì)算 39。39。 139。 39。 39。1 1 1 1 2 2 1( ) m a x ( )m a x { ( 1 ) ( ) , ( 2) ( ) , .. ., ( ) ( ) }t i ij ij iii j j i i j j i i Nj Nj iia j a a b oa a b o a a b o a N a b o?? ? ??? ( j=1,2,?, N) 當(dāng)狀態(tài) iS 到狀態(tài) jS 沒(méi)有轉(zhuǎn)移時(shí) 0ija? ;設(shè)計(jì)一個(gè)符號(hào)數(shù)組變量,稱為最佳狀態(tài)序列寄存器,利用這個(gè)最佳狀態(tài)序列寄存器把每一次使 39。()taj最大的狀態(tài) i 保存下來(lái); ( 3) t≠ T 時(shí)轉(zhuǎn)移到 ( 2),否則執(zhí)行( 4); ( 4)把這時(shí)的終了狀態(tài)寄存器 39。 ()TaN內(nèi)的值取出,則: 39。Pm a x( S,O /M )= ( )TaN 輸出最佳狀態(tài)序列寄存器的值,即為所求 20 的最佳狀態(tài)序列。 軟件設(shè)計(jì) 主程序的設(shè)計(jì) 語(yǔ)音識(shí)別系統(tǒng)功能的實(shí)現(xiàn)大部 分是由軟件來(lái)完成的。因此,語(yǔ)音識(shí)別系統(tǒng)的軟件設(shè)計(jì)是十分復(fù)雜的。 本次程序的設(shè)計(jì)是依靠 C 語(yǔ)言和匯編語(yǔ)言共同完成的 21 開(kāi) 始初始化是否第一次下載 ?語(yǔ)音訓(xùn)練與存儲(chǔ)語(yǔ)音識(shí)別初始化是否觸發(fā)命令 ?是否起始命令執(zhí)行相應(yīng)命令第幾條命令 ?是否超時(shí) ?播放無(wú)語(yǔ)音信號(hào)提示音EN DNYYYYNN 主程序流程圖。在主程序中開(kāi)始是對(duì) RAM 存儲(chǔ)器進(jìn)行清除,這為存放提取的語(yǔ)音信號(hào)的特征矢量和模板庫(kù)做準(zhǔn)備。播放第一條提示音是為了提醒用戶系統(tǒng)的語(yǔ)音訓(xùn)練己?jiǎn)?dòng),現(xiàn)在可以進(jìn)行訓(xùn)練。訓(xùn)練首先是此系統(tǒng)的觸發(fā)名稱,即系統(tǒng)的名字。接下來(lái)就是依次對(duì)各條命令進(jìn)行訓(xùn)練。在訓(xùn)練過(guò)程中,如訓(xùn)練成功,則有語(yǔ)音提示進(jìn)行下一條的 22 訓(xùn)練 :如出現(xiàn)訓(xùn)練失敗也會(huì)提示用戶繼續(xù)訓(xùn)練此條語(yǔ) 音。直到全部命令訓(xùn)練完畢后,系統(tǒng)將準(zhǔn)備進(jìn)行語(yǔ)音識(shí)別。識(shí)別初始化是確定語(yǔ)音輸入來(lái)源于 A/D 轉(zhuǎn)換器的 MIC 通道。播放開(kāi)始識(shí)別的提示音是為了讓用戶明確現(xiàn)在可以向系統(tǒng)下達(dá)命令了。系統(tǒng)接到命令后就開(kāi)始進(jìn)行識(shí)別,如識(shí)別成功,則系統(tǒng)會(huì)按命令執(zhí)行,如識(shí)別失敗,系統(tǒng)也會(huì)通過(guò)語(yǔ)音提示用戶。 系統(tǒng)的主程序是依靠調(diào)用各子程序來(lái)完成的,而系統(tǒng)的子程序主要有語(yǔ)音訓(xùn)練程序、語(yǔ)音識(shí)別程序、語(yǔ)音播放程序及機(jī)器人運(yùn)動(dòng)程序。其中語(yǔ)音部分主要依靠語(yǔ)音壓縮程序來(lái)完成。 語(yǔ)音壓縮算法的研究 壓縮編碼的目的是通過(guò)對(duì)資料的壓縮, 達(dá)到高效率存儲(chǔ)和轉(zhuǎn)換資料的結(jié)果,即在保證一定聲音質(zhì)量的條件下,以最小的資料率來(lái)表達(dá)和傳送聲音信息。壓縮編碼是必要的,實(shí)際應(yīng)用中,未經(jīng)壓縮編碼的音頻資料量很大,直接進(jìn)行傳播或存儲(chǔ)是不現(xiàn)實(shí)的,所以要通過(guò)對(duì)信 23 號(hào)趨勢(shì)的預(yù)測(cè)和冗余信息處理,進(jìn)行資料的壓縮,這樣就可以使用較少的資源建立更多的信息。常用的壓縮編碼有波形編碼、參數(shù)編碼和混合編碼 。 用于 SPCE 系列芯片語(yǔ)音功能的語(yǔ)音壓縮與解壓縮算法有 SACM_A2020, SACM_S480, 和 SACM_S240, 其對(duì)應(yīng)的語(yǔ)音壓縮編碼率類型分別為 16 Kb/s, 20 Kb/s, 24 Kb/s; 418 Kb/s, 712 Kb/s;214 Kb/s。 本設(shè)計(jì)用到的壓縮算法有 SACM_A2020和 SACM_S480。 SACM_
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1