freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

20xx新編機(jī)器人的語(yǔ)音識(shí)別技術(shù)-wenkub

2022-10-24 12:38:33 本頁(yè)面
 

【正文】 得廣泛 14 的應(yīng)用 。 ( ) , 1 , 1jiY Q X j J i N? ? ? ? ? 式中, ()iQX —— 量化器函數(shù) 。 矢量量化的基本原理 將若干個(gè)標(biāo)量數(shù)據(jù)組成一個(gè)矢量(或者是從一幀語(yǔ)音數(shù)據(jù)中提取的特征矢量)在多維空間給與整體量化,從而可以在信息量損失較小的情況下壓縮數(shù)據(jù)量。目前常用的語(yǔ)音識(shí)別算法主要有:動(dòng)態(tài)時(shí)間規(guī)整( DTW) 、隱馬爾可夫( HMM) 理論、矢量量化( VQ)技術(shù)。它是聲學(xué)參數(shù)模板。語(yǔ)音特征提取是分幀提取的,每幀特征參數(shù)一般構(gòu)成一個(gè)矢量,因此,語(yǔ)音特征是一個(gè)矢量序列。它對(duì)元音有較好的描述能力,而對(duì)輔音描述能力差。 輸入語(yǔ)音 預(yù)處理特征 提取識(shí)別 模式 匹配識(shí)別結(jié)果語(yǔ)音模型庫(kù)訓(xùn)練 特征提取 經(jīng)過預(yù)處理后的語(yǔ)音信號(hào),要對(duì)其進(jìn)行特征提取,即特征參數(shù)分析。第一步是系統(tǒng)“學(xué)習(xí)”或“訓(xùn)練”階段。具體過程是:首先進(jìn)行機(jī)器人的語(yǔ)音訓(xùn)練,我們這次設(shè)計(jì)采用的是特定人語(yǔ)音識(shí)別,每一個(gè)命令發(fā)布者都必須在發(fā)布命令之前對(duì)機(jī)器人進(jìn)行命令的語(yǔ)音訓(xùn)練。 本課題的主要實(shí)現(xiàn)過程是:外部語(yǔ)音命令通過轉(zhuǎn)換裝置輸入到系統(tǒng)內(nèi)部,經(jīng)過語(yǔ)音識(shí)別程序的處理轉(zhuǎn)化為機(jī)器人可識(shí)別的觸發(fā)命令然 8 后觸發(fā)相應(yīng)子程序進(jìn)行相關(guān)動(dòng)作。 由 DSP 組成的語(yǔ)音識(shí)別系統(tǒng),一般由定點(diǎn) 16 位 DSP,外加 A/D轉(zhuǎn)換, D/A 轉(zhuǎn)換,以及 ROM、 RAM、 FALSH 等存儲(chǔ)器組成。因此,研究機(jī)器人的語(yǔ)音識(shí)別,開發(fā)實(shí)用的機(jī)器人語(yǔ)音識(shí)別系統(tǒng),對(duì)于服務(wù)機(jī)器人的普及與應(yīng)用意義重大。 語(yǔ)音信號(hào)處理技術(shù)就是使用數(shù)字信號(hào)處理技術(shù)對(duì)于因信號(hào)進(jìn)行處理,處理的目的使用得到的某些參數(shù)進(jìn)行高效傳輸、存儲(chǔ)、語(yǔ)音增強(qiáng)、語(yǔ)音合成和語(yǔ)音識(shí)別 。但是本次設(shè)計(jì)還缺乏一定的實(shí)踐。 未來科技的發(fā)展趨勢(shì)是在以人為本的前提下,更多地實(shí)現(xiàn)機(jī)器設(shè) 6 備的自動(dòng)化和智能化,讓機(jī)器 為人服務(wù),代替人們進(jìn)行繁重的體力勞動(dòng)和高危險(xiǎn)工程。 于是普通的單片機(jī)就不能很好的滿足這樣一系列復(fù)雜的要求,這就需要在 已有語(yǔ)音識(shí)別技術(shù)的研究基礎(chǔ)上,配合功能強(qiáng)大的 凌陽(yáng) 16位單片機(jī) SPCE061A,對(duì)機(jī)器人的語(yǔ)音識(shí)別和特定命令對(duì)應(yīng)行為能力的結(jié)合進(jìn)行實(shí)現(xiàn),是一個(gè)實(shí)踐性和操作性要求較強(qiáng)的實(shí)用性課題。語(yǔ)言是由不同的人的聲帶所發(fā)出的,人們辨別它主要是通 過聲波的變換來判斷的,這就是我們平常所說的音變。 基于單片機(jī)和外圍接口技術(shù),我們可以大致畫出語(yǔ)音控制的基本框 圖。隨著社會(huì)的發(fā)展,人們的物質(zhì)文化生活水平也有了較大的提高,為了滿足人們愈來愈高的要求,機(jī)器人的深入和普及也越來越受到人們的關(guān)注。語(yǔ)音識(shí)別技術(shù)所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和人工智能等等。 由于材料等各方面的限制,只能以理論的形式出現(xiàn)。 人們可以通過一系列的信息傳遞來直接或間接的控制機(jī)械的運(yùn)轉(zhuǎn)。G馬可尼所完成的無線通信試驗(yàn)就是在固定站與一艘拖船之間進(jìn)行的,距離為 18 海里。 讓機(jī)器能夠聽懂人類的語(yǔ)言并且能夠按照人的口頭命令行動(dòng),從而實(shí)現(xiàn)人際交流一直以來都是人類的一個(gè)夢(mèng)想。 關(guān)鍵詞 : 語(yǔ)音識(shí)別,語(yǔ)音控制(嵌入式語(yǔ)音的識(shí)別技術(shù)),智能機(jī)器人,語(yǔ)音壓縮算法 2 目錄 1 緒論 …………………………………………………… .3 本次課題的由來 設(shè)計(jì)目的及任務(wù) 及設(shè)計(jì)理念 聲控機(jī)器人的發(fā)展前景 整體 方案的規(guī)劃 2 嵌入式語(yǔ)音的識(shí)別技術(shù) …………………………… 11 模式匹配原理的引入 語(yǔ)音識(shí)別技術(shù)總括 3 軟件設(shè)計(jì) ???????????????? .20 主程序的設(shè)計(jì) 語(yǔ)音壓縮算法的研究 關(guān)鍵模塊的設(shè)計(jì) 4 功能的實(shí)現(xiàn) ??????????????? ..29 機(jī)器人預(yù)想功能的總體實(shí)現(xiàn) 5 設(shè)計(jì)總結(jié) ………………………………………… .30 1 緒論 設(shè)計(jì)課題由來 單片機(jī)在現(xiàn)實(shí)生活中越來越多的 被應(yīng)用于工業(yè)生產(chǎn)和生活?yuàn)蕵樊?dāng)中 。都屬于電子信息專業(yè)的基本課程。 人有五官,機(jī)器人的視覺 —— 電子攝象已經(jīng)隨著安全防護(hù)的發(fā)展有了一定的發(fā)展,平常我們?cè)跇怯畋O(jiān)控系統(tǒng)可以看到簡(jiǎn)單的機(jī)器人視覺系統(tǒng)(電子攝象及處理) ,數(shù)碼相機(jī)等 。 4 圖 最原始的機(jī)器人語(yǔ)音控制 用語(yǔ)音控制來操作機(jī)器人代替煩瑣的鍵盤輸入。這樣就使基本模型的音界變的不甚明確,于是在明確的電腦語(yǔ)言處理下就變的比較困難。 機(jī)器人語(yǔ)音識(shí)別是語(yǔ)音識(shí)別在機(jī)器人領(lǐng)域的應(yīng)用,它的最終目的是讓機(jī)器人聽懂人們口述的語(yǔ)言,進(jìn)而對(duì)口述語(yǔ)言中包含的要求或詢問做出正確的動(dòng)作反應(yīng)或語(yǔ)言反應(yīng),從而形成一個(gè)良好的,自然的“人機(jī)通信系統(tǒng)”。借助機(jī)器之力進(jìn)行社會(huì)建設(shè)已經(jīng)成為了一個(gè)必然的選擇。 聲控機(jī)器人的發(fā)展前景 機(jī)器人是多學(xué)科交叉的產(chǎn)物,集成了運(yùn)動(dòng)學(xué)與動(dòng)力學(xué)、機(jī)械設(shè)計(jì)與制造、計(jì)算機(jī)硬件與軟件、控制與傳感器、模式識(shí)別與人工智能等學(xué)科領(lǐng)域的先進(jìn)理論與技術(shù)。 我國(guó)的語(yǔ)音識(shí)別系統(tǒng)的研究起步比較晚,但是也取得了很好的成績(jī),研究水平也從實(shí)驗(yàn)室逐步走向?qū)嵱?,?1987 年開始執(zhí)行國(guó)家 863計(jì)劃后,國(guó)家 863 智能計(jì)算機(jī)專家組為語(yǔ)音識(shí)別技術(shù)研究專門理想,每?jī)赡隄L動(dòng)一次。 整體方案的規(guī)劃 本課題是基于 SPCE061A 的智能機(jī)器人語(yǔ)音識(shí)別的實(shí)現(xiàn),最終目的是形成一個(gè)較好的人機(jī)交流環(huán)境,使機(jī)器人能夠聽懂經(jīng)過訓(xùn)練的人的口頭命令,并能夠按照命令進(jìn)行相應(yīng)的動(dòng)作。由人工神經(jīng)網(wǎng)絡(luò)構(gòu)成的語(yǔ)音識(shí)別專用芯片。動(dòng)作的實(shí)現(xiàn)方法是:凌陽(yáng) 61 板向控制不同端口送高低電平以控制置于機(jī)器人內(nèi)部不同位置的電機(jī)的運(yùn)轉(zhuǎn),調(diào)用延時(shí),根據(jù)需要使各個(gè)部分電機(jī)相互配合,完成要求的動(dòng)作,從而實(shí)現(xiàn)機(jī)器人的語(yǔ)音控制。這樣做有一個(gè)好處,非特定人不能命令機(jī)器人進(jìn)行動(dòng)作 。這一階段的任務(wù)是建立識(shí)別基本單元的聲學(xué)模型以及進(jìn)行文法分析的語(yǔ)言模型,即構(gòu)建參考模式庫(kù)。該過程就是從原始語(yǔ)音信號(hào)中抽取能夠反映語(yǔ)音本質(zhì)的特征參數(shù),形成特征矢量序列。其優(yōu)點(diǎn)是計(jì)算量小,比較徹底 12 地去掉了語(yǔ)音產(chǎn)生過程中的激勵(lì)信息,易于實(shí)現(xiàn)。該序列的數(shù)據(jù)率一般可能過高,不便于其后的進(jìn)一步處理,為此,有必要采用很有效的數(shù)據(jù)壓縮技術(shù)方 法對(duì)數(shù)據(jù)進(jìn)行壓縮。建立參考模式庫(kù)是在系統(tǒng)使用前獲得并存儲(chǔ)起來的。 13 語(yǔ)音信號(hào)識(shí)別技術(shù) 語(yǔ)音識(shí)別的過 程就是 將用 麥克風(fēng)或電話捕捉到 的 聲波信號(hào) 轉(zhuǎn)化成一組詞語(yǔ)的過程。矢量量化有效地應(yīng)用了矢量中各元素之間的相關(guān)性,因此可以比標(biāo)量量化有更好的壓縮效果。 矢量量化器和碼書的設(shè)計(jì) 矢量量化器和碼書設(shè)計(jì)方法是采用遞推算法,這個(gè)算法就是 LBG算法。 大約 100 年前,數(shù)學(xué)家和工程師們就已經(jīng)知道馬爾可夫鏈了。近幾十年來,隱馬爾可夫模型技術(shù)無論是在理論上或是實(shí)踐上都有許多進(jìn)展。記 t 時(shí)刻模型所處狀態(tài)為 ts ,顯然 ts ∈ (1s , ? , Ns )。所有轉(zhuǎn)移概率可以構(gòu)成一個(gè)轉(zhuǎn)移概率矩 15 陣,即: A= 1... ...1ai ainan ann?????? 其中 ija 是從狀態(tài) iS 到狀態(tài) jS 轉(zhuǎn)移時(shí)的轉(zhuǎn)移概率, 1≤ i, j≤ N 且有 0≤ ija ≤ 1,1 1Nj aij? ?? 。 ( ) 1ijk bk?? (離散型 HMM) ( ) 1ijb k dk???? ?? (連續(xù)型 HMM) π:系統(tǒng)初始狀態(tài)概率的集合,π= {i? }, i? 表示初始狀態(tài)是 is 的概率,即: 1[ ] , (1 )tiP S s i N? ? ? ? ? 1j? ?? F:系統(tǒng)終了狀態(tài)的集合。另一個(gè)是一 個(gè)隨機(jī)過程,由 B 描述,產(chǎn)生的輸出為觀察值序列, T 為觀察值時(shí)間長(zhǎng)度 。這種算法的指導(dǎo)思想就是概率最大的路徑是最有可能經(jīng)過的路徑,即最佳的狀態(tài)序列路徑; ( 3) 模型訓(xùn)練問題:實(shí)際上是一個(gè)模型參數(shù)估計(jì)問題,即對(duì)于初始模型和給定用于訓(xùn)練的觀察符號(hào)序列 0=o1,o2,? , oT 如何調(diào)整模型 M={ A, B,π }的參數(shù),使得輸出概率 P (O M)最大 [18]。首先說明下列符號(hào)的定義: 0=o1,o2,? , oT 輸出的觀察符號(hào)序列 P(O|M) 給定模型 M 時(shí),輸出符號(hào)序列 O 的概率 ija 從狀態(tài) iS 到狀態(tài) jS 的轉(zhuǎn)移概率 ()ij tbo 從狀態(tài) iS 到狀態(tài) jS 發(fā)生轉(zhuǎn)移時(shí)輸出 to 的概率 ()taj 輸出部分符號(hào)序列 o1,o2,? , ot 并且到達(dá)狀態(tài) jS 的概率,即前向概率 由上面符號(hào)的定義,則 ()taj可由下面的遞推公式計(jì)算得到: ( 1)初始化 (1) 1 ( ) 0 ( 1)ooa a j j? ? ?, ( 2)遞推公式 1( ) ( ) ( )t t ij ij ta j a i a b o??? ( t=1,2,? ,T;i,j=1,2,? ,N) ( 3)最后結(jié)果 P( O|M)= ()TaN t 時(shí)刻的 ()taj等于 t1 時(shí)刻的所有狀態(tài)的 1( ) ( )t ij ij ta i a b o? 之和,當(dāng)然如果當(dāng)狀態(tài) iS 到狀態(tài) jS 沒有轉(zhuǎn)移時(shí) ija =0。 ()t i? 可由下面的遞推公式計(jì)算得到: ( 1)初始化 ( ) 1 , ( ) 0 ( )TTN j j N??? ? ? ( 2)遞推公式11( ) ( ) ( )t t ij ij tji j a b o?? ??? ? ( t=T,T+1,?, 1; i,j=1,2, ?, N) ( 3)最后結(jié)果 P(O|M)= 11 ( ) (1)Nioi i? ? ?? ?? 根據(jù)定義的前向和后向概率,有如下關(guān)系成立: 1111P ( O | M ) = ( ) ( ) ( ) ,1 1NNt ij ij i iij a i a b o j t T????? ? ? ??? 維特比( Viterbi)算法 如何有效地確定與之對(duì)應(yīng)的最佳的狀態(tài)序列。即 HMM 輸出一個(gè)觀察值序列 120 , ,..., To o o? 時(shí),可能通過的狀態(tài)序列 12, ,..., TS s s s? 路徑有多種,這里面使輸出概率最大的狀態(tài)序列就是我們的所求。39。所以利用 Viterbi 算法求取最佳狀態(tài)序列的步驟如下: ( 1) 給每個(gè)狀態(tài)準(zhǔn)備一個(gè)數(shù)組變量 39。39。1 1 1 1 2 2 1( ) m a x ( )m a x { ( 1 ) ( ) , ( 2) ( ) , .. ., ( ) ( ) }t i ij ij iii j j i i j j i i Nj Nj iia j a a b oa a b o a a b o a N a b o?? ? ??? ( j=1,2,?, N) 當(dāng)狀態(tài) iS 到狀態(tài) jS 沒有轉(zhuǎn)移時(shí) 0ija? ;設(shè)計(jì)一個(gè)符號(hào)數(shù)組變量,稱為最佳狀態(tài)序列寄存器,利用這個(gè)最佳狀態(tài)序列寄存器把每一次使 39。 軟件設(shè)計(jì) 主程序的設(shè)計(jì) 語(yǔ)音識(shí)別系統(tǒng)功能的實(shí)現(xiàn)大部 分是由軟件來完成的。播放第一條提示音是為了提醒用戶系統(tǒng)的語(yǔ)音訓(xùn)練己?jiǎn)?dòng),現(xiàn)在可以進(jìn)行訓(xùn)練。直到全部命令訓(xùn)練完畢后,系統(tǒng)將準(zhǔn)備進(jìn)行語(yǔ)音識(shí)別。 系統(tǒng)的主程序是依靠調(diào)用各子程序來完成的,而系統(tǒng)的子程序主要有語(yǔ)音訓(xùn)練程序、語(yǔ)音識(shí)別程序、語(yǔ)音播放程序及機(jī)器人運(yùn)動(dòng)程序。常用的壓縮編碼有波形編碼、參數(shù)編碼和混合編碼 。 SACM_S480 算法 SACM_S480 屬于混合編碼,該壓縮算法壓縮比較大,為 80:3,其存儲(chǔ)容量大,音質(zhì)介于 A2020 和 S240 之間,適用于語(yǔ)音播放。 播放程序初始化A/D ,定時(shí)器 TimerA 和音量 ,從 ROM 里取 出預(yù)先壓縮好的語(yǔ)音數(shù)據(jù) ,解壓縮后存在播放隊(duì)列里 。 關(guān)鍵模塊的設(shè)計(jì) 在進(jìn)行語(yǔ)音識(shí)別之前,首先要進(jìn)行特定人的語(yǔ)音訓(xùn)練,讓機(jī)器人能夠聽懂人的命令,也就是語(yǔ)音模板的建立。然后等待用戶說出命令,當(dāng)接收到語(yǔ)音的時(shí)候, 通過 BSR_Teain 程序,系統(tǒng)會(huì)生成一個(gè) res值,不同的 res 的值代表不同的訓(xùn)練結(jié)果,當(dāng)訓(xùn)練不成功,系統(tǒng)提示用戶繼續(xù)訓(xùn)練,成功則返回。 子程序中最重要的函數(shù)是 BSR_GetResult(),它的作用是 從辨識(shí)器中獲取數(shù)據(jù)。然后播放語(yǔ)音識(shí)別提示音提示用戶開始發(fā)布命令。 語(yǔ)音播放程序 本 次設(shè)計(jì)采用了 SACM_A2020 和 SACM_S480 兩種語(yǔ)音壓縮算法進(jìn)行語(yǔ)音壓縮和播放,但是由于兩種語(yǔ)音算法僅僅是語(yǔ)音質(zhì)量和壓縮大小等方面有所不同, 基本思 想 還是相同的,所以它們可以“共享”一個(gè)流程圖(如圖 )。整個(gè)語(yǔ)音播放結(jié)束后,開啟辨識(shí)器和實(shí)時(shí)監(jiān)控并退出子程序返回到調(diào)用點(diǎn)。 我們決定還是采用最原始也是相對(duì)來說比較容易想到的方法:改變端口電壓 —— 調(diào)用延時(shí) —— 改變端口電壓 —— 調(diào)用延時(shí)??。打開機(jī)器人的電源,進(jìn)行語(yǔ)音訓(xùn)練 。發(fā)布命令的時(shí)候注意命令的順序問題。 本次設(shè)計(jì)基于智能機(jī)器人,利用凌陽(yáng)單片機(jī) SPCE0
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1