freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

機(jī)器人的語音識別技術(shù)-wenkub.com

2025-07-10 23:53 本頁面
   

【正文】 但是畢業(yè)設(shè)計(jì)也暴露出自己專業(yè)基礎(chǔ)的很多不足之處。通過畢業(yè)設(shè)計(jì)工作,同學(xué)的動(dòng)手能力和分析問題、解決問題的能力都得到了大幅度的提升,為以后更進(jìn)一步的學(xué)習(xí)和工作打下了堅(jiān)實(shí)的基礎(chǔ)。整體設(shè)計(jì)采用特定說話人語音識別,在進(jìn)行識別之前需要說話人進(jìn)行語音訓(xùn)練,非特定人不能命令機(jī)器人進(jìn)行動(dòng)作,這就排除了現(xiàn)場環(huán)境中有可能出現(xiàn)的包含命令關(guān)鍵字的相似語音的影響。由于程序采用模塊化設(shè)計(jì),需要機(jī)器人完成其它動(dòng)作只需要適當(dāng)更改相應(yīng)子程序,改動(dòng)方法簡單易實(shí)現(xiàn),可操作性強(qiáng)。如果訓(xùn)練成功則進(jìn)入語音識別狀態(tài),如果訓(xùn)練沒有成功則重復(fù)訓(xùn)練。這樣做有一個(gè)好處,那就是靈活。機(jī)器人運(yùn)動(dòng)程序機(jī)器人的運(yùn)動(dòng)主要依靠內(nèi)置電機(jī)的正反運(yùn)轉(zhuǎn),所以機(jī)器人的運(yùn)動(dòng)程序雖然比較繁瑣,但是仍然可以說是相對簡單。當(dāng)收到播放信號的時(shí)候,子程序首先停止主程序的辨識,并對語音播放系統(tǒng)進(jìn)行初始化。若識別不出來,則經(jīng)過一個(gè)定時(shí)程序判斷是否超時(shí)。根據(jù)識別情況返回不同數(shù)值。主程序只用到了整個(gè)子程序的返回值以判斷是否繼續(xù)進(jìn)行。子程序中重要的語句是訓(xùn)練函數(shù)BSR_Teain(int CommandID,int TrainMode),其中CommandID是命令序號, TrainMode代表訓(xùn)練次數(shù)。中斷服務(wù)程序定時(shí)地從播放序列中讀數(shù)據(jù),送D/A 轉(zhuǎn)換后驅(qū)動(dòng)喇叭發(fā)音。此算法具體實(shí)現(xiàn)過程如下:在PC 機(jī)上錄好提示語音,經(jīng)壓縮工具壓縮處理后存儲到單片機(jī)ROM里, SPCE061A 將提示語音解壓縮后送D/A 還原語音,提示操作結(jié)果。 用于SPCE系列芯片語音功能的語音壓縮與解壓縮算法有SACM_A2000, SACM_S480, 和SACM_S240,其對應(yīng)的語音壓縮編碼率類型分別為16 Kb/s,20 Kb/s,24 Kb/s;418 Kb/s,712 Kb/s;214 Kb/s。其中語音部分主要依靠語音壓縮程序來完成。識別初始化是確定語音輸入來源于A/D轉(zhuǎn)換器的MIC通道。訓(xùn)練首先是此系統(tǒng)的觸發(fā)名稱,即系統(tǒng)的名字。因此,語音識別系統(tǒng)的軟件設(shè)計(jì)是十分復(fù)雜的。即 HMM 輸出一個(gè)觀察值序列 時(shí),可能通過的狀態(tài)序列路徑有多種,這里面使輸出概率最大的狀態(tài)序列就是我們的所求??捎上旅娴倪f推公式計(jì)算得到:(1)初始化 (2)遞推公式(t=T,T+1,…,1;i,j=1,2, …,N)(3)最后結(jié)果 P(O|M)= 根據(jù)定義的前向和后向概率,有如下關(guān)系成立:維特比(Viterbi)算法如何有效地確定與之對應(yīng)的最佳的狀態(tài)序列。首先說明下列符號的定義:0=o1,o2,… ,oT輸出的觀察符號序列P(O|M)給定模型 M 時(shí),輸出符號序列 O 的概率從狀態(tài)到狀態(tài)的轉(zhuǎn)移概率從狀態(tài)到狀態(tài)發(fā)生轉(zhuǎn)移時(shí)輸出的概率輸出部分符號序列 o1,o2,… ,ot并且到達(dá)狀態(tài) 的概率,即前向概率 由上面符號的定義,則可由下面的遞推公式計(jì)算得到:(1)初始化 (2)遞推公式 (t=1,2,…,T;i,j=1,2,…,N)(3)最后結(jié)果 P( O|M)= t 時(shí)刻的等于 t1 時(shí)刻的所有狀態(tài)的之和,當(dāng)然如果當(dāng)狀態(tài) 到狀態(tài)沒有轉(zhuǎn)移時(shí) =0。這種算法的指導(dǎo)思想就是概率最大的路徑是最有可能經(jīng)過的路徑,即最佳的狀態(tài)序列路徑;(3) 模型訓(xùn)練問題:實(shí)際上是一個(gè)模型參數(shù)估計(jì)問題,即對于初始模型和給定用于訓(xùn)練的觀察符號序列 0=o1,o2,… ,oT 如何調(diào)整模型 M={ A,B,π}的參數(shù),使得輸出概率 P (O M)最大[18]。另一個(gè)是一個(gè)隨機(jī)過程,由 B 描述,產(chǎn)生的輸出為觀察值序列,T 為觀察值時(shí)間長度。(離散型 HMM)(連續(xù)型 HMM)π:系統(tǒng)初始狀態(tài)概率的集合,π={},表示初始狀態(tài)是的概率,即: F:系統(tǒng)終了狀態(tài)的集合。所有轉(zhuǎn)移概率可以構(gòu)成一個(gè)轉(zhuǎn)移概率矩陣,即:A= 其中 是從狀態(tài) 到狀態(tài) 轉(zhuǎn)移時(shí)的轉(zhuǎn)移概率,1≤i,j≤N且有 0≤≤1, 。記 t 時(shí)刻模型所處狀態(tài)為 ,顯然 ∈ (, …, )。近幾十年來,隱馬爾可夫模型技術(shù)無論是在理論上或是實(shí)踐上都有許多進(jìn)展。大約 100 年前,數(shù)學(xué)家和工程師們就已經(jīng)知道馬爾可夫鏈了。矢量量化器和碼書的設(shè)計(jì)矢量量化器和碼書設(shè)計(jì)方法是采用遞推算法,這個(gè)算法就是LBG算法。矢量量化有效地應(yīng)用了矢量中各元素之間的相關(guān)性,因此可以比標(biāo)量量化有更好的壓縮效果。被準(zhǔn)確識別的詞語The recognized words can be the final results, as for applications such as mands amp。參考模式庫的建立過程稱為訓(xùn)練過程。矢量量化就是一種很好的數(shù)據(jù)壓縮技術(shù)。MFCC系數(shù)考慮到了人聽覺特性,并具有很高的抗噪聲能力,但因?yàn)樘崛FCC參數(shù)要在頻域處理,計(jì)算傅立葉變換將耗費(fèi)大量寶貴的計(jì)算資源。目前語音識別所用的特征參數(shù)主要有兩種類型:線性預(yù)測倒譜系數(shù)(LPCC)和美爾頻標(biāo)倒譜系數(shù)(MFCC)。第二是“識別”或“測試”階段。整個(gè)硬件設(shè)計(jì)部分以保持機(jī)器人外部靈活性為前提,在機(jī)器人各個(gè)部分內(nèi)置電機(jī),利用三極管的通斷特性來設(shè)計(jì)電路,完成硬件電路的設(shè)計(jì)和組裝。本設(shè)計(jì)綜合考慮SPCE061A單片機(jī)的特性以及機(jī)器人行動(dòng)模式來進(jìn)行設(shè)計(jì)。SOC是將MCU或DSP、A/D、D/A、RAM、ROM以及預(yù)放、功放等電路集成在一個(gè)芯片上,只要加上極少的電源供電等外圍電路,就可以實(shí)現(xiàn)語音識別、語音合成及語音回放等功能。由多帶通濾波器及現(xiàn)行匹配電路構(gòu)成的專用IC。我國PC機(jī)語音識別技術(shù)的研究水平已經(jīng)基本上與國外同步,在漢語語音識別技術(shù)上還有自己的特點(diǎn)和優(yōu)勢,但是獨(dú)立開發(fā)的專用漢語語音識別芯片還是較少,多數(shù)都是與國外研究機(jī)構(gòu)合作開發(fā)研制的。同時(shí),它又是一類典型的自動(dòng)化機(jī)器,是專用自動(dòng)機(jī)器、數(shù)控機(jī)器的延伸與發(fā)展。
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1