freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

輪椅機器人語音識別系統(tǒng)的開發(fā)與研究-文庫吧資料

2025-07-04 22:00本頁面
  

【正文】 // 中斷服務子函數u int main(void) // 主函數u // SPCE061 32K flash 的讀寫u //語音播放/識別中斷服務這些程序中有些是自己編寫的,有些是凌陽庫函數自帶的,具體用法詳見附錄。用戶可以用關中斷指令(或復位)屏蔽所有的中斷請求,也可以用開中斷指令使 CPU 接受中斷申請。 語音辨識凌陽單片機的辨識也可以直接調用凌陽單片機的辨識函數即可,其原理框圖如下: 語音辨識原理框圖用到的主要函數如下:l BSR_DeleteSDGroup(0) //SRAM初始化l BSR_Train (int CommandID, int TraindMode) //訓練函數l void BSR_InitRecognizer(int AudioSource) //辨識器初始化l BSR_GetResult() //辨識中獲取數據l void BSR_StopRecognizer(void) // 停止辨識具體用法讀者可以閱讀凌陽單片機參考用書。 主程序初始化調用提示辨識音播放訓練第三條指令定義存儲器成功否 否獲取語音數據調用第一條提示音播放訓練第四條指令 是辨識主循環(huán)成功否訓練觸發(fā)名稱 否成功否 是訓練第五條指令否 是成功否訓練第一條命令 否開始識別成功否 否 是訓練第二條命令 是辨識器初始化成功否 啟動實時監(jiān)控 否 是 主程序框圖 凌陽音頻程序設計 SACM_S480算法的API簡介凌陽音頻壓縮算法根據不同的壓縮比分為以下幾種:l SACMA2000:壓縮比為 8:1,8:,8:l SACMS480: 壓縮比為 80:3,80:l SACMS240: 壓縮比為 80:按音質排序:A2000S480S240本系統(tǒng)因考慮到凌陽61單片機的存儲有限,選用SACMS480的壓縮算法。4 軟件系統(tǒng)設計 引言 凌陽SPCE061A單片機可以用匯編語言和C語言編寫,既可以用前者調用后者,也可以用后者調用前者,凌陽單片機的編程方法比較靈活,此外,凌陽單片機的開發(fā)環(huán)境中集成了許多庫函數,方便讀者調用。通過對本系統(tǒng)不同模塊的劃分,我們可以清楚的看到每一部分的作用及實現(xiàn)方法。 應用領域l 語音識別類產品l 儀器儀表l 家電產品l 自動售貨機l 智能語音交互式玩具l 高級亦教亦樂類玩具l 兒童電子故事書類產品l 通用語音合成器類產品l 需較長語音持續(xù)時間類產品 Bantam驅動器簡介Bantam驅動器是一種控制直流有刷或無刷電機的力矩調節(jié)的電流放大器,它的結構小巧緊湊、使用簡單,是一種不錯的驅動器。PROBE 工作于凌陽 IDE 集成開發(fā)環(huán)境軟件包下,其 5 芯的仿真頭直接連接到目標電路板上 SPCE061A 相應管腳,直接在目標電路板上的 CPUSPCE061A 調試、運行用戶編制的程序。用它可以替代在單片機應用項目的開發(fā)過程中常用的軟件工具——硬件在線實時仿真器和程序燒寫器。 SPCE061A 開發(fā)方法SPCE061A 的開發(fā)是通過在線調試器 PROBE 實現(xiàn)的。這是為了與廣泛的常規(guī)5V外圍器件對接(例如74系列標準集成數字電路等),也是為了能夠提供更強大的端口驅動電流。 最小系統(tǒng)電路原理圖如下: 最小系統(tǒng)原理圖 從最小應用系統(tǒng)的電路圖中可以看出,SPCE061A的電源引腳設計也很有特點,就是采用3對引腳和3組電源,分別為片內的數字電路、模擬電路、I/O端口,單獨供電和濾波。 結構概覽SPCE061A 的結構如圖 所示: SPCE061A結構圖 最小應用系統(tǒng) SPCE061A單片機的最小系統(tǒng)就是能夠維持其正常工作的最精簡電路。因此,與 SPCE500A 相比,以μ’nSP 為核心的 SPCE061A 微控制器是適用于數字語音識別應用領域產品的一種經濟的選擇。與 SPCE500A 不同的是,在存儲器資源方面考慮到用戶的較少資源的需求以及便于程序調試等功能,SPCE061A 里只內嵌 32K 字的閃存(FLASH)。比如, 噪聲能量和過零率的計算, 數字濾波器設計, 模型庫的訓練等。利用 MAX232 芯片外接 5V 電源, 外接電容, 可產生正負10V 的電源形成 232C 的收發(fā)器。4)通信接口電路 單片機中的數據通過串口經 MAX232 電平轉換成 RS 232電平向上位傳輸。而 SPCE06lA 內部就帶有自動增益控制電路 AGC 能隨時跟蹤、監(jiān)視前置放大器輸出的音頻信號電平, 當輸入信號增大時 AGC 電路自動減小放大器的增益。語音信號經過MCI 轉換成電信號, 然后輸入至 SPCE061A 內部前置放大器。音頻輸出電路如圖 所示。圖中的 SPY0030 單運放是凌陽公司的產品。+5V 得到 為 CPU核心供電。降低芯片內核電壓的目的主要還是降低芯片的功耗, 同時也可以降低芯片的工作溫度, 延長芯片使用壽命。其中, SPCE06lA 的電源分兩種, 即內核電源(VDD)和I/O 口電源(VDDH)。3 硬件系統(tǒng)設計 系統(tǒng)總體方案介紹本系統(tǒng)涉及到的硬件主要有凌陽SPCE061A單片機及在線調試電路,74LS148譯碼芯片,Bantam驅動器和直流電機等。 狀態(tài)自左向右隱馬爾可夫模型 小結 通過本章對語音識別原理的初步介紹,包括分類、算法等等,我對語音識別有了初步的了解,知道了語音識別的常用方法,例如DTW時間規(guī)整算法、隱馬爾可夫模型算法等等。Lawrence Rabiner 的研究表明每個音節(jié)設置 3 個狀態(tài)能達到最高識別率,實驗中針對語句中大部分關鍵詞為三音節(jié)的特點,確定模型狀態(tài)數為 9。如下式所示:這里是混合系數,又叫分歧概率(Branch Probability);(X)叫分歧密度(Branch Density);這種 HMM 稱為連續(xù)混合密度 HMM Continuous Mixture Densities HMM,簡稱為 CMHMM)。應當指出,HMM 訓練,或稱參數估計問題,是 HMM 在語音處理中應用的關鍵問題。下面給出利用 BaumWelch 算法進行 HMM 訓練具體步驟: 1)適當地選擇 aij 和 bij(k)的初始值。按前向—后向算法,設對于符號序列0=o1,o2,… ,oT,在時刻t從狀態(tài)Si轉移到狀態(tài)Sj的轉移概率為γt(i,j),則γt(i,j)可表示如下:同時,對于符號序列 0=o1,o2,… ,oT,在時刻 t 時 Markov 鏈處于狀態(tài) Si 的概率為:這樣,對于符號序列 0=o1,o2,… ,oT,從狀態(tài) Si 轉移到狀態(tài) Sj 的轉移次數的期望值為;而從狀態(tài) Si 轉移出去的次數的期望值為。下面具體介紹 BaumWelch 算法。 BaumWelch算法這個算法實際上是解決 HMM 訓練的,即 HMM 參數估計問題的。2)對每一個要識別的詞,首先經特征提取得到觀察序列O=(o1,o2,…oT),然后對每個模型λv求P(O|λv),1≤v≤V,最后選擇模型的似然度最高的詞作為識別結果,即: HMM模型的訓練和識別都已研究出有效的算法,并不斷被完善,以增強HMM模型的魯棒性。未知語音是試驗觀測序列,求解問題1時要每個單詞的HMM模型打分(評估它們與試驗序列匹配的情況),最后選擇得分最高的模型所對應的單詞作為識別結果。為了增進對模型狀態(tài)物理意義的了解,需要求解問題2,可以把單詞的訓練序列分成一些段,每段對應于一個狀態(tài)。從隱含馬爾可夫模型的成功應用中我們也可看出完美的理論體系對研究工作所起的重要的指導作用。如今,各種形式的隱含馬爾可夫模型和算法已日趨成熟,以它為基礎己經形成了語音識別的整體框架模型,它統(tǒng)一了語音識別中聲學層和語音學層的算法結構,制定了最佳的搜索和匹配算法,以概率的形式將聲學層中得到的信息和語音學層中已有的信J自、完美地結合在一起。語音識別中使用HMM。通過訓練自適應調整模型參數使之適應于訓練序列并最優(yōu)化,從而得到實際應用中最好的模型[2]。第三個問題是使模型參數最優(yōu)化,即調整模型參數,以使模型能最好地描述一個給定觀測序列,最好地說明這個觀測序列就是最優(yōu)化模型產生出來的。3)如何調整模型參數(A,B,π)以使條件概率P(O|λ)最大?第一個問題是評估問題,即已知模型和一個觀測序列,如何計算由該模型產生出該觀測序列的概率,問題1的求解能夠選擇出與給定的觀測序列最匹配的模型。其中aij是一個與時間無關的常數。HMM模型可分為離散隱馬爾可夫模型(采用離散概率密度函數,簡稱DHMM)和連續(xù)隱馬爾可夫模型(采用連續(xù)概率密度函數,簡稱CHMM)以及半連續(xù)隱馬爾可夫模型(SCHMM,集DHMM和CHMM特點)。這種數學模型出現(xiàn)的時間較早,人們對它的研究也比較深入,已建立起了完整的理論框架。 隱馬爾可夫模型經典的隱馬爾可夫模型(HMM)是一種統(tǒng)計信號模型,它是目前最為成功的一種連續(xù)語音識別模型和算法。 語音識別的原理框圖 隱馬爾可夫模型技術 隱馬爾可夫模型(HiddenMarkovModelS,簡稱HMM)作為語音信號的一種統(tǒng)計模型,今天正在語音處理各個領域中獲得廣泛的應用。它的基本框圖如下圖所示,與常規(guī)的模式識別系統(tǒng)一樣,包含有特征提取、模式匹配和參考模式庫等三個基本單元。隨機模型法是一種使用隱馬爾可夫模型(HMM)來對似然函數進行估計與判決,從而得到相應的識別結果的方法。這些方法都屬于統(tǒng)計模式識別方法。顯然,非特定人語音識別系統(tǒng)更符合實際需要,但它要比針對特定人的識別困難得多。其中,孤立詞識別 的任務是識別事先已知的孤立的詞,如“開機”、“關機”等;連續(xù)語音識別的任務則是識別任意的連續(xù)語音,如一個句子或一段話;連續(xù)語音流中的關鍵詞檢測針對的是連續(xù)語音,但它并不識別全部文字,而只是檢測已知的若干關鍵詞在何處出現(xiàn),如在一段話中檢測“計算機”、“世界”這兩個詞。 語音識別技術所涉及的領域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。 語音識別聽寫機在一些領域的應用被美國新聞界評為1997年計算機發(fā)展十件大事之一。近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。 小結經過對智能輪椅應用背景和國內外現(xiàn)狀的分析,我覺得智能輪椅應用前景和市場前景非常樂觀,智能輪椅的許多技術難題已經得到解決,再加上智能輪椅出色的的多元化功能,它的應用一定會為殘疾人解決很多生活中的困難,為殘疾人帶來實惠,這也是我們的研究目的所在。這樣不僅可以提供自然、和諧的人機交互方式,而且可為使用者帶來極大的方便。以便于為不同的用戶定制不同的功能模塊組合,同時也便于對各個功能模塊的升級和再開發(fā)[1]。(4)模塊化。(3)產品化。(2)安全保障全面化。鑒于此,我認為智能輪椅未來的發(fā)展趨勢有以下幾個方面:(1)人機交互自然化。目前多數智能輪椅平臺較重視功能性實現(xiàn),對于各種環(huán)境下危險發(fā)生的可能性以及相應的保障措施研究不夠。雖然已經開發(fā)了多種智能輪椅人機交互接口,但是仍處于通過人機接口對輪椅進行簡單控制的階段,對自然交互中使用者的無意識行為與有意識行為的區(qū)分還很欠缺,無法達到自然交互的目的。同時它采用了人的行為模型來提高傳統(tǒng)輪椅的可用性和功能[1]。 中科院智能輪椅上海交通大學開發(fā)成功一種聲控輪椅,主要是為四肢全部喪失功能的殘疾者設計,使用者只需發(fā)出“開”、“前”、“后”、“左”、“右”、“快”、“慢”、“?!钡戎噶?。此項研究成果于2000年11月通過863智能機器人主題專家組的鑒定,并研制出我國第一臺多模態(tài)交互式智能輪椅樣機。研究單位有中科院自動化所、上海交通大學、第三軍醫(yī)大學和香港中文大學等。該輪椅也可通過使用者的手勢來控制運動方向[1]。 威爾斯利日本殘疾人國家康復中心開發(fā)了針對物理殘疾者使用的智能輪椅(),該輪椅區(qū)別于其他同類產品的最大特征是在用戶頭部的上方安裝有多個視覺傳感器,可以探測360度范圍內的物體。用戶界面模式下,用戶和機器之間僅需通過用戶眼睛運動來控制輪椅,即用鷹眼系統(tǒng)來進行驅動。菜單模式下,輪椅的操作類似一般的電動輪椅。用戶和輪椅之間的人機界面提供高級控制。系統(tǒng)有兩種級別的控制:高級方向指令和低級計算機控制路線,用戶擁有最高控制級別。在此基礎上,經改進研制出第二代產品(),其功能更豐富,面向用戶范圍更廣,性價比更好,改良了大量控制[1]。半自動模式下用戶與輪椅分享控制。 國外研究現(xiàn)狀1989年法國開始研究VAHM項目,第一階段的智能輪椅由輪椅、PC48超聲波傳感器、人機界面和一個可匹配用戶身體能力轉換的圖形屏幕組成,設置為手動、自動、半自動三種模式,手動時輪椅執(zhí)行用戶具體指令和行動任務。初期的研究,賦予輪椅的功能一般都是低級控制,如簡單的運動、速度控制及避障等。如美國麻省理工學院WHEELESLEY項目、法國VAHM項目、日本Orpheu項目、西班牙SIAMO項目、加拿大AAI公司TAO項目、歐盟TIDE項目、KISS學院TINMAN項目、臺灣中正大學電機系LUOSON項目、我國863智能機器人智能輪椅項目及第三軍醫(yī)大學外科研究所項目等。鑒于此,我們研究了一種基于凌陽單片機控制的智能輪椅機器人,并對控制系統(tǒng)進行模塊化設計,有利于輪椅機器人的功能擴展和升級。但是市場上的輪椅要么太貴,為一般人所不能承擔;要么功能不全面,安全性能太差。畢業(yè)設計題 目 輪椅機器人語音識別系統(tǒng)研究
點擊復制文檔內容
法律信息相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1