正文內(nèi)容

輪椅機器人語音識別系統(tǒng)的開發(fā)與研究-全文預覽

2025-07-19 22:00 上一頁面

下一頁面

　　

【正文】序框圖凌陽音頻程序設計 SACM_S480算法的API簡介凌陽音頻壓縮算法根據(jù)不同的壓縮比分為以下幾種：l SACMA2000：壓縮比為 8:1，8:，8:l SACMS480：壓縮比為 80:3，80:l SACMS240：壓縮比為 80:按音質(zhì)排序：A2000S480S240本系統(tǒng)因考慮到凌陽61單片機的存儲有限，選用SACMS480的壓縮算法。通過對本系統(tǒng)不同模塊的劃分，我們可以清楚的看到每一部分的作用及實現(xiàn)方法。PROBE 工作于凌陽 IDE 集成開發(fā)環(huán)境軟件包下，其 5 芯的仿真頭直接連接到目標電路板上 SPCE061A 相應管腳，直接在目標電路板上的 CPUSPCE061A 調(diào)試、運行用戶編制的程序。 SPCE061A 開發(fā)方法SPCE061A 的開發(fā)是通過在線調(diào)試器 PROBE 實現(xiàn)的。最小系統(tǒng)電路原理圖如下：最小系統(tǒng)原理圖從最小應用系統(tǒng)的電路圖中可以看出，SPCE061A的電源引腳設計也很有特點，就是采用3對引腳和3組電源，分別為片內(nèi)的數(shù)字電路、模擬電路、I/O端口，單獨供電和濾波。因此，與 SPCE500A 相比，以μ’nSP 為核心的 SPCE061A 微控制器是適用于數(shù)字語音識別應用領域產(chǎn)品的一種經(jīng)濟的選擇。比如, 噪聲能量和過零率的計算, 數(shù)字濾波器設計, 模型庫的訓練等。4）通信接口電路單片機中的數(shù)據(jù)通過串口經(jīng) MAX232 電平轉(zhuǎn)換成 RS 232電平向上位傳輸。語音信號經(jīng)過MCI 轉(zhuǎn)換成電信號, 然后輸入至 SPCE061A 內(nèi)部前置放大器。圖中的 SPY0030 單運放是凌陽公司的產(chǎn)品。降低芯片內(nèi)核電壓的目的主要還是降低芯片的功耗, 同時也可以降低芯片的工作溫度, 延長芯片使用壽命。3 硬件系統(tǒng)設計系統(tǒng)總體方案介紹本系統(tǒng)涉及到的硬件主要有凌陽SPCE061A單片機及在線調(diào)試電路，74LS148譯碼芯片，Bantam驅(qū)動器和直流電機等。Lawrence Rabiner 的研究表明每個音節(jié)設置 3 個狀態(tài)能達到最高識別率，實驗中針對語句中大部分關鍵詞為三音節(jié)的特點，確定模型狀態(tài)數(shù)為 9。應當指出，HMM 訓練，或稱參數(shù)估計問題，是 HMM 在語音處理中應用的關鍵問題。按前向—后向算法，設對于符號序列0=o1,o2，… ，oT，在時刻t從狀態(tài)Si轉(zhuǎn)移到狀態(tài)Sj的轉(zhuǎn)移概率為γt(i,j)，則γt(i,j)可表示如下：同時，對于符號序列 0=o1,o2，… ，oT，在時刻 t 時 Markov 鏈處于狀態(tài) Si 的概率為:這樣，對于符號序列 0=o1,o2，… ，oT，從狀態(tài) Si 轉(zhuǎn)移到狀態(tài) Sj 的轉(zhuǎn)移次數(shù)的期望值為；而從狀態(tài) Si 轉(zhuǎn)移出去的次數(shù)的期望值為。 BaumWelch算法這個算法實際上是解決 HMM 訓練的，即 HMM 參數(shù)估計問題的。未知語音是試驗觀測序列，求解問題1時要每個單詞的HMM模型打分(評估它們與試驗序列匹配的情況)，最后選擇得分最高的模型所對應的單詞作為識別結(jié)果。從隱含馬爾可夫模型的成功應用中我們也可看出完美的理論體系對研究工作所起的重要的指導作用。語音識別中使用HMM。第三個問題是使模型參數(shù)最優(yōu)化，即調(diào)整模型參數(shù)，以使模型能最好地描述一個給定觀測序列，最好地說明這個觀測序列就是最優(yōu)化模型產(chǎn)生出來的。其中aij是一個與時間無關的常數(shù)。這種數(shù)學模型出現(xiàn)的時間較早，人們對它的研究也比較深入，已建立起了完整的理論框架。語音識別的原理框圖隱馬爾可夫模型技術隱馬爾可夫模型(HiddenMarkovModelS，簡稱HMM)作為語音信號的一種統(tǒng)計模型，今天正在語音處理各個領域中獲得廣泛的應用。隨機模型法是一種使用隱馬爾可夫模型（HMM）來對似然函數(shù)進行估計與判決，從而得到相應的識別結(jié)果的方法。顯然，非特定人語音識別系統(tǒng)更符合實際需要，但它要比針對特定人的識別困難得多。語音識別技術所涉及的領域包括：信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。近二十年來，語音識別技術取得顯著進步，開始從實驗室走向市場。這樣不僅可以提供自然、和諧的人機交互方式，而且可為使用者帶來極大的方便。(4)模塊化。(2)安全保障全面化。目前多數(shù)智能輪椅平臺較重視功能性實現(xiàn)，對于各種環(huán)境下危險發(fā)生的可能性以及相應的保障措施研究不夠。同時它采用了人的行為模型來提高傳統(tǒng)輪椅的可用性和功能[1]。此項研究成果于2000年11月通過863智能機器人主題專家組的鑒定,并研制出我國第一臺多模態(tài)交互式智能輪椅樣機。該輪椅也可通過使用者的手勢來控制運動方向[1]。用戶界面模式下,用戶和機器之間僅需通過用戶眼睛運動來控制輪椅,即用鷹眼系統(tǒng)來進行驅(qū)動。用戶和輪椅之間的人機界面提供高級控制。在此基礎上,經(jīng)改進研制出第二代產(chǎn)品(),其功能更豐富,面向用戶范圍更廣,性價比更好,改良了大量控制[1]。國外研究現(xiàn)狀1989年法國開始研究VAHM項目,第一階段的智能輪椅由輪椅、PC48超聲波傳感器、人機界面和一個可匹配用戶身體能力轉(zhuǎn)換的圖形屏幕組成,設置為手動、自動、半自動三種模式,手動時輪椅執(zhí)行用戶具體指令和行動任務。如美國麻省理工學院WHEELESLEY項目、法國VAHM項目、日本Orpheu項目、西班牙SIAMO項目、加拿大AAI公司TAO項目、歐盟TIDE項目、KISS學院TINMAN項目、臺灣中正大學電機系LUOSON項目、我國863智能機器人智能輪椅項目及第三軍醫(yī)大學外科研究所項目等。但是市場上的輪椅要么太貴，為一般人所不能承擔；要么功能不全面，安全性能太差。為了給老年人和殘障人士提供性能優(yōu)越的代步工具，幫助他們提高行動自由度及重新融入社會，目前美國、日本、法國、加拿大、西班牙及中國等許多國家對智能輪椅進行了研究，使智能輪椅具有記憶地圖、智能避障、自動行走、爬樓梯、與用戶交互等多種功能。自1986年英國開始研制第一輛智能輪椅來,許多國家投入較多資金研究智能輪椅。隨著機器人控制技術的發(fā)展,移動機器人大量技術用于輪椅,智能輪椅在更現(xiàn)實的基礎上,有更好的交互性、適應性、自主性。為了更好適應用戶需求,研究者在康復中心進行了一系列調(diào)查,得出結(jié)論:系統(tǒng)必須是多功能的,不僅應適應殘障人士的生理和認知能力,也應適應環(huán)境的結(jié)構和形態(tài)。系統(tǒng)由兩部分組成,智能輪椅系統(tǒng)提供低級控制,避障和保證正確的運動方向。在操縱桿模式下,用戶通過操縱桿發(fā)出方向命令來避障。當傳感器探測到障礙物時輪椅可隨時停下，借助于集成WI—FI技術，輪椅甚至可以把混合圖像傳輸?shù)诫娫捴?。中國科學院自動化研究所研制了一種具有視覺和口令導航功能并能與人進行語音交互的機器人輪椅(),曾在863計劃十五周年成就展展館的人群中穿梭自如。香港中文大學高級機器人實驗室開發(fā)的智能輪椅，這個項目的目標是開發(fā)一輛具有友好的人機界面的智能輪椅，它可以用來做很多高級控制。(2)輪椅的安全保障系統(tǒng)不夠完善。通過多種人機交互接口結(jié)合，智能輪椅系統(tǒng)能夠更加充分地與使用者進行交流和溝通，更加準確地理解使用者的操縱意圖。產(chǎn)品化是任何高新技術服務于社會的必經(jīng)之路，采用嵌入式控制系統(tǒng)將是智能輪椅未來的發(fā)展方向，利用嵌入式產(chǎn)品功耗低、運算能力強的特點，將能夠?qū)崿F(xiàn)真正的智能輪椅產(chǎn)品。本文研究的內(nèi)容及要解決的問題本設計的研究目標是為輪椅機器人建立孤立詞、小詞匯表、特定人的實用語音識別系統(tǒng)，實現(xiàn)對輪椅機器人運動的語音控制。2 語音識別基本原理概述語音識別是一門交叉學科。很多專家都認為語音識別技術是2000年至2010年間信息技術領域十大重要的科技發(fā)展技術之一。根據(jù)針對的發(fā)音人，可以把語音識別技術分為特定人語音識別和非特定人語音識別，前者只能識別一個或幾個人的語音，而后者則可以被任何人使用。其識別過程大致如下：首先提取語音信號的特征構建參考模板，然后用一個可以衡量未知模式和參考模板之間似然度的測度函數(shù)，選用一種最佳準則和專家知識作出識別決策，給出識別結(jié)果。但是由于語音識別系統(tǒng)所處理的信息是結(jié)構非常復雜、內(nèi)容極其豐富的人類語言信息，因此它的系統(tǒng)結(jié)構比通常的模式識別系統(tǒng)要復雜得多。目前所能見到的各種性能優(yōu)良的連續(xù)語音的識別系統(tǒng)幾乎無一例外地采用了這種模型。HMM是使用馬爾可夫鏈來模擬信號的統(tǒng)計特性變化，例如對于這樣一個系統(tǒng)，它在任何時間可以認為處在N個不同狀態(tài)S1，S2，…，SN,中的某個狀態(tài)下，在均勻劃分的時間間隔上，系統(tǒng)的狀態(tài)按一組概率發(fā)生改變(包括停留在原狀態(tài))，狀態(tài)轉(zhuǎn)移陣A和狀態(tài)相關聯(lián)的概率分布陣B所組成，則兀i是初態(tài)為i時的概率，aij是從狀態(tài)i到狀態(tài)j的轉(zhuǎn)移概率，bi是在狀態(tài)i時的概率分布。第二個問題力圖揭露出模型中隱藏著的部分，即找出“正確的”狀態(tài)序列，這是一個典型的估計問題。隱馬爾可夫模型應用于語音識別用HMM刻畫語音信號需作出兩個假設，一是內(nèi)部狀態(tài)的轉(zhuǎn)移只與上一狀態(tài)有關，另一是輸出值只與當前狀態(tài)(或當前的狀態(tài)轉(zhuǎn)移)有關，這兩個假設大大降低了模型的復雜度，將語音看成是一連串的特定狀態(tài)，這種狀態(tài)是不能被直接觀測到的(例如這種狀態(tài)可以是語音的某個音素)，而是以某種隱含的關系與語音的觀測量(或特征)相關聯(lián)，而這種隱含關系在隱含馬爾可夫模型中通常以概率形式表現(xiàn)出來，模型的輸出結(jié)果也以概率形式給出，這為系統(tǒng)最后給出一個穩(wěn)健的判決創(chuàng)造了條件。因此，隱含馬爾可夫語音識別模型與算法是迄今為止最為完美的一個語音識別模型。一旦V個單詞的隱馬爾可夫模型設計出來，并最優(yōu)化和經(jīng)過研究后，就可以利用這些模型來對任何未知的語音進行識別，這是由求解問題1來完成的。HMM的打分(問題1)、模型參數(shù)調(diào)整(問題2)和訓練(問題3)相應的算法是前向算法、Viterbi算法和前向后向算法[2]。給定一個（訓練）觀察值符號序列 0=o1,o2，… ，oT，以及一個需要通過訓練進行重估參數(shù)的 HMM 模型 M={ A，B，π}。一般情況下可以按如下方式設定：A：給予從狀態(tài) i 轉(zhuǎn)移出去的每條弧相等的轉(zhuǎn)移概率aij=B：給予每一個輸出觀察符號相等的輸出概率初始值bij(k)=并且每條弧上給予相同的概率距陣；2）給定一個（訓練）觀察值符號序列 0=o1,o2，… ，oT，由初始模型計算等，并且，由上述重估公式，計算和；3）再給定一個（訓練）觀察值符號序列 0=o1,o2，… ，oT，把前一次的和作為初始模型計算等，由上述重估公式，重新計算和；4）如此反復，直到和收斂為止。本系統(tǒng)采用有跳轉(zhuǎn)自左向右連續(xù) HMM，這有效地解決了語音中某些發(fā)音單位在實際說話中可能被吸收和刪除的問題。對隱馬爾可夫模型算法有了大致的了解，知道了其基本思路，懂得了HMM是目前常用的語音識別模型，像目前常用的凌陽61單片機的語音識別功能就是基于該模型算法，相信經(jīng)過進一步的學習我會掌握得更好。I/O 口電源采用 5V 電壓, 或者更低。2）音頻輸出電路模塊放音利用的是 SPCE06lA 內(nèi)部集成的 DAC, 它是電流輸出, 為了能夠驅(qū)動揚聲器 SPEAKER 放音需要相應的驅(qū)動電路。音頻輸出電路3）MIC 輸入模塊 SPCE061A 的 A/D 轉(zhuǎn)換器有 8 個通道, 其中有 1 個通道是MIC NI 輸入, 它專門用于對語音信號進行采樣。當輸入信號減小時, AGC 電路自動增大放大器的增益, 從而以補償太小或是太大的信號, 以便使進入戶 A/D 的信號保持在最佳電平, 又可使削波減至最小。本系統(tǒng)中設有通信電路是為將大量語音數(shù)據(jù)處理都需要上傳給 PC, 由 PC 完成。較高的處理速度使μ’nSP 能夠非常容易地、快速地處理復雜的數(shù)字信號。應該包含以下幾塊功能：電源（包含數(shù)字電源、模擬電源、端口電源及其濾波電路）、時鐘電路、復位電路、端口電路和在線調(diào)試器接口電路。這應該是這種混合信號處理型單片機SPCE061A與其他常見的、傳統(tǒng)的單片機的顯著區(qū)別之一[3]。它利用了 SPCE061A 片內(nèi)置的在線仿真電路 ICE（In Circuit Emulator）接口和凌陽公司的在線串行編程技術。 Bantom驅(qū)動器小結(jié) 通過原理圖我們可以清楚地看到本系統(tǒng)的硬件組成，其大致功能也一目了然。讀者可以利用這些庫函數(shù)進行編程，只要編程前聲明一下就可以，下面介紹一下本系統(tǒng)的主程序、語音識別子程序、中斷服務子程序和一些其他的程序。語音識別中斷服務子程序 SPCE061A 單片機中斷系統(tǒng)，可以提供 14 個中斷源，具有兩個中斷優(yōu)先級，可實現(xiàn)兩級中斷嵌套功能。小結(jié) 通過本節(jié)對凌陽單片機編程語言習慣以及常用庫函數(shù)的介紹，我們已經(jīng)知道了凌陽強大以及方便的編程功能。為了讓老年人享受生活，安度晚年，智能輪椅無非是很好的選擇。這樣可以將繁雜的程序分成許多塊，方便編程更方便讀者閱讀和理解。參考文獻[1] 何清華，黃素平，[J].機器人技術與應用，2003,02：1216 [2] [M].北京：清華大學出版社，:191284.[3] [M].北京：人民郵電出版社，20073:3045.[4] [M].北京：科學出版社，:1456.[5] [M].北京：國防工業(yè)出版社，:55101[6] [M].北京：清華大學出版社，:238261.[7] [M].北京：科學出版社，:77134.[8] （第三版）[M]. 　北京：清華大學出版社 , :155202.[9] （第2版）[M].北京：電子工業(yè)出版社，:91121.[10] 雷靜. 語音識別技術的研究及基本實現(xiàn)：[碩士學位論文] [D].湖北：武漢理工大學,2002:2932[11] 、控制系統(tǒng)的研究：[碩士學位論文] [D].江蘇：蘇州大學，2006:2325[12] 諸剛. 用于機器人控制的漢語語音識別系統(tǒng)：[碩士學位論文] [D].天津：天津大學，2003:1524[13] 英鋒, 的語音識別系統(tǒng)的設計[J]. 單片機開發(fā)與應用，2008,

點擊復制文檔內(nèi)容

法律信息相關推薦

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

輪椅機器人語音識別系統(tǒng)的開發(fā)與研究-全文預覽

基于dft的信號識別系統(tǒng)-資料下載頁

企業(yè)識別系統(tǒng)手冊-資料下載頁

汽車車牌識別系統(tǒng)-字符識別子系統(tǒng)的設計與實現(xiàn)-資料下載頁

汽車車牌識別系統(tǒng)-字符識別子系統(tǒng)的設計與實現(xiàn)-資料下載頁

種手部痙攣康復機器人的開發(fā)與研究(1)-資料下載頁

智能發(fā)球機器人研究與開發(fā)項目申報書-資料下載頁

ci企業(yè)識別系統(tǒng)的原理與方法-資料下載頁

機器人視覺系統(tǒng)的設計與研究結(jié)題報告-資料下載頁

[計算機]足球機器人決策系統(tǒng)的研究與設計-資料下載頁

智能機器人巡檢系統(tǒng)在安徽電網(wǎng)的研究與應用-資料下載頁

足球機器人決策系統(tǒng)的研究與設計畢業(yè)論文-資料下載頁

基于matlab的車牌識別系統(tǒng)的設計與實現(xiàn)-資料下載頁

畢業(yè)論文設計：人臉識別系統(tǒng)研究-資料下載頁

基于qt的車牌識別系統(tǒng)設計與實現(xiàn)-資料下載頁

畢業(yè)論文設計：人臉識別系統(tǒng)研究-資料下載頁

輪椅機器人語音識別系統(tǒng)的開發(fā)與研究-wenkub.com

輪椅機器人語音識別系統(tǒng)的開發(fā)與研究(已改無錯字)

輪椅機器人語音識別系統(tǒng)的開發(fā)與研究-資料下載頁

輪椅機器人語音識別系統(tǒng)的開發(fā)與研究(參考版)

輪椅機器人語音識別系統(tǒng)的開發(fā)與研究-文庫吧資料