freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

語音控制小車的設計與實現(xiàn)(已修改)

2025-07-19 15:41 本頁面
 

【正文】 語音控制小車的設計與實現(xiàn)語音控制小車的設計與實現(xiàn)作者姓名:XXXXX專業(yè)名稱:通信工程 指導教師:XXXXXXXX摘要隨著電子工業(yè)的發(fā)展,具有語音控制功能的小車越來越受到人們的青睞,在人們的日常消費生活中起著不可忽視的作用。目前,聲控技術已在很多領域得到使用。比如聲控手機、聲控洗衣機、電視機、電腦等設備。本文對聲控小車概況做了闡述。在硬件設計方面,本論文以凌陽公司的SPCE061A單片機為控制核心,以語音小車控制電路板為輔,設計小車的動作。在軟件方面,利用C語言進行編程,進行語音的“訓練”和“識別”。設計出具有如下功能的語音聲控小車:能夠根據錄制的語音命令來控制小車的前進,后退,左轉,右轉的功能。論文首先對系統(tǒng)的方案進行論證,然后對各單元的軟件、硬件工作原理進行了闡述,并介紹了系統(tǒng)的主要組成部分情況。關鍵詞:SPCE061A 語音識別 全橋驅動 小車 AbstractWith the development of the electronics industry,the voicecontrol car bee more and more popular to people. And it plays an important role in people39。s daily life. At present, the voiceactivated technology has been used in many fields. For example, voiceactivated phone. Only if you called out the names you want and it automatically called the telephone. There are also voiceactivated washing machines, televisions, puters and other equipments.This article gives a detail to the voiceactivated car. In hardware design, the paper use Sunplus SPCE061A as the control of core. On the software, we use C language programming for voice training and recognition. It has the following features: According to recorded the voice mand to control the car to start, stop,turn right , and turn left.First of all ,papers confirm the system of program, and then describe the unit39。s software, hardware as well as introduce the main ponents of the situation.Key words: SPCE061A,Speech Recognition,F(xiàn)ullbridge ,driver,Trolley 目錄 摘要 IAbstract II目錄 III前言 11 緒論 2 2 2 3 32語音控制原理 5 5 7 起止點識別 7 特征提取 8. 3識別判斷 83方案論證及硬件選擇 10 方案論證 10 采用DSP+FPGA方案 10 采用凌陽61方案 10 系統(tǒng)的硬件方案 11 系統(tǒng)控制方案 12 12 SPCE061A芯片特性簡介 12——61 板 142 61 板輸入/輸出(I/O)接口 163 音頻輸入/輸出接口 164 在線調試器(PROBE)和EZPROBE 接口. 16 174 系統(tǒng)硬件設計 18 SPCE061A 最小系統(tǒng) 18 19 音頻電路 19 數摸轉換電路 21 按鍵、LED和復位電路 22 下載線接口電路和在線調制電路 22 MCU連接電路 23 24 24 25 26 動力電機驅動電路 27 295 系統(tǒng)軟件設計 30 系統(tǒng)的總體程序流程 30: 31: 31: 33: 34: 34 程序中需要說明的幾個問題 35 366系統(tǒng)調試 37 硬件連接 37 硬件模塊連線圖 37 功能說明 38 代碼下載 38 39 聲控小車 40 重新訓練 417結論 428致謝 439參考文獻 44附件 45IV前言語音處理技術是一門新興的技術,它不僅包括語音的錄制和播放,還涉及語音的壓縮編碼和解碼,語音的識別等各種處理技術。做這方面的設計,一般有兩個途徑:一種方案是單片機擴展設計,另一種就是借助于專門的語音處理芯片。普通的單片機往往不能實現(xiàn)這么復雜的過程和算法,即使勉強實現(xiàn)也要加很多的外圍器件。專門的語音處理芯片也比較多,像ISD系列、PM50系列等,但是專門的語音處理芯片功能比較單一,想在語音之外的其他方面應用基本是不可能的。 SPCE061A是一種16位μ39。nSP結構的微控制器。該芯片帶有硬件乘法器,能夠實現(xiàn)乘法運算、內積運算等復雜的運算。它不僅運算能力強,而且處理速度快,單周期最高可以達到49MHz。SPCE061A內嵌32K字的FLASH程序存儲器以及2K的SRAM。同時該SOC芯片具有ADC和DAC功能,其MIC_ADC通道帶有AGC自動增益環(huán)節(jié),能夠很輕松的將語音信號采集到芯片內部,兩路10位的電流輸出型DAC,只要外接一個功放就可以完成聲音的播放。以上介紹的這些硬件資源使得該SPCE061A能夠單芯片實現(xiàn)語音處理功能。 借助于SPCE061A的語音特色,我們設計出了這款語音控制小車。小車不僅具有前進、后退、左轉、右轉等基本功能;同時配合SPCE061A的語音特色,實現(xiàn)語音控制功能。 621 緒論所謂聲控技術其實也就是利用語音識別技術來達到控制或者操作的一種技術,而語音識別技術這近五年來已經有很大的進步,最新的語音識別技術可以辨識90%以上的人類說出的字。聲控技術雖然是一項比較先進的技術,但不可否認的是,聲控技術在無限傳輸時的合成的質量不是很好,它尚需進一步提高,因為無線環(huán)境中的背景噪音太大了,當然還有其他方面的因素影響著聲控功能的發(fā)揮。然而隨著微電子技術、計算機技術、及傳感器技術的迅速發(fā)展,現(xiàn)今聲控技術應用廣泛,這種嶄露頭角的聲控技術,給嚴重傷殘人的生活帶來了極大的方便。傷殘病人用聲音就可以打開門窗、窗簾、電視機、電燈等。在其他領域里,聲控技術也大有用武之地。比如飛機在飛行或空戰(zhàn)中,一旦飛行員負了傷,他可以用聲音來駕駛飛機。聲音識別器將飛行員的講話聲音與貯存的聲音相比較,只要聲音一致,飛機就能自動地完成各種動作,從而化險為夷。那么能不能做到“君子動口不動手” 呢?本文介紹用凌陽單片機61A設計并制作的一套基于語音識別技術的聲控小車。隨著微電子技術、計算機技術、及傳感器技術的迅速發(fā)展,現(xiàn)今聲控技術已經應用到社會中的各個角落,為人們提供著各種便利。聲控玩具車:進一步提高系統(tǒng)的濾噪性能,和識別的準確率,并利用已有的軟件開發(fā)出獨具特色的語音芯片,并將其集成在遙控上即可做出聲控玩具車。能識別主人的看門狗:在本系統(tǒng)的基礎上擴充對說話者的識別功能,并將軟件硬件化,集成在芯片上。將芯片置于防盜門上,使之可以完成主人叫門即開門的功能。真實汽車上的聲控系統(tǒng):在駕駛的過程中,不便于用手來完成的其它操作可以用聲控系統(tǒng)來實現(xiàn)。這于我們的系統(tǒng)是極其相似的。但是實際的汽車中可能存在著大量的噪聲,所以,濾噪便成為最為關鍵的技術。聲控技術雖然是一項比較先進的技術。但是,聲控技術在無限傳輸時的合成的質量不是很好,它還需進一步提高,因為無線環(huán)境中的背景噪音太大了,當然還有其他方面的因素影響著聲控功能的發(fā)揮,具體來說表現(xiàn)在以下幾個方面:1 、時效型。從發(fā)出指令到執(zhí)行指令,有一段延遲時間,雖已降低到盡可能的小,但還是很明顯。可行的方法就是改用高效的DSP芯片,這在經費上和時間上都是不允許的。2.、對環(huán)境的適應。如果環(huán)境噪聲很大,或偶爾出現(xiàn)較大的噪聲,則會出現(xiàn)誤識。這個不足之處還沒有很有效的解決方案。多人識別。各人的發(fā)音不盡相同,因此該系統(tǒng)還限于單人識別。若要做多人識別,則識別的時效性會降低,即有很大的延遲。另外,多人識別,也沒有較為有效、成熟的算法供參考。聲控小車其技術要求是通過相關語音對小車進行操作控制。使用了“前、后、左、右、?!蔽鍌€字作為小車行駛的指令。本畢業(yè)設計有助于培養(yǎng)我們的獨立動手能力、思考能力。具體的項目制作過程分為兩部分:軟件部分和硬件部分。其目的讓我們熟悉61板的設計與制作,并掌握其原理;學會運用C語言進行編程且運用。語音控制小車的主要功能: 1. 可以通過簡單的I/O操作實現(xiàn)小車的前進、后退、左轉、右轉功能; 2. 配合SPCE061A的語音特色,利用系統(tǒng)的語音播放和語音識別資源,實現(xiàn)語音控制的功能; 3. 可以在行走過程中聲控改變小車運動狀態(tài); 4. 在超出語音控制范圍時能夠自動停車。 2語音控制原理機器語音識別、處理的過程與人對語音識別、理解過程基本上是一致的,目前主流的語音識別技術是基于統(tǒng)計模式識別的基本理論。一個完整的語音識別系統(tǒng)可大致分為語音特征提取、聲學模型與模式匹配(識別算法)和語義理解3部分。其基本原理如圖1所示。從圖中我們可以看出語音識別一般分為2個步驟:第一步是系統(tǒng)“學習”或“訓練”階段,這一個階段的任務是建立識別基本單元的聲學模型以及進行文法分析的語言模型,即構建參考模式庫;第二步是“識別”或“測試”階段,根據識別系統(tǒng)的類型選擇能夠滿足要求的識別方法,采用語音分析方法分析出這種識別方法所要求的語音特征參數,按照一定的準則和測度與參考模式庫中的模型進行比較,通過判決得出結果。在本系統(tǒng)中,我們采用語音信號的短時能量和短時過零率進行端點檢測,用線性預測倒譜系數 (LPCC)作為特征參數,語音特征提取是分幀提取的。基于本系統(tǒng)采用孤立詞識別的特點,我們采用動態(tài)時間規(guī)整(DTW)算法進行模式匹配。動態(tài)時間規(guī)整(DTW)動態(tài)時間規(guī)整(DTW)是把時間規(guī)整和距離測度計算結合起來的一種非線性規(guī)整技術。假設:(1)參考模板特征矢量序列為;(2)輸入語音特征矢量序列為m≠ n ,那么動態(tài)時間規(guī)整是要尋找時間規(guī)整函數,它把輸入模板的時間軸17.非線性地映射到參考模板的時間軸m ,并且該滿足: (1)式中:是第n幀輸入矢量和第m幀參考矢量的距離,D是相應于最優(yōu)時間規(guī)整下二模板的距離測度。DTW 是一個典型的最優(yōu)化問題,它用滿足一定條件的時間規(guī)整函數我描述輸入模板和參考模板的時間對應關系,求解二模板匹配時累計距離最小所對應的規(guī)整函數。實現(xiàn)動態(tài)時間規(guī)整的常用方法就是動態(tài)規(guī)劃(DP),本系統(tǒng)采用加權累計局里的對稱動態(tài)規(guī)劃技術。假設規(guī)整函數寫成: (2)其約束條件如下:(1) 單調和連續(xù)條件:,(2) 邊界條件:(3) 調整窗條件定義加權累計距離: (3)式中:和式(1)中相同,是對點上2個矢量的距離,加權系數一般采用對稱形式: (4)分母 用來補償規(guī)整函數F中點數i的影響,按照等式(4)定義的,有。調整窗口函數r的引入使它的使用范圍更加廣泛。累計距離還可以用遞推公式計算: (5)初始條件:。最后計算結果:作為二模板間的距離DP匹配距離。語音識別系統(tǒng)的基本結構主要包括預處理、A /D轉換、起止點識別、特征提取和識別判斷等部分, 結構如下圖所示。 起止點識別語音信號處理基于語音短時穩(wěn)定性, 當采樣頻率為8 kH z時, 可取128個樣點為一幀(短時段) , 幀長16 ms。字音由濁音和清音構成, 與噪聲相比, 濁音表現(xiàn)為高能量, 清音表現(xiàn)為高過零率。對一幀聲音數據, 能量和過零率分別用短時段能量特征En和短時段過零率表征。通過區(qū)別于背景噪聲可以判別語音起止點。取連續(xù)10幀背景噪聲數據, 計算出IZCT (過零率閾)記為)及ITL(能量閾) 記為 :式中:、’為過零率的均值和標準差。 為固定值,一般取25,分別為能量的最大值和最小值[ 6] 。 特征提取相對其他語音特征, LPCC (線性預測倒譜特征),有遞推公式, 速度和精度都較好, 特別是適于特定人的孤立詞的短時段識別。LPCC 在LPC (線性預測系數特征)基礎上求得:式中: c( n ) ( n = 1, 2,…, p ),為LPCC 系數,p為特征模型階數, 取12階則可對絕大多數語音信號的聲道模型足夠近似逼近。 a ( k )為LPC特征; 。 . 3識別判斷基于時序特征值差的分段線性的動態(tài)時配識別方法, 將動態(tài)時間匹配和特征識別結合, 相對其他識別方法, 該方法簡單、計算量小, 特別適用于特定人孤立詞的短時段識別。基本思想是找出語音信號音韻特征相對的量(子音、母音、過渡音等)進行距離比較。其方法是按時序找出幀特征的差值(特征差), 再將音韻特征所包含的特征差累加除以整個字音的總特征差, 得到相對累計特征差。這樣盡管發(fā)音速度不同, 但音韻特征的相對累計特征差基本不變。經語音數據分析發(fā)現(xiàn), 語音結束段雖然頻譜變化劇烈, 但語意少, 對區(qū)別語音作用不大, 在該識別方法中刪去了該段特征。計算方法為: 每幀特征數據
點擊復制文檔內容
物理相關推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1