freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音識別控制小車設(shè)計本科畢業(yè)設(shè)計-文庫吧

2025-06-11 09:17 本頁面


【正文】 上面設(shè)置了串口選擇框、錄音開始按鈕、語音識別結(jié)果框等。下位機(jī)采用STC2C5A60S2單片機(jī)作為控制中心,采用L298專用驅(qū)動芯片搭建雙橋,進(jìn)行點擊的正反轉(zhuǎn)調(diào)速等控制。本設(shè)計達(dá)到了預(yù)期目標(biāo),實現(xiàn)了所期望的功能效果。第1章 系統(tǒng)總體設(shè)計方案介紹本系統(tǒng)分上位機(jī)和下位機(jī)兩大方面。上位機(jī)利用PC上MATLAB強(qiáng)大的數(shù)學(xué)計算能力,進(jìn)行語音的輸入、端點監(jiān)測、特征參數(shù)提取、匹配、識別、串口控制等工作,根據(jù)識別到的不同語音通過PC串口向下位機(jī)發(fā)送不同的指令。下位機(jī)是單片機(jī)控制的一個小車,單片機(jī)收到上位機(jī)傳來的指令后,很據(jù)不同的指令控制小車完成不同的動作。PC機(jī)和小車之間通過串口無線傳輸模塊進(jìn)行數(shù)據(jù)傳輸??傮w框圖如圖11所示:PC機(jī)(語音識別)無線發(fā)射語音輸入電機(jī)單片機(jī)控制中心驅(qū)動電路無線接收圖11 系統(tǒng)總體框圖第2章 上位機(jī)設(shè)計上位負(fù)責(zé)語音的識別,并根據(jù)識別到的不同結(jié)果向下位機(jī)(小車)發(fā)送不同的指令。上位機(jī)的設(shè)計基于MATLAB平臺,利用MATLAB強(qiáng)大的數(shù)學(xué)計算能力,進(jìn)行語音的輸入、預(yù)處理、端點監(jiān)測、特征參數(shù)提取、匹配、識別、串口控制等工作。167。 語音識別簡介167。 語音識別發(fā)展隨著時代的發(fā)展,人們越來越注重生活的品質(zhì)。便捷時尚成為當(dāng)代人們的追求目標(biāo)。隨著計算機(jī)技術(shù)、模式識別和信號處理技術(shù)及聲學(xué)技術(shù)等的發(fā)展,使得能滿足各種需要的語音識別系統(tǒng)的實現(xiàn)成為可能。近二三十年來,語音識別在計算機(jī)、信息處理、通信與電子系統(tǒng)、自動控制等領(lǐng)域中有著越來越廣泛的應(yīng)用。語音命令控制可廣泛用于家電語音遙控、玩具、智能儀器及移動電話等便攜設(shè)備中。使用語音作為人機(jī)交互的途徑對于使用者來說是最自然的一種方式,同時設(shè)備的小型化也要求省略鍵盤以節(jié)省體積。當(dāng)今,語音識別產(chǎn)品在人機(jī)交互應(yīng)用中已經(jīng)占到越來越大的比例。167。 語音識別的分類語音識別按說話人的講話方式可分為孤立詞(Isolated Word)識別、連接詞(Connected Word)識別和連續(xù)語音(Continuous Speech)識別。孤立詞識別是指說話人每次只說一個詞或短語,每個詞或短語在詞匯表中都算作一個詞條,一般用在語音電話撥號系統(tǒng)中。連接詞語音識別支持一個小的語法網(wǎng)絡(luò),其內(nèi)部形成一個狀態(tài)機(jī),可以實現(xiàn)簡單的家用電器的控制,而復(fù)雜的連接詞語音識別系統(tǒng)可以用于電話語音查詢、航空定票等系統(tǒng)。連續(xù)語音識別是指對說話人以日常自然的方式發(fā)音,通常特指用于語音錄入的聽寫機(jī)。顯然,連續(xù)非特定人語音識別的難度要大得多,因為不僅有說話人口音的問題,還有協(xié)同發(fā)音、斷字?jǐn)嗑洹⑺阉鞯葐栴},除了考慮語音的聲學(xué)模型外還要涉及到語言模型,如構(gòu)詞法、文法等。從識別對象的類型來看,語音識別可以分為特定人(Speaker Dependent)語音識別和非特定人(Speaker Independent)語音識別。特定人是指只針對一個用戶的語音識別,非特定人則可用于不同的用戶。實際上,非特定人語音識別的初始識別率往往都比較低,一般都要求用戶花一定的時間對系統(tǒng)進(jìn)行訓(xùn)練,將系統(tǒng)的參數(shù)進(jìn)行一定的自適應(yīng)調(diào)整,才能使識別率達(dá)到滿意的程度。非特定人大詞表連續(xù)語音識別是近幾年研究的重點,也是研究的難點。目前的連續(xù)語音識別大多是基于HMM(隱馬爾可夫模型)框架,并將聲學(xué)、語言學(xué)的知識統(tǒng)一引入來改善這個框架,其硬件平臺通常是功能強(qiáng)大的工作站或PC機(jī)。167。 聲音錄入本設(shè)計利用PC上的話筒口進(jìn)行聲音錄入。通過MATLAB的wavrecord函數(shù)進(jìn)行聲音錄入。wavrecord是MATLAB的專有聲音錄入函數(shù),他有一下三種調(diào)用方式:(1) y = wavrecord(n,Fs)(2) y = wavrecord(n,Fs,ch)(3) y = wavrecord(n,Fs,39。dtype39。)其中n代表聲音錄入的總采樣數(shù)。Fs代表聲音的采樣率。ch代表聲音錄入采用的通道數(shù),當(dāng)ch為1時為單聲道,當(dāng)ch為2時為立體聲?!痙type’代表采樣數(shù)據(jù)的存儲類型,MATLAB提供四種存儲類型如下:(1) 39。double39。 (default value), 16 bits/sample(2) 39。single39。, 16 bits/sample(3) 39。int1639。, 16 bits/sample(4) 39。uint839。, 8 bits/sample 本設(shè)計單次采樣總數(shù)為50000點,采樣率為22000HZ。即:y=wavrecord(50000,22000)。167。 聲音的預(yù)處理167。 欲加重處理預(yù)加重的目的在于濾除低頻干擾,尤其是50Hz或60Hz的工頻干擾,將對于語音識別更為有用的高頻部分的頻譜進(jìn)一步提升。在計算短時能量之前應(yīng)用該濾波器,還可以起到消除直流漂移、抑制隨機(jī)噪聲和提升清音部分能量的效果。167。 分幀處理在計算各個系數(shù)之前要先將語音信號作分幀處理。語音信號是瞬時變化的,但在10~(n)以1024點為一幀進(jìn)行處理,幀移為512個采樣點。167。 端點檢測所謂端點檢測,就是在實時輸入的聲音信號中,區(qū)分背景噪聲和環(huán)境噪聲,準(zhǔn)確地判斷出聲音信號的開始點和結(jié)束點。在語音識別系統(tǒng)中,正確、有效地進(jìn)行端點檢測不僅可以減少計算量和縮短處理時間,而且能排除無聲段的噪聲干擾、提高語音識別的正確率。研究表明,即使是在安靜的環(huán)境下,語音識別系統(tǒng)一半以上的錯誤可能主要來基于MTLAB編寫的語音端點檢測程序。除此之外, 在語音合成、 編碼等系統(tǒng)中,高效的端點檢測也直接影響甚至決定著系統(tǒng)的主要性能。因此, 端點檢測的效率、 質(zhì)量在語音處理系統(tǒng)中顯得至關(guān)重要。167。 過零率過零率(Zero Crossing Rate)是在每個音框中,音訊通過零點的次數(shù)。一般而言,噪聲的過零率大于氣音的過零率,而氣音的過零率又大于有聲音的過零率。一半情況下,噪聲的波形和聲音波形相比幅度非常小,為了排除噪聲對過零率產(chǎn)生的影響,我將聲音的原始譜向上平移,使得噪聲的過零點影響大大減小。如下,圖21展示了沒有平移前的過零譜圖,圖22展示了平移后的過零譜圖??梢钥闯?,平移后,話音可以很容易從噪音中區(qū)分開來。圖21 平移前的過零譜圖22 平移后的過零譜167。 音量能量或者音量代表聲音的大小,可由聲音訊號的震幅來類比,又稱為能量(Energy)或強(qiáng)度(Intensity)等。話音的能量遠(yuǎn)比噪聲的能量要大,故可用能量來區(qū)分是靜音還是由話音。這里將每幀的幅度絕對值之和作為每一幀的總能量大小。音量譜如圖23所示:圖23 音量譜167。 過零率和音量積譜通常利用短時能量來檢測濁音,用過零率來檢測清音,兩者配合實現(xiàn)可靠的端點檢測。端點檢測算法常用的是由語音能量和過零率組合的有雙門限法,以及短時能量和過零率的乘積構(gòu)成的能頻值法。圖24展示了過零譜、音量譜和過零率和能量成績構(gòu)成的譜線。圖24 過零音量積譜167。 用過零率和音量積譜來檢測端點端點檢測算法常用的是由語音能量和過零率組合的有雙門限法,以及短時能量和過零率的乘積構(gòu)成的能頻值法。這里采用的是第二種方法,通過能量和過零率的乘積構(gòu)成的能頻值來判斷語音的端點。這里我對端點進(jìn)行了兩級判斷。首先根據(jù)過零率和音量積設(shè)定一個較高的門限T H , 若譜大于T H ,則可確定2個端點A、 B, 并可認(rèn)為這 2個端點之間是語音信號, 這樣相當(dāng)于完成初判。 再根據(jù)背景噪聲的過零率和音量積設(shè)定一個比TH 稍低的門限T L , 如果信號的能量大于 TL ,則所對應(yīng)的端點C、 D 之間仍是語音信號,至此完成了第二級判斷。判斷結(jié)果如圖25所示:圖25 端點檢測出的語音波形167。 特征參數(shù)提取167。 特征參數(shù)概述對于特征參數(shù),有多種參數(shù)可供選取。常見的有三種:(1)線形預(yù)測系數(shù)特征矢量(LPC)(2)LPC倒譜特征矢量(LPCC)(3)Mel倒譜系數(shù)(MFCC)1. 線性預(yù)測系數(shù)(LPC)這里我采用最簡單的一種線形預(yù)測系數(shù)特征矢量(LPC)。線性預(yù)測(Linear Prediction)分析是最有效的語音分析技術(shù)之一,在語音編碼、語音合成、語音識別和說話人識別等語音信號處理領(lǐng)域中得到了廣泛的應(yīng)用?;舅枷胧牵阂粋€語音信號的抽樣值可以用過去的若干個抽樣值的線性組合來逼近。語音信號是一種典型的時變信號,然而如果把觀察時間縮短到十毫秒至幾十毫秒,則可以得到一系列近似穩(wěn)定的信號。人的發(fā)音器官可以用若干段前后連接的聲管進(jìn)行模擬,這就是所謂的聲管模型。由于發(fā)音器官不可能毫無規(guī)律地快速變化,因此語音信號是準(zhǔn)穩(wěn)定的(quasi steady)。全極點線性預(yù)測模型(LPC)可以對聲管模型進(jìn)行很好的描述,這里信號的激勵源是由肺部氣流的沖擊引起的,聲帶可以有周期振動也可以不振動,分別對應(yīng)濁音(Vowel)和清音(Consonant),而每段聲管則對應(yīng)一個LPC模型的極點。一般情況下,極點的個數(shù)在12~16之間,就可以足夠清晰地描述語音信號的特征了。LPC是語音分析的重要手段,它能很好地進(jìn)行譜估計,即可作為語音特征的參數(shù)。因此僅用12個LPC系數(shù)就能很好地表示復(fù)雜語音信號的特征,這就大大降低了信號的冗余度并有效地減少了計算量和存儲量,使之成為語音識別和語音壓縮的基礎(chǔ)。 ………………………………上式表示p個方程構(gòu)成的方程組,未知數(shù)為p個。求解該方程組,就可以得到系統(tǒng)的線性預(yù)測系數(shù)。由基于自相關(guān)的遞
點擊復(fù)制文檔內(nèi)容
語文相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1