freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音識(shí)別控制小車設(shè)計(jì)本科畢業(yè)設(shè)計(jì)-文庫吧

2025-06-10 17:39 本頁面


【正文】 要求用戶花一定的時(shí)間對(duì)系統(tǒng)進(jìn)行訓(xùn)練,將系統(tǒng)的參數(shù)進(jìn)行一定的自適應(yīng)調(diào)整,才能使識(shí)別率達(dá)到滿意的程度。本設(shè)計(jì)采用的識(shí)別類型是特定人孤立詞語音識(shí)別。 本設(shè)計(jì)是語音識(shí)別在控制領(lǐng)域的一個(gè)很好實(shí)現(xiàn),它將原本需要手工操作的工作用語音來方便地完成。本系統(tǒng)分上位機(jī)和下位機(jī)兩大方面。上位機(jī)利用 PC 上 MATLAB 強(qiáng)大的數(shù)學(xué)計(jì)算能力,進(jìn)行語音輸入、端點(diǎn)監(jiān)測、特征參數(shù)提取、匹配、串口控制等工作,根據(jù)識(shí)別到的不同語音通過 PC 串口向下位機(jī)發(fā)送不 同的指令。下位機(jī)是單片機(jī)控制的一個(gè)小車,單片機(jī)收到上位機(jī)傳來的指令后,很據(jù)不同的指令控制小車完成不同的動(dòng)作。 該設(shè)計(jì)對(duì)語音識(shí)別的現(xiàn)有算法進(jìn)行了驗(yàn)證和實(shí)現(xiàn),并對(duì)端點(diǎn)檢測和匹配算法進(jìn)行了些許改進(jìn)。 為了更方便的進(jìn)行上位機(jī)的操作,本設(shè)計(jì)用 MATLAB河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 2 的 GUI 設(shè)計(jì)了一個(gè)圖形界面。上面設(shè)置了串口選擇框、錄音開始按鈕、語音識(shí)別結(jié)果框等。下位機(jī)采用 STC2C5A60S2 單片機(jī)作為控制中心,采用 L298專用驅(qū)動(dòng)芯片搭建雙橋,進(jìn)行點(diǎn)擊的正反轉(zhuǎn)調(diào)速等控制。 本設(shè)計(jì)達(dá)到了預(yù)期目標(biāo) ,實(shí)現(xiàn)了所期望的功能效果。 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 3 第 1章 系統(tǒng)總體設(shè)計(jì)方案介紹 本系統(tǒng)分上位機(jī)和下位機(jī)兩大方面。上位機(jī)利用 PC 上 MATLAB 強(qiáng)大的數(shù)學(xué)計(jì)算能力,進(jìn)行語音的輸入、端點(diǎn)監(jiān)測、特征參數(shù)提取、匹配、識(shí)別、串口控制等工作,根據(jù)識(shí)別到的不同語音通過 PC 串口向下位機(jī)發(fā)送不同的指令。下位機(jī)是單片機(jī)控制的一個(gè)小車,單片機(jī)收到上位機(jī)傳來的指令后,很據(jù)不同的指令控制小車完成不同的動(dòng)作。 PC 機(jī)和小車之間通過串口無線傳輸模塊進(jìn)行數(shù)據(jù)傳輸。 總體框圖如圖 11 所示: 圖 11 系統(tǒng)總體框圖 PC 機(jī)(語音識(shí)別) 語音輸入 無線發(fā)射 無線接收 單片 機(jī) 控 制 中心 驅(qū)動(dòng)電路 電機(jī) 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 4 第 2章 上位機(jī)設(shè)計(jì) 上位負(fù)責(zé)語音的識(shí)別,并根據(jù)識(shí)別到的不同結(jié)果向下位機(jī)(小車)發(fā)送不同的指令。上位機(jī)的設(shè)計(jì)基于 MATLAB 平臺(tái),利用 MATLAB 強(qiáng)大的數(shù)學(xué)計(jì)算能力,進(jìn)行語音的輸入、預(yù)處理、端點(diǎn)監(jiān)測、特征參數(shù)提取、匹配、識(shí)別、串口控制等工作。 167。 語音識(shí)別簡介 167。 語音識(shí)別發(fā)展 隨著時(shí)代的發(fā)展,人們越來越注重生活的品質(zhì)。便捷時(shí)尚成為當(dāng)代人們的追求目標(biāo)。隨著計(jì)算機(jī)技術(shù)、模式識(shí)別和信號(hào)處理技術(shù)及聲學(xué)技術(shù)等的發(fā)展,使得能滿足各種需要的語音識(shí)別系統(tǒng)的實(shí)現(xiàn)成為可能。近二三十年來,語音識(shí)別在計(jì)算機(jī)、信 息處理、通信與電子系統(tǒng)、自動(dòng)控制等領(lǐng)域中有著越來越廣泛的應(yīng)用。語音命令控制可廣泛用于家電語音遙控、玩具、智能儀器及移動(dòng)電話等便攜設(shè)備中。使用語音作為人機(jī)交互的途徑對(duì)于使用者來說是最自然的一種方式,同時(shí)設(shè)備的小型化也要求省略鍵盤以節(jié)省體積。當(dāng)今,語音識(shí)別產(chǎn)品在人機(jī)交互應(yīng)用中已經(jīng)占到越來越大的比例。 167。 語音識(shí)別的分類 語音識(shí)別按說話人的講話方式可分為孤立詞 (Isolated Word)識(shí)別、連接詞(Connected Word)識(shí)別和連續(xù)語音 (Continuous Speech)識(shí)別。孤立詞識(shí)別是指說話人每次 只說一個(gè)詞或短語,每個(gè)詞或短語在詞匯表中都算作一個(gè)詞條,一般用在語音電話撥號(hào)系統(tǒng)中。連接詞語音識(shí)別支持一個(gè)小的語法網(wǎng)絡(luò),其內(nèi)部形成一個(gè)狀態(tài)機(jī),可以實(shí)現(xiàn)簡單的家用電器的控制,而復(fù)雜的連接詞語音識(shí)別系統(tǒng)可以用于電話語音查詢、航空定票等系統(tǒng)。連續(xù)語音識(shí)別是指對(duì)說話人以日常自然的方式發(fā)音,通常特指用于語音錄入的聽寫機(jī)。顯然,連續(xù)非特定人語音識(shí)別的難度要大得多,因?yàn)椴粌H有說話人口音的問題,還有河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 5 協(xié)同發(fā)音、斷字?jǐn)嗑洹⑺阉鞯葐栴},除了考慮語音的聲學(xué)模型外還要涉及到語言模型,如構(gòu)詞法、文法等。 從識(shí)別對(duì)象的類型來看,語音識(shí)別 可以分為特定人 (Speaker Dependent)語音識(shí)別和非特定人 (Speaker Independent)語音識(shí)別。特定人是指只針對(duì)一個(gè)用戶的語音識(shí)別,非特定人則可用于不同的用戶。實(shí)際上,非特定人語音識(shí)別的初始識(shí)別率往往都比較低,一般都要求用戶花一定的時(shí)間對(duì)系統(tǒng)進(jìn)行訓(xùn)練,將系統(tǒng)的參數(shù)進(jìn)行一定的自適應(yīng)調(diào)整,才能使識(shí)別率達(dá)到滿意的程度。 非特定人大詞表連續(xù)語音識(shí)別是近幾年研究的重點(diǎn),也是研究的難點(diǎn)。目前的連續(xù)語音識(shí)別大多是基于 HMM(隱馬爾可夫模型 )框架,并將聲學(xué)、語言學(xué)的知識(shí)統(tǒng)一引入來改善這個(gè)框架,其硬 件平臺(tái)通常是功能強(qiáng)大的工作站或 PC 機(jī)。 167。 聲音錄入 本設(shè)計(jì)利用 PC上的話筒口進(jìn)行聲音錄入。通過 MATLAB 的 wavrecord 函數(shù)進(jìn)行聲音錄入。 wavrecord 是 MATLAB 的專有聲音錄入函數(shù),他有一下三種調(diào)用方式: ( 1) y = wavrecord(n,Fs) ( 2) y = wavrecord(n,Fs,ch) ( 3) y = wavrecord(n,Fs,39。dtype39。) 其中 n 代表聲音錄入的總采樣數(shù)。 Fs 代表聲音的采樣率。 ch 代表聲音錄入采用的通道數(shù),當(dāng) ch 為 1 時(shí)為單聲道,當(dāng) ch 為 2 時(shí)為立體聲 ?!?dtype’代表采樣數(shù)據(jù)的存儲(chǔ)類型, MATLAB 提供四種存儲(chǔ)類型如下: ( 1) 39。double39。 (default value), 16 bits/sample ( 2) 39。single39。, 16 bits/sample ( 3) 39。int1639。, 16 bits/sample ( 4) 39。uint839。, 8 bits/sample 本設(shè)計(jì)單次采樣總數(shù)為 50000 點(diǎn),采樣率為 220xxHZ。 即: y=wavrecord(50000,220xx)。 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 6 167。 聲音的預(yù)處理 167。 欲加重處理 預(yù)加重的目的在于濾除低頻干 擾,尤其是 50Hz 或 60Hz 的工頻干擾,將對(duì)于語音識(shí)別更為有用的高頻部分的頻譜進(jìn)一步提升。在計(jì)算短時(shí)能量之前應(yīng)用該濾波器,還可以起到消除直流漂移、抑制隨機(jī)噪聲和提升清音部分能量的效果。 167。 分幀處理 在計(jì)算各個(gè)系數(shù)之前要先將語音信號(hào)作分幀處理。語音信號(hào)是瞬時(shí)變化的,但在 10~ 20ms 內(nèi)是相對(duì)穩(wěn)定的 .我設(shè)定的采樣頻率為 11025 所以我們對(duì)預(yù)處理后的語音信號(hào) S1(n)以 1024點(diǎn)為一幀進(jìn)行處理,幀移為 512個(gè)采樣點(diǎn)。 167。 端點(diǎn)檢測 所謂端點(diǎn)檢測,就是在實(shí)時(shí)輸入的聲音信號(hào)中,區(qū)分背景噪聲和環(huán)境噪聲,準(zhǔn)確地判斷出聲 音信號(hào)的開始點(diǎn)和結(jié)束點(diǎn)。 在語音識(shí)別系統(tǒng)中 ,正確、有效地進(jìn)行端點(diǎn)檢測不僅可以減少計(jì)算量和縮短處理時(shí)間 ,而且能排除無聲段的噪聲干擾、提高語音識(shí)別的正確率。研究表明 ,即使是在安靜的環(huán)境下 ,語音識(shí)別系統(tǒng)一半以上的錯(cuò)誤可能主要來基于 MTLAB 編寫的語音端點(diǎn)檢測程序。除此之外 , 在語音合成、 編碼等系統(tǒng)中 ,高效的端點(diǎn)檢測也直接影響甚至決定著系統(tǒng)的主要性能。因此 , 端點(diǎn)檢測的效率、 質(zhì)量在語音處理系統(tǒng)中顯得至關(guān)重要。 167。 過零率 過零率( Zero Crossing Rate)是在每個(gè)音框中,音訊通過零點(diǎn)的次數(shù) 。一般而言, 噪聲的過零率大于氣音的過零率,而氣音的過零率又大于有聲音的過零率。一半情況下,噪聲的波形和聲音波形相比幅度非常小,為了排除噪聲對(duì)過零率產(chǎn)生的影響,我將聲音的原始譜向上平移,使得噪聲的過零點(diǎn)影響大大減小。如下,圖 21 展示了沒有平移前的過零譜圖,圖 22 展示了河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 7 平移后的過零譜圖??梢钥闯?,平移后,話音可以很容易從噪音中區(qū)分開來。 0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0421012聲音波形0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 040200400600過零譜 圖 21 平移前的過零譜 0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0421012聲音波形0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 040204060過零譜 圖 22 平移后的過零譜 167。 音量 能量或者音量代表聲音的大小,可由聲音訊號(hào)的震幅來類比,又稱為能量( Energy)或強(qiáng)度( Intensity)等。 話音的能量遠(yuǎn)比噪聲的能量要大,故可河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 8 用能量來區(qū)分是靜音還是由話音。這里將每幀的幅度絕對(duì)值之和作為每一幀的總能量大小。音量譜 如圖 23 所示 : 0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0421012聲音波形0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0405001000音量譜 圖 23 音量譜 167。 過零率和音量積譜 通常利用短時(shí)能量來檢測濁音,用過零率來檢測清音,兩者配合實(shí)現(xiàn)可靠的端點(diǎn)檢測。端點(diǎn)檢測算法常用的是由語音能量和過零率組合的有雙門限法,以及短時(shí)能量和過零率的乘積構(gòu)成的能頻值法。圖 24 展示了過零譜、音量譜和過零率和能量成績構(gòu)成的譜線。 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 9 0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 04202聲音波形0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 04050過零譜0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0405001000音量譜0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 04024x 1 04過零音量積譜 圖 24 過零音量積譜 167。 用過零率和音量積譜來檢測端點(diǎn) 端點(diǎn)檢測算法常用的是由語音能量和過 零率組合的有雙門限法,以及短時(shí)能量和過零率的乘積構(gòu)成的能頻值法。這里采用的是第二種方法,通過能量和過零率的乘積構(gòu)成的能頻值來判斷語音的端點(diǎn)。 這里我對(duì)端點(diǎn)進(jìn)行了兩級(jí)判斷。首先根據(jù) 過零率和音量積 設(shè)定一個(gè)較高的門限 T H , 若譜大于 T H ,則可確定 2 個(gè)端點(diǎn) A、 B, 并可認(rèn)為這 2 個(gè)端點(diǎn)之間是語音信號(hào) , 這樣相當(dāng)于完成初判。 再根據(jù)背景噪聲的 過零率和音量積 設(shè)定一個(gè)比 TH 稍低的門限 T L , 如果信號(hào)的能量大于 TL ,則所對(duì)應(yīng)的端點(diǎn) C、 D 之間仍是語音信號(hào) ,至此完成了第二級(jí)判斷。 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 10 判斷結(jié)果如圖 25 所示 : 0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0421012聲音波形1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 2 . 1x 1 0421012語音波形 圖 25 端點(diǎn)檢測出的語音波形 167。 特征參數(shù)提取 167。 特征參數(shù)概述 對(duì)于特征參數(shù),有多種參數(shù)可供選取。常見的有三種: ( 1) 線形預(yù)測系數(shù)特征矢量 (LPC) ( 2) LPC 倒譜特征矢量 (LPCC) ( 3) Mel 倒譜系數(shù)
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1