freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于凌陽單片機的語音識別系統(tǒng)-資料下載頁

2025-08-10 17:14本頁面
  

【正文】 D轉(zhuǎn)換器的凌陽單片機,融合控制和DSP功能,使系統(tǒng)大大簡化?,F(xiàn)在語音特征的提取和識別方法很多,如隱馬爾可夫法對非特定人連續(xù)語音有很高的識別率,但過程繁瑣。人們在現(xiàn)實生活中還常常用到一些短小的命令來控制被控對象的行為,針對這種特定人的孤立詞的漢語識別,本設(shè)計以語音的線性預(yù)測系數(shù)為語音特征,基于時序的特征值差的分段線性匹配法為識別方法,識別率高,且運算簡單,能很好的滿足設(shè)計要求。2語音識別系統(tǒng)的構(gòu)成語音識別系統(tǒng)的基本構(gòu)成主要包括預(yù)處理、A/D轉(zhuǎn)換、起止點識別、特征提取和識別判斷等部分,結(jié)構(gòu)示意圖如圖11所示。話筒預(yù)處理A/D轉(zhuǎn)換特征處 理模板存儲起止點識別識別判斷圖11 結(jié)構(gòu)示意圖語音信號處理基于語音短時穩(wěn)定性 ,當(dāng)采樣頻率為 8 kHz時 ,可取 128個樣點為一幀( 短時段) ,幀長16 ms。字音由濁音和清音構(gòu)成 ,與噪聲相比 ,濁音表現(xiàn)為高能量 ,清音表現(xiàn)為高過零率。對一幀聲音數(shù)據(jù),能量和過零率分別用短時段能量特征 En和短時段過零率表征 ZCRn 。通過區(qū)別于背景噪聲可以判別語音起止點。取連續(xù) 10幀背景噪聲數(shù)據(jù) ,計算出 IZCT( 過零率閾 ,記為tIZCT )及 ITL (能量閾 ,記為 tIIL ):tIZCT = min(IF,ZC +2IZC)tIIL = min ((Imax Imin) + Imin,4Imin)式中:ZC、IZC 為過零率的均值和標(biāo)準(zhǔn)差;IF 為固定值,一般取25;Imax 、 Imin 分別為能量的最大值和最小值。漢字的一個字音由清音加濁音或直接由濁音構(gòu)成,結(jié)尾無清音,孤立詞兩字音之間空隙很短。則起點判別方法為:連續(xù)10幀En都超過IIL的首幀——針對直接由濁音構(gòu)成的情況;連續(xù)10幀中3幀ZCRn超過IZCT且2幀En 超過IIL 的首幀——針對有清音和濁音共同構(gòu)成的情況。終點判別為:連續(xù)5幀的En和ZCRn都小于閥值的首幀——詞末沒有清音,采樣不需太長,但防止詞間清音造成誤判。相對其他語音特征,LPCC(線性預(yù)測倒譜特征)有遞推公式,速度和精度都比較好,特別是適于特定人的孤立詞的短時段識別。LPCC在LPC(線性預(yù)測系數(shù)特征)基礎(chǔ)上求得:c (1) = a (1)c (n) = a (k) c ( n k ) + a ( n )在上面兩個式中:c (n) ( n = 1,2, … ,p),為LPCC系數(shù),p為特征模型階數(shù),取12階則可對絕大多數(shù)語音信號的聲道模型足夠近似逼近,a (k) 為LPC特征,1<n≤p?;跁r序特征值差的分段線性的動態(tài)時配識別方法,將動態(tài)時間匹配和特征識別結(jié)合,相對其他識別方法,該方法簡單、計算量小,特別適用于特定人孤立詞的短時段識別,基本思想是找出語音信號音韻特征相對的量(子音、母音、過渡音等)進行距離比較。其方法是按時序找出幀特征的差值(特征差),再將音韻特征所包含的特征差累加除以整個字音的總特征差,得到相對累計特征差。這樣盡管發(fā)音速度不同,但音韻特征的相對累計特征差基本不變。經(jīng)語音數(shù)據(jù)分析發(fā)現(xiàn),語音結(jié)束段雖然頻譜變化劇烈,但語意少,對區(qū)別語音作用不大,在該識別方法中刪去了該段特征。計算方法為:每幀特征數(shù)據(jù)為L( i, j )(對應(yīng)設(shè)計中為LPCC 系數(shù)),歸一化得s ( i, j )。相鄰兩幀的特征差為:T ( j ) = 平均特征差為:式中:N為語音幀數(shù)。然后,從后向前依次檢查t(j),凡大于平均特征差的剔除,直到小于平均特征差為止,以去除語意少的結(jié)束段。數(shù)據(jù)幀數(shù)減為N′,設(shè)累計特征差閥為:△= M≤N′1為保留的關(guān)鍵幀數(shù),通常每個字音取8,則雙字孤立詞取16。然后選出關(guān)鍵幀:第一幀必選,依次加t(i),大于△的幀為又一關(guān)鍵幀,直到選出M個關(guān)鍵幀。再分段線性化,將兩個關(guān)鍵幀之間的特征值差取平均,作為最后的語音特征向量。學(xué)習(xí)過程中,這些特征向量作為模板保存。識別過程中,這些特征向量與模板相比較,計算距離,在距離閥內(nèi)最小距離為識別結(jié)果。3 硬件系統(tǒng)設(shè)計本設(shè)計的硬件結(jié)構(gòu)是以凌陽單片機SPCE061A為核心、外圍擴展相應(yīng)功能硬件構(gòu)成。凌陽16位單片機SPCE061A在片內(nèi)硬件結(jié)構(gòu)和指令系統(tǒng)上都非常適用于語音信號處理,其主要的特點為:速度快,多中斷,多個A/D轉(zhuǎn)換器,特別是具有內(nèi)置傳聲放大器與自動增益控制功能的單通道聲道A/D轉(zhuǎn)換器,具有音頻輸出功能的雙通道10位D/A轉(zhuǎn)換器。指令系統(tǒng)增添了DSP功能,在太復(fù)雜的數(shù)字信號處理應(yīng)用上非常便利,還比專用的DSP芯片便宜得多。整個系統(tǒng)的硬件結(jié)構(gòu)框圖如圖12所示。傳感器反混疊濾波器凌陽SPCE061A 單片機揚聲器控制輸出3個按鍵32KB FLASH存儲器圖12系統(tǒng)硬件框圖以16位凌陽單片機為核心,將整個硬件系統(tǒng)分為以下幾部分:(1)語音特征提取、學(xué)習(xí)、判別功能部分利用SPCE061A的DSP功能,對輸入的語音數(shù)字信號進行預(yù)加重處理,轉(zhuǎn)存;提取特征向量;學(xué)習(xí)功能下創(chuàng)建模板,識別功能下進行判別。(2)語音信號采集部分由于SPCE061A內(nèi)置傳聲器與自動增益控制功能的單通道聲音A/D轉(zhuǎn)換器,可以省去許多前端處理硬件,簡化電路,提高穩(wěn)定性。將傳聲器接反混疊濾波器(100Hz~4000Hz帶通濾波器)后,接入該通道,完成10位8kHz信號采樣。(3)外擴數(shù)據(jù)存儲部分由于語音信號處理需要較大的數(shù)據(jù)存儲,所以外擴32KB Flash 存儲器作為數(shù)據(jù)存儲器。存儲空間分為4部分:模板存儲區(qū)用于存儲經(jīng)學(xué)習(xí)過程得到的孤立詞特征模板,該存儲區(qū)的大小決定存儲模板的數(shù)量,也就決定可識別的詞匯量;語音信號暫存區(qū)存儲每個待識別對象;中間數(shù)據(jù)存儲區(qū)包含內(nèi)置的2KB SRAM ,存儲中間計算量,如背景噪聲特征、學(xué)習(xí)過程中的中間模板等;提示語音信息存儲區(qū)存儲功能提示語音以及識別應(yīng)答語音等,便于人機交互,增強易操作性和趣味性。這部分語音信號的錄入可以通過凌陽公司提供的wav_press軟件實現(xiàn)。(4)控制輸入部分這部分由3個按鍵組成,分別為功能轉(zhuǎn)換按鍵(識別/學(xué)習(xí)),功能確認(rèn)推出按鍵、模板修訂選擇按鍵(用于選擇修改哪個模板)。這3個按鍵即可完成功能選擇的人機交互。(5)輸出功能它包括揚聲器輸出部分和控制輸出部分。揚聲器接到SPCE061A的具有音頻輸出功能的雙通道10位D/A轉(zhuǎn)換器上,用于輸出提示語音和應(yīng)答語音。控制輸出部分用于在識別后單片機發(fā)出相應(yīng)的操縱信號——改變輸出I/O口電平或時序邏輯,操縱外圍硬件,實現(xiàn)所需要控制功能,具有較強的實用性和易操縱性,可以根據(jù)需要設(shè)計不同的控制功能。4 系統(tǒng)運行過程整個系統(tǒng)運行過程分為初始化、識別和學(xué)習(xí)3個部分。上電復(fù)位后,系統(tǒng)首先采集10幀的背景噪聲數(shù)據(jù),經(jīng)預(yù)加重后提取能量和過零率特征,求出能量閥值和過零率閥值,作為起止點判斷的依據(jù)。初始化后,單片機不斷采樣外界信號,保存10幀數(shù)據(jù)進行起點判斷;然后采樣52幀語音數(shù)據(jù),進入判斷:先進行止點的判斷,確定范圍,若無止點則出錯處理;然后計算每幀的LPCC特征,并利用特征值差的分段線性動態(tài)時配法獲得該語音段孤立詞的特征向量,與模板比較,若差距在規(guī)定的距離閥內(nèi),選擇最小距離的模板作為結(jié)果,并做出相應(yīng)的應(yīng)答反應(yīng),若超出距離閥值,則出錯處理。距離閥值是根據(jù)實驗確定的估測值,能保證可以識別出模板中的孤立詞,但又不會造成太多音相近的詞誤判為好。通過功能轉(zhuǎn)換按鍵進入,并提示“現(xiàn)在為學(xué)習(xí)功能”,確認(rèn),然后提示“修訂第一個模板”,用模板修訂選擇鍵選擇要修訂的模板,每按一下進入下一個模板修訂,確認(rèn)進入;然后提示“第一遍語音輸入”,為保證模板的準(zhǔn)確性,此處要求輸入4遍,提取特征向量,暫存模板,只有4遍都成功,取平均特征向量才修改模板,并提示“成功修改”后退出,否則不保留數(shù)據(jù),不修改模板。在這些過程中,倘若某個過程超過10s就會提示“退出學(xué)習(xí)功能”,不做任何修改。5 軟件設(shè)計根據(jù)語音識別的原理和系統(tǒng)運行過程,編寫了相應(yīng)的C語言程序。該過程編寫的函數(shù)包括預(yù)加重函數(shù)、幀能量函數(shù)、幀過零率函數(shù)、能量閥值函數(shù)、過零率閥值函數(shù)。其軟件流程如圖13所示。 采集語音信號預(yù)加重是否1幀128點采樣完成開始是否采集完10幀數(shù)據(jù)存儲計算每幀能量和過零率計算能量閥值和過零率閥值返回圖13 初始化軟件流程圖該過程編寫的函數(shù)有起點判斷函數(shù)、止點判斷函數(shù)、線性預(yù)測系數(shù)函數(shù)、線性預(yù)測倒譜特征函數(shù)、特征值差的分段線性動態(tài)時配函數(shù)、判斷函數(shù)、出錯函數(shù)以及利用這些子函數(shù)構(gòu)建的上層函數(shù)——特征提取函數(shù)。學(xué)習(xí)過程編寫的函數(shù)有特征提取函數(shù)、模板修改函數(shù)、計時函數(shù)和語音播放函數(shù)。語音播放主要是利用凌陽公司提供的函數(shù),凌陽單片機支持其自定的兩種格式:A2000和S480。6 結(jié)束語本設(shè)計采用性價比較高的凌陽單片機SPCE061A作語音識別處理器,硬件電路簡單,控制靈活,人機交互好;選用適合特定人孤立詞識別的語音特征和識別方法,處理速度快,識別率高,可完成實時語音識別的需要。同時,設(shè)計中還特別注意開放性和推廣性,使用者可以根據(jù)自己的需要改變應(yīng)答反應(yīng)(包括語音輸出和控制輸出),經(jīng)多個模擬實驗?zāi)軡M足特定的需求。 17
點擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1