【正文】
同時(shí),設(shè)計(jì)中還特別注意開(kāi)放性和推廣性,使用者可以根據(jù)自己的需要改變應(yīng)答反應(yīng)(包括語(yǔ)音輸出和控制輸出),經(jīng)多個(gè)模擬實(shí)驗(yàn)?zāi)軡M(mǎn)足特定的需求。語(yǔ)音播放主要是利用凌陽(yáng)公司提供的函數(shù),凌陽(yáng)單片機(jī)支持其自定的兩種格式:A2000和S480。 采集語(yǔ)音信號(hào)預(yù)加重是否1幀128點(diǎn)采樣完成開(kāi)始是否采集完10幀數(shù)據(jù)存儲(chǔ)計(jì)算每幀能量和過(guò)零率計(jì)算能量閥值和過(guò)零率閥值返回圖13 初始化軟件流程圖該過(guò)程編寫(xiě)的函數(shù)有起點(diǎn)判斷函數(shù)、止點(diǎn)判斷函數(shù)、線性預(yù)測(cè)系數(shù)函數(shù)、線性預(yù)測(cè)倒譜特征函數(shù)、特征值差的分段線性動(dòng)態(tài)時(shí)配函數(shù)、判斷函數(shù)、出錯(cuò)函數(shù)以及利用這些子函數(shù)構(gòu)建的上層函數(shù)——特征提取函數(shù)。該過(guò)程編寫(xiě)的函數(shù)包括預(yù)加重函數(shù)、幀能量函數(shù)、幀過(guò)零率函數(shù)、能量閥值函數(shù)、過(guò)零率閥值函數(shù)。在這些過(guò)程中,倘若某個(gè)過(guò)程超過(guò)10s就會(huì)提示“退出學(xué)習(xí)功能”,不做任何修改。距離閥值是根據(jù)實(shí)驗(yàn)確定的估測(cè)值,能保證可以識(shí)別出模板中的孤立詞,但又不會(huì)造成太多音相近的詞誤判為好。上電復(fù)位后,系統(tǒng)首先采集10幀的背景噪聲數(shù)據(jù),經(jīng)預(yù)加重后提取能量和過(guò)零率特征,求出能量閥值和過(guò)零率閥值,作為起止點(diǎn)判斷的依據(jù)??刂戚敵霾糠钟糜谠谧R(shí)別后單片機(jī)發(fā)出相應(yīng)的操縱信號(hào)——改變輸出I/O口電平或時(shí)序邏輯,操縱外圍硬件,實(shí)現(xiàn)所需要控制功能,具有較強(qiáng)的實(shí)用性和易操縱性,可以根據(jù)需要設(shè)計(jì)不同的控制功能。(5)輸出功能它包括揚(yáng)聲器輸出部分和控制輸出部分。(4)控制輸入部分這部分由3個(gè)按鍵組成,分別為功能轉(zhuǎn)換按鍵(識(shí)別/學(xué)習(xí)),功能確認(rèn)推出按鍵、模板修訂選擇按鍵(用于選擇修改哪個(gè)模板)。存儲(chǔ)空間分為4部分:模板存儲(chǔ)區(qū)用于存儲(chǔ)經(jīng)學(xué)習(xí)過(guò)程得到的孤立詞特征模板,該存儲(chǔ)區(qū)的大小決定存儲(chǔ)模板的數(shù)量,也就決定可識(shí)別的詞匯量;語(yǔ)音信號(hào)暫存區(qū)存儲(chǔ)每個(gè)待識(shí)別對(duì)象;中間數(shù)據(jù)存儲(chǔ)區(qū)包含內(nèi)置的2KB SRAM ,存儲(chǔ)中間計(jì)算量,如背景噪聲特征、學(xué)習(xí)過(guò)程中的中間模板等;提示語(yǔ)音信息存儲(chǔ)區(qū)存儲(chǔ)功能提示語(yǔ)音以及識(shí)別應(yīng)答語(yǔ)音等,便于人機(jī)交互,增強(qiáng)易操作性和趣味性。將傳聲器接反混疊濾波器(100Hz~4000Hz帶通濾波器)后,接入該通道,完成10位8kHz信號(hào)采樣。傳感器反混疊濾波器凌陽(yáng)SPCE061A 單片機(jī)揚(yáng)聲器控制輸出3個(gè)按鍵32KB FLASH存儲(chǔ)器圖12系統(tǒng)硬件框圖以16位凌陽(yáng)單片機(jī)為核心,將整個(gè)硬件系統(tǒng)分為以下幾部分:(1)語(yǔ)音特征提取、學(xué)習(xí)、判別功能部分利用SPCE061A的DSP功能,對(duì)輸入的語(yǔ)音數(shù)字信號(hào)進(jìn)行預(yù)加重處理,轉(zhuǎn)存;提取特征向量;學(xué)習(xí)功能下創(chuàng)建模板,識(shí)別功能下進(jìn)行判別。指令系統(tǒng)增添了DSP功能,在太復(fù)雜的數(shù)字信號(hào)處理應(yīng)用上非常便利,還比專(zhuān)用的DSP芯片便宜得多。3 硬件系統(tǒng)設(shè)計(jì)本設(shè)計(jì)的硬件結(jié)構(gòu)是以凌陽(yáng)單片機(jī)SPCE061A為核心、外圍擴(kuò)展相應(yīng)功能硬件構(gòu)成。學(xué)習(xí)過(guò)程中,這些特征向量作為模板保存。然后選出關(guān)鍵幀:第一幀必選,依次加t(i),大于△的幀為又一關(guān)鍵幀,直到選出M個(gè)關(guān)鍵幀。然后,從后向前依次檢查t(j),凡大于平均特征差的剔除,直到小于平均特征差為止,以去除語(yǔ)意少的結(jié)束段。計(jì)算方法為:每幀特征數(shù)據(jù)為L(zhǎng)( i, j )(對(duì)應(yīng)設(shè)計(jì)中為L(zhǎng)PCC 系數(shù)),歸一化得s ( i, j )。這樣盡管發(fā)音速度不同,但音韻特征的相對(duì)累計(jì)特征差基本不變。基于時(shí)序特征值差的分段線性的動(dòng)態(tài)時(shí)配識(shí)別方法,將動(dòng)態(tài)時(shí)間匹配和特征識(shí)別結(jié)合,相對(duì)其他識(shí)別方法,該方法簡(jiǎn)單、計(jì)算量小,特別適用于特定人孤立詞的短時(shí)段識(shí)別,基本思想是找出語(yǔ)音信號(hào)音韻特征相對(duì)的量(子音、母音、過(guò)渡音等)進(jìn)行距離比較。相對(duì)其他語(yǔ)音特征,LPCC(線性預(yù)測(cè)倒譜特征)有遞推公式,速度和精度都比較好,特別是適于特定人的孤立詞的短時(shí)段識(shí)別。則起點(diǎn)判別方法為:連續(xù)10幀En都超過(guò)IIL的首幀——針對(duì)直接由濁音構(gòu)成的情況;連續(xù)10幀中3幀ZCRn超過(guò)IZCT且2幀En 超過(guò)IIL 的首幀——針對(duì)有清音和濁音共同構(gòu)成的情況。取連續(xù) 10幀背景噪聲數(shù)據(jù) ,計(jì)算出 IZCT( 過(guò)零率閾 ,記為tIZCT )及 ITL (能量閾 ,記為 tIIL ):tIZCT = min(IF,ZC +2IZC)tIIL = min ((Imax Imin) + Imin,4Imin)式中:ZC、IZC 為過(guò)零率的均值和標(biāo)準(zhǔn)差;IF 為固定值,一般取25;Imax 、 Imin 分別為能量的最大值和最小值。對(duì)一幀聲音數(shù)據(jù),能量和過(guò)零率分別用短時(shí)段能量特征 En和短時(shí)段過(guò)零率表征 ZCRn 。話筒預(yù)處理A/D轉(zhuǎn)換特征處 理模板存儲(chǔ)起止點(diǎn)識(shí)別識(shí)別判斷圖11 結(jié)構(gòu)示意圖語(yǔ)音信號(hào)處理基于語(yǔ)音短時(shí)穩(wěn)定性 ,當(dāng)采樣頻率為 8 kHz時(shí) ,可取 128個(gè)樣點(diǎn)為一幀( 短時(shí)段) ,幀長(zhǎng)16 ms。人們?cè)诂F(xiàn)實(shí)生活中還常常用到一些短小的命令來(lái)控制被控對(duì)象的行為,針對(duì)這種特定人的孤立詞的漢語(yǔ)識(shí)別,本設(shè)計(jì)以語(yǔ)音的線性預(yù)測(cè)系數(shù)為語(yǔ)音特征,基于時(shí)序的特征值差的分段線性匹配法為識(shí)別方法,識(shí)別率高,且運(yùn)算簡(jiǎn)單,能很好的滿(mǎn)足設(shè)計(jì)要求。本設(shè)計(jì)采用具有DSP功能并內(nèi)置聲音A/D轉(zhuǎn)換器的凌陽(yáng)單片機(jī),融合控制和DSP功能,使系統(tǒng)大大簡(jiǎn)化。然而,將DSP芯片用于小型語(yǔ)音識(shí)別系統(tǒng)中,其不足之處是很明顯的:(1)引腳多,價(jià)格貴,使用繁瑣;(2)控制功能弱,常需要與單片機(jī)或FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)結(jié)合,來(lái)實(shí)現(xiàn)人機(jī)交互;(3)常需要外接A/D轉(zhuǎn)換芯片;(4),與單片機(jī)、FPGA、Flash存儲(chǔ)器等連接時(shí),要考慮電平匹配。語(yǔ)音識(shí)別追求的主要指標(biāo)為高識(shí)別率、實(shí)時(shí)性和大詞匯量;而對(duì)于一個(gè)語(yǔ)音識(shí)別系統(tǒng),還應(yīng)考慮軟硬件設(shè)計(jì)簡(jiǎn)單、價(jià)格低廉、外圍控制靈活、人機(jī)交互便捷等特點(diǎn)。文中介紹的方法克服了使用DSP芯片建立同樣系統(tǒng)時(shí)的一些不足,如設(shè)計(jì)繁瑣、價(jià)格高、控制不夠靈活等。本系統(tǒng)在具體實(shí)踐時(shí),以漢語(yǔ)言的短命令為識(shí)別對(duì)象,體現(xiàn)漢語(yǔ)音特征。 we select the characteristics of voice and recognition method of fitness identify for a particular word of isolating, processing speed, recognition rate, it can plete the needs of realtime voice recognition. As the same time, the design also pay special attention to openness and promotion, the user can change responses according to their own need (including voice output and control output), it can meet the specific needs through the number of simulation experiments. 9 外文翻譯(譯文)基于凌陽(yáng)單片機(jī)的語(yǔ)音識(shí)別系統(tǒng)語(yǔ)音識(shí)別作為一種人機(jī)交互技術(shù),有著十分廣泛的應(yīng)用。 then for each frame of the characteristics of LPCC, and use characteristics of poor sublinear dynamics to get the the isolated words eigenvector of the voice sect, pared with the template, if the gap between the required distance valve, select the template as a minimum distance results, and make corresponding responses, if the distance beyond the threshold, then the error handling. The distance threshold is set according to the estimate of value, this is to ensure that the template can be identified in terms of isolation, and it will not cause too much similar to the sound of the word for good misjudgement. LearningThrough the conversion function keys to enter and tips “now learning”, confirmed, and then prompted to “edit the first template”, we use the template amendment to amend the choice to select a template, each click into the next template amendments