【正文】
要感謝鄭心武老師。鄭老師不僅在學(xué)業(yè)上給我以精心指導(dǎo),同時(shí)還在思想、生活上給我以無(wú)微不至的關(guān)懷,在此謹(jǐn)向鄭老師致以誠(chéng)摯的謝意和崇高的敬意。從遙遠(yuǎn)的家鄉(xiāng)來(lái)到這個(gè)陌生的城市里,四年了,仿佛就在昨天。在未來(lái)的日子里,我會(huì)更加努力的學(xué)習(xí)和工作,不辜負(fù)父母對(duì)我的殷殷期望!我一定會(huì)好好孝敬和報(bào)答他們!在論文即將完成之際,我的心情無(wú)法平靜,從開(kāi)始進(jìn)入課題到論文的順利完成,有多少可敬的師長(zhǎng)、同學(xué)、朋友給了我無(wú)言的幫助,在這里請(qǐng)接受我誠(chéng)摯的謝意!31。只是今后大家就難得再相聚在一起,各奔前程,請(qǐng)大家珍重。在此,我還要感謝在一起愉快的度過(guò)大學(xué)四年的同學(xué)。鄭老師多次詢問(wèn)研究進(jìn)程,并為我指點(diǎn)迷津,幫助我開(kāi)拓研究思路,精心點(diǎn)撥、熱忱鼓勵(lì)。u 學(xué)習(xí)者發(fā)音的準(zhǔn)確度通常以數(shù)字7來(lái)度量(越高越好)u 那些發(fā)音失真的詞語(yǔ)會(huì)被識(shí)別出來(lái)并被明顯地標(biāo)注致 謝大學(xué)四年所收獲的不僅僅是愈加豐厚的知識(shí),更重要的是在閱讀、實(shí)踐中所培養(yǎng)的思維方式、表達(dá)能力和廣闊視野。這些程序的大多數(shù)都不會(huì)提供任何反饋給超出簡(jiǎn)單說(shuō)明的發(fā)音準(zhǔn)確率,這個(gè)基于最接近模式匹配說(shuō)明是由用戶提出書(shū)面對(duì)話選擇的。雖然語(yǔ)音識(shí)別已被普遍用于商業(yè)聽(tīng)寫(xiě)和獲取特殊需要等目的,近年來(lái),語(yǔ)言學(xué)習(xí)的市場(chǎng)占有率急劇增加(Aist,1999;Eskenazi,1999;Hinks,2003)。 Martin (2000) and Hosom,Cole,and Fanty (2003)。在自動(dòng)語(yǔ)音識(shí)別產(chǎn)品中的幾種語(yǔ)音識(shí)別方式中,隱馬爾可夫模型(HMM)被認(rèn)為是最主要的算法,并且被證明在處理大詞匯語(yǔ)音時(shí)是最高效的(Ehsani amp。s Naturally Speaking或者IBM公司,闡述了取決于口音,背景噪音,說(shuō)話方式的基線識(shí)別的準(zhǔn)確性僅僅為60%至80%(Ehsani amp。4.自動(dòng)語(yǔ)音識(shí)別的結(jié)構(gòu)和特征自動(dòng)語(yǔ)音識(shí)別是一項(xiàng)尖端技術(shù),它允許一臺(tái)計(jì)算機(jī),甚至是一臺(tái)手持掌上電腦(邁爾斯,2000)來(lái)識(shí)別那些需要朗讀或者任何錄音設(shè)備發(fā)音的詞匯。3.3 改進(jìn)的特征提取方法考慮到LPCC語(yǔ)音信號(hào)和分形維數(shù)在表達(dá)上各自的優(yōu)點(diǎn),我們把它們二者混合到信號(hào)的特取中,即分形維數(shù)表表征語(yǔ)音時(shí)間波形圖的自相似性,周期性,隨機(jī)性,同時(shí),LPCC特性在高語(yǔ)音質(zhì)量和高識(shí)別速度上做得很好。這兩種方法都是基于一種假設(shè)的線形程序,該假設(shè)認(rèn)為說(shuō)話者所擁有的語(yǔ)音特性是由于聲道共振造成的。經(jīng)過(guò)參數(shù)估計(jì)以后,這個(gè)已訓(xùn)練模式就可以應(yīng)用到識(shí)別任務(wù)當(dāng)中。語(yǔ)音識(shí)別包括訓(xùn)練和識(shí)別,我們可以把它看做一種模式化的識(shí)別任務(wù)。非獨(dú)立發(fā)聲式是指發(fā)音模式是由單個(gè)人來(lái)進(jìn)行訓(xùn)練,其對(duì)訓(xùn)練人命令的識(shí)別速度很快,但它對(duì)與其他人的指令識(shí)別速度很慢,或者不能識(shí)別。隨著語(yǔ)音識(shí)別的深度研究,研究者發(fā)現(xiàn),語(yǔ)音信號(hào)是一個(gè)復(fù)雜的非線性過(guò)程,如果語(yǔ)音識(shí)別研究想要獲得突破,那么就必須引進(jìn)非線性系統(tǒng)理論方法。 KewleyPort,1999).These programs include Talk to Me (Auralog,1995),the Tell Me More Series (Auralog,2000),TriplePlay Plus (Mackey amp。s ViaVoice,for example,show a baseline recognition accuracy of only 60% to 80%,depending upon accent,background noise,type of utterance,etc.(Ehsani amp。系統(tǒng)只用了單顆SPCE061A芯片來(lái)完成語(yǔ)音處理和控制功能,與專用的語(yǔ)音處理芯片相比,具有結(jié)構(gòu)簡(jiǎn)單、成本低、易實(shí)現(xiàn)的特點(diǎn),并且凌陽(yáng)科技公司提供了豐富的C函數(shù)庫(kù)和語(yǔ)音處理函數(shù)庫(kù),供調(diào)用,縮短了開(kāi)發(fā)周期。模式匹配,把輸入語(yǔ)音的特征參數(shù)與語(yǔ)音模型庫(kù)進(jìn)行比較分析,得到識(shí)別結(jié)果。在不同組指令中交換需要根據(jù)出發(fā)名稱,所以在識(shí)別狀態(tài),要執(zhí)行動(dòng)作首先需要出發(fā)名稱,就是訓(xùn)練的第一條命令,然后可以識(shí)別第一組的其余四條命令。當(dāng)一條指令被正確識(shí)別時(shí)會(huì)提示進(jìn)入下一條;如沒(méi)有被識(shí)別會(huì)要求重復(fù)該指令,直到正確識(shí)別為止。打開(kāi)機(jī)器人應(yīng)用實(shí)例程序,編譯、鏈接確認(rèn)沒(méi)有錯(cuò)誤。BSR_ExportSDWord(int CommandID)使用函數(shù)庫(kù)時(shí),會(huì)自動(dòng)創(chuàng)建一個(gè)100Word的數(shù)組BSR_SDModel[100],可以把某條訓(xùn)練命令的特征模型數(shù)據(jù)導(dǎo)出到這個(gè)數(shù)組中。 其它語(yǔ)音識(shí)別API介紹BSR_PauseRecognizer()暫停識(shí)別,但不釋放中斷等資源BSR_ResumeRecognizer()恢復(fù)被暫停的識(shí)別BSR_GetRecognizerScore()獲得識(shí)別結(jié)果的可信度,返回值從4096到4096,數(shù)值越大表示輸入語(yǔ)音與特征模型的匹配度越高。中斷過(guò)程:【API格式】ASM:_BSR_FIQ_Routine【功能說(shuō)明】在中斷中調(diào)用?!続PI格式】C:void BSR_StopRecognizer(void)【功能說(shuō)明】停止辨識(shí)?!続PI格式】C:int BSR_GetResult(Void)【功能說(shuō)明】辨識(shí)中獲取數(shù)據(jù)?!緜渥ⅰ竣僭谡{(diào)用訓(xùn)練程序之前,確保識(shí)別器正確的初始化;②訓(xùn)練次數(shù)是2時(shí),則兩次一定會(huì)有差異,所以一定要保證兩次訓(xùn)練結(jié)果接近;③為了增強(qiáng)可靠性,最好訓(xùn)練兩次,否則辨識(shí)的命令就會(huì)傾向于噪音;④調(diào)用函數(shù)后,等待1~2秒開(kāi)始訓(xùn)練,也就是說(shuō)?!緟?shù)】CommandID:命令序號(hào),范圍從0x100到0x105,并且對(duì)于每組訓(xùn)練語(yǔ)句都是唯一的?!緜渥ⅰ空Z(yǔ)音命令的特征模型是通過(guò)BSR_Train函數(shù)保存在RAM空間中的。 API函數(shù)的介紹SPCE061A 實(shí)現(xiàn)語(yǔ)音識(shí)別的步驟,分為訓(xùn)練部分與識(shí)別部分,以及在訓(xùn)練、識(shí)別過(guò)程中中斷的情況。將語(yǔ)音資源分成小段,播放一點(diǎn)語(yǔ)音,執(zhí)行一點(diǎn)動(dòng)作,然后再播放語(yǔ)音……。在一般動(dòng)作中,控制電機(jī)的正轉(zhuǎn)或者反轉(zhuǎn)就可以了。 位操作模塊由于SPCE061A沒(méi)有位操作指令,而在程序控制電機(jī)的時(shí)候需要經(jīng)常操作某一位,為了方便程序的編寫(xiě),增強(qiáng)可讀性,編寫(xiě)了位操作模塊。 擦除Flash模塊判斷是否為第一次下載根據(jù)FLASH中的標(biāo)志位來(lái)進(jìn)行判斷。下面列出標(biāo)號(hào)意義,按照從左向右的順序:EYE_N——眼睛接口,接眼睛的負(fù)極連線(白色);IOB12——眼睛接口,接眼睛的正極連線(土黃色);M_F1——發(fā)射電機(jī)接口,接藍(lán)色連線;VCC——發(fā)射電機(jī)接口,接淡藍(lán)色連線;M_J1——加速電機(jī)接口,接綠色連線;VCC——加速電機(jī)接口,接黑色或棕色連線;M_T1——旋轉(zhuǎn)電機(jī)接口,接旋轉(zhuǎn)電機(jī)的一根連線;M_T2——旋轉(zhuǎn)電機(jī)接口,接旋轉(zhuǎn)電機(jī)的另一根連線;M_R1——右腿電機(jī)接口,接右腿電機(jī)的一根連線;M_R2——右腿電機(jī)接口,接右腿電機(jī)的另一根連線;M_L1——左腿電機(jī)接口,接左腿電機(jī)的一根連線;M_L2——左腿電機(jī)接口,接左腿電機(jī)的另一根連線。根據(jù)前面辨認(rèn),左腿電機(jī)是粉色和黑色兩根連線,具體是粉色接M_L1還是黑色接M_L1將影響電機(jī)的正轉(zhuǎn)還是反轉(zhuǎn),根據(jù)控制信號(hào)需要連接。喇叭連線:兩條粉色的連線。胸部電機(jī):紅色和黑色的連線。 機(jī)器人線路的辨認(rèn) 需要改裝的控制線共有14條,10根電機(jī)連線、2根眼睛連線、2根喇叭連線。 機(jī)器人 主要功能: ◆通過(guò)語(yǔ)音命令對(duì)其進(jìn)行控制; ◆可以跳兩首舞曲;◆走步功能、轉(zhuǎn)向功能、轉(zhuǎn)頭功能;◆發(fā)射飛盤(pán)功能; 實(shí)物圖 機(jī)器人實(shí)物圖 注意事項(xiàng)機(jī)器人在發(fā)射飛盤(pán)時(shí)不要面向人,避免受傷;機(jī)器人要輕拿輕放,應(yīng)該避免摔打;在安裝電池時(shí)注意正負(fù)極,否則容易燒壞機(jī)器人電機(jī)或主控制板。nSP(TM)微處理器;(2),I/;(3);(4)內(nèi)置2k字SRAM;(5)內(nèi)置32K字Flash存儲(chǔ)器;(6)可編程音頻處理;(7)晶體振蕩器;(8)系統(tǒng)處于備用狀態(tài)下(時(shí)鐘處于停止?fàn)顟B(tài)),耗電小于2uA/;(9)2個(gè)16位可編程定時(shí)器/計(jì)數(shù)器(可自動(dòng)預(yù)置初始計(jì)數(shù)值);(10)2個(gè)10位DAC(數(shù)/模轉(zhuǎn)換)輸出通道;(11)16位通用可編程輸入/輸出端口;(12)14個(gè)中斷源可來(lái)自定時(shí)器AB,時(shí)基,2個(gè)外部時(shí)鐘源輸入,鍵喚醒;(13)具備觸鍵喚醒的功;(14)鎖相環(huán)PLL振蕩器提供系統(tǒng)時(shí)鐘信號(hào);(15)32768Hz實(shí)時(shí)時(shí)鐘;(16)7通道10位電壓模數(shù)轉(zhuǎn)換(ADC)和單通道聲音模數(shù)轉(zhuǎn)換器;(17)聲音模數(shù)轉(zhuǎn)換器輸入通道內(nèi)置麥克風(fēng)放大器和自動(dòng)增益控制(AGC)功能;(18)具備串行設(shè)備接口;(19)低電壓復(fù)位(LVR)功能和低電壓監(jiān)測(cè)(LVD)功能;(20)內(nèi)置在線仿真電路接口ICE (lnCircuit Emulator);(21)具有保密能力;(22)具有WatchDog功能;(23)可編程音頻處理,使用凌陽(yáng)音頻編碼SACM_S240方式(),能容納210s的語(yǔ)音數(shù)據(jù)。)。61 板作為整個(gè)系統(tǒng)的主控板,驅(qū)動(dòng)電路驅(qū)動(dòng)電機(jī)在主控板61 板的控制下完成各個(gè)動(dòng)作。它依靠的是電機(jī)帶動(dòng)一個(gè)機(jī)簧的機(jī)械裝置。除發(fā)射電機(jī)和推進(jìn)電機(jī)外,其它三個(gè)電機(jī)均是正反兩用電機(jī),即加在電機(jī)驅(qū)動(dòng)端的兩路輸入為高低電平時(shí)電機(jī)轉(zhuǎn)動(dòng),改變輸入高低電平的順序,電機(jī)反向轉(zhuǎn)動(dòng),這樣可以控制機(jī)器人的前進(jìn),后退,左右搖頭等雙向動(dòng)作。更加入了獨(dú)有的噪聲檢測(cè)技術(shù),當(dāng)環(huán)境噪聲很大時(shí),能給用戶相應(yīng)的提示;并且加入了可信度評(píng)估和拒識(shí)技術(shù),對(duì)于命令以外的語(yǔ)音或者干擾聲音可以拒識(shí)。在這種趨勢(shì)的引領(lǐng)下,各國(guó)紛紛加大語(yǔ)音機(jī)器人的研發(fā)力度,并出現(xiàn)了一批高智能的語(yǔ)音機(jī)器人。隨著信息產(chǎn)業(yè)的迅速發(fā)展,包括計(jì)算機(jī)、辦公自動(dòng)化、通信、國(guó)防、機(jī)器人在內(nèi)的各個(gè)領(lǐng)域,都迫切需要采用語(yǔ)音識(shí)別技術(shù)來(lái)改變極其不方便的人機(jī)接口方式。從實(shí)現(xiàn)手段看,當(dāng)前以電子技術(shù)為基礎(chǔ)實(shí)現(xiàn)語(yǔ)音識(shí)別可以利用單片機(jī)數(shù)字信號(hào)處理或語(yǔ)音識(shí)別專用集成電路芯片來(lái)完成從設(shè)計(jì)成本功能實(shí)現(xiàn)程度等綜合來(lái)看,利用單片機(jī)來(lái)實(shí)現(xiàn)語(yǔ)音識(shí)別是一種高性價(jià)比的方法。系統(tǒng)主要包括語(yǔ)音識(shí)別模塊,語(yǔ)音播放模塊以及機(jī)器人動(dòng)作控制模塊。當(dāng)今,機(jī)器人的發(fā)展越來(lái)越趨于智能化和人性化,語(yǔ)音是人和機(jī)器人之間交流的最自然、最方便的手段之一。保密的論文(設(shè)計(jì))在解密后適用本規(guī)定。對(duì)本論文(設(shè)計(jì))的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中作了明確說(shuō)明并表示謝意。據(jù)我所知,除文中已經(jīng)注明引用的內(nèi)容外,本論文(設(shè)計(jì))不包含其他個(gè)人已經(jīng)發(fā)表或撰寫(xiě)過(guò)的研究成果。學(xué)??梢怨颊撐模ㄔO(shè)計(jì))的全部或部分內(nèi)容。它的CPU內(nèi)核采用16位具有DSP功能的微處理器芯片,而且CPU可最高工作在49MHz的主頻下,能夠非常容易地、快速地處理復(fù)雜的數(shù)字信號(hào),因此與其他類(lèi)型的單片機(jī)相比,在數(shù)字語(yǔ)音處理方面SPCE061A更具有優(yōu)勢(shì)。基于以上機(jī)器人的發(fā)展方向,該設(shè)計(jì)制作了一個(gè)以凌陽(yáng)單片機(jī)為核心的智能機(jī)器人軟件系統(tǒng)。 關(guān)鍵詞:SPCE061A單片機(jī);機(jī)器人;語(yǔ)音識(shí)別 ABSTRACTSunplus 16bit SPCE061ASCM is embedded with 32K word Flash and 2K word SRAM,with builtin 10bit ADC and DAC as well as more than 14 interrupt sources. The core of its CPU is a 16bit microprocessor chip which has the function of DSP. Besides,the CPU can work with a frequency up to 49 MHz,and process plex digital signals easily and quickly. Therefore,pared with other types of SCM,SPCE061A has more advantages in speech processing. Today,the development of robots bee