【正文】
同時(shí)還感謝四年來幫助和教育過我的孫志雄老師、韓建文老師、雷紅老師、石煥玉老師、鄭澤龍老師、于洪老師、林雄老師、張福金老師、黃飛老師……一路走來,從你們的身上我收獲無數(shù),卻無以回報(bào),謹(jǐn)此一并表達(dá)我的謝意。高性能就意味著優(yōu)良的發(fā)音,低性能就意味著劣質(zhì)的發(fā)音(Larocca,et al.,1991)。因而,這樣的一個(gè)特征向量可以表征語(yǔ)音信號(hào)的線形和非線性特征。 所以,在獨(dú)立發(fā)聲式系統(tǒng)中,從語(yǔ)音信號(hào)中提取語(yǔ)音特征是語(yǔ)音識(shí)別系統(tǒng)的一個(gè)基本問題。s Naturally Speaking or IBM39。每條指令要訓(xùn)練兩遍?!緜渥ⅰ吭摵瘮?shù)是用于停止識(shí)別,當(dāng)調(diào)用此函數(shù)時(shí),F(xiàn)IQ_TMA中斷將關(guān)閉。 訓(xùn)練過程【API格式】C:int BSR_Train(int CommandID,int TraindMode)【功能說明】訓(xùn)練函數(shù)。. 走路、跳舞等其它函數(shù)模塊這些函數(shù)就是控制電機(jī)的通與斷的組合完成不用的動(dòng)作,在需要的時(shí)候播放語(yǔ)音,實(shí)現(xiàn)一定的效果,具體請(qǐng)參考函數(shù)原形。其中標(biāo)號(hào)的意義為:M表示Motor,電機(jī)的意思,L表示Left,左邊,M_L1合起來就是左腿電機(jī)的意思,同理M_L2是另一條左腿電機(jī)連線。nSP的DSP運(yùn)算功能配合使用,就可方便地實(shí)現(xiàn)語(yǔ)音識(shí)別功能,從而使其能更好地用于聲控和語(yǔ)音識(shí)別領(lǐng)域。推進(jìn)電機(jī)的任務(wù)就是把發(fā)射所需要的飛盤從存儲(chǔ)倉(cāng)輸送到發(fā)射轉(zhuǎn)盤位置。目前,語(yǔ)音識(shí)別技術(shù)己經(jīng)在諸多領(lǐng)域得到應(yīng)用。學(xué)??梢怨颊撐模ㄔO(shè)計(jì))的全部或部分內(nèi)容。當(dāng)今,機(jī)器人的發(fā)展越來越趨于智能化和人性化,語(yǔ)音是人和機(jī)器人之間交流的最自然、最方便的手段之一。在這種趨勢(shì)的引領(lǐng)下,各國(guó)紛紛加大語(yǔ)音機(jī)器人的研發(fā)力度,并出現(xiàn)了一批高智能的語(yǔ)音機(jī)器人。61 板作為整個(gè)系統(tǒng)的主控板,驅(qū)動(dòng)電路驅(qū)動(dòng)電機(jī)在主控板61 板的控制下完成各個(gè)動(dòng)作。 機(jī)器人線路的辨認(rèn) 需要改裝的控制線共有14條,10根電機(jī)連線、2根眼睛連線、2根喇叭連線。下面列出標(biāo)號(hào)意義,按照從左向右的順序:EYE_N——眼睛接口,接眼睛的負(fù)極連線(白色);IOB12——眼睛接口,接眼睛的正極連線(土黃色);M_F1——發(fā)射電機(jī)接口,接藍(lán)色連線;VCC——發(fā)射電機(jī)接口,接淡藍(lán)色連線;M_J1——加速電機(jī)接口,接綠色連線;VCC——加速電機(jī)接口,接黑色或棕色連線;M_T1——旋轉(zhuǎn)電機(jī)接口,接旋轉(zhuǎn)電機(jī)的一根連線;M_T2——旋轉(zhuǎn)電機(jī)接口,接旋轉(zhuǎn)電機(jī)的另一根連線;M_R1——右腿電機(jī)接口,接右腿電機(jī)的一根連線;M_R2——右腿電機(jī)接口,接右腿電機(jī)的另一根連線;M_L1——左腿電機(jī)接口,接左腿電機(jī)的一根連線;M_L2——左腿電機(jī)接口,接左腿電機(jī)的另一根連線。將語(yǔ)音資源分成小段,播放一點(diǎn)語(yǔ)音,執(zhí)行一點(diǎn)動(dòng)作,然后再播放語(yǔ)音……?!緜渥ⅰ竣僭谡{(diào)用訓(xùn)練程序之前,確保識(shí)別器正確的初始化;②訓(xùn)練次數(shù)是2時(shí),則兩次一定會(huì)有差異,所以一定要保證兩次訓(xùn)練結(jié)果接近;③為了增強(qiáng)可靠性,最好訓(xùn)練兩次,否則辨識(shí)的命令就會(huì)傾向于噪音;④調(diào)用函數(shù)后,等待1~2秒開始訓(xùn)練,也就是說。 其它語(yǔ)音識(shí)別API介紹BSR_PauseRecognizer()暫停識(shí)別,但不釋放中斷等資源BSR_ResumeRecognizer()恢復(fù)被暫停的識(shí)別BSR_GetRecognizerScore()獲得識(shí)別結(jié)果的可信度,返回值從4096到4096,數(shù)值越大表示輸入語(yǔ)音與特征模型的匹配度越高。在不同組指令中交換需要根據(jù)出發(fā)名稱,所以在識(shí)別狀態(tài),要執(zhí)行動(dòng)作首先需要出發(fā)名稱,就是訓(xùn)練的第一條命令,然后可以識(shí)別第一組的其余四條命令。 KewleyPort,1999).These programs include Talk to Me (Auralog,1995),the Tell Me More Series (Auralog,2000),TriplePlay Plus (Mackey amp。經(jīng)過參數(shù)估計(jì)以后,這個(gè)已訓(xùn)練模式就可以應(yīng)用到識(shí)別任務(wù)當(dāng)中。s Naturally Speaking或者IBM公司,闡述了取決于口音,背景噪音,說話方式的基線識(shí)別的準(zhǔn)確性僅僅為60%至80%(Ehsani amp。這些程序的大多數(shù)都不會(huì)提供任何反饋給超出簡(jiǎn)單說明的發(fā)音準(zhǔn)確率,這個(gè)基于最接近模式匹配說明是由用戶提出書面對(duì)話選擇的。只是今后大家就難得再相聚在一起,各奔前程,請(qǐng)大家珍重。在這里首先要感謝鄭心武老師。詳細(xì)說明隱馬爾可夫模型如何工作超出了本文的范圍,但可以在任何關(guān)于語(yǔ)言處理的文章中找到。然而,在語(yǔ)音信號(hào)中,這些非線形信息不容易被當(dāng)前的特征提取邏輯方法所提取,所以我們使用分型維數(shù)來測(cè)量非線形語(yǔ)音擾動(dòng)。因此,本文的研究是在神經(jīng)網(wǎng)絡(luò)和混沌與分形理論的基礎(chǔ)上介紹了語(yǔ)音識(shí)別的過程。最常見的語(yǔ)音合成技術(shù)是將文本轉(zhuǎn)換為語(yǔ)音(TTS)。unsigned int BSR_SDModel[];配合BSR_ExportSDWord(int CommandID)與BSR_ImportSDWord(int CommandID)函數(shù)使用,此數(shù)組的作用相當(dāng)于一個(gè)暫時(shí)的存儲(chǔ)區(qū)?!痉祷刂怠慨?dāng)無命令識(shí)別出來時(shí),返回0;識(shí)別器停止、未初始化或識(shí)別未激活返回-1;當(dāng)識(shí)別不合格時(shí)返回-2;當(dāng)識(shí)別出來時(shí)返回命令的序號(hào)?!緟?shù)】該參數(shù)是辨識(shí)的一個(gè)標(biāo)識(shí)符,0代表選擇SRAM,并初始化。在進(jìn)行語(yǔ)音識(shí)別時(shí),首先讀取FLASH 將語(yǔ)音模型取得,然后調(diào)用BSR_ImportSDWord(uiCommandID);函數(shù)將語(yǔ)音資源載入內(nèi)存。頭部加速電機(jī):一般是黑色和綠色的連線,或棕色和綠色的連線。nSP (TM)為核心的SPCE061A 微控制器是適用于數(shù)字語(yǔ)音識(shí)別應(yīng)用領(lǐng)域產(chǎn)品的一種最經(jīng)濟(jì)的選擇。隨著語(yǔ)音識(shí)別技術(shù)與機(jī)器人技術(shù)的進(jìn)一步結(jié)合,未來高智能的人機(jī)交流將不是夢(mèng)想。經(jīng)過訓(xùn)練,訓(xùn)練人可使用各種命令讓機(jī)器人完成許多有趣的動(dòng)作,使得人機(jī)交互更具智能化。2011年度本科生畢業(yè)論文(設(shè)計(jì))基于SPCE061A單片機(jī)的機(jī)器人設(shè)計(jì)學(xué) 院: 電子信息工程學(xué)院 專 業(yè): 電子信息科學(xué)與技術(shù) 年 級(jí): 2007級(jí) 學(xué)生姓名: 劉 轉(zhuǎn) 轉(zhuǎn) 學(xué) 號(hào): 07406051005 導(dǎo)師及職稱: 鄭心武 (實(shí)驗(yàn)師) 2011年1月2011 Annual Graduation Thesis (Project) of the College Undergraduate Microcontrollerbased robot design SPCE061ADepartment: College of Electronics and Information EngineeringMajor: Electronic Information Science and TechnologyGrade: 2007Student’s Name:Liu ZhuanzhuanStudent No.: 07406051005Tutor: Zheng Xinwu(Technician)January,2011畢業(yè)論文(設(shè)計(jì))原創(chuàng)性聲明本人所呈交的畢業(yè)論文(設(shè)計(jì))是我在導(dǎo)師的指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。該系統(tǒng)利用凌陽(yáng)單片機(jī)在數(shù)字信號(hào)處理及語(yǔ)音處理方面的優(yōu)越性,通過語(yǔ)音辨識(shí)技術(shù),可以讓機(jī)器人在語(yǔ)音指令控制下實(shí)現(xiàn)前進(jìn),后退,跳舞,發(fā)射以及連續(xù)發(fā)射飛盤等多種功能。在語(yǔ)音交流的過程中,抗噪音能力得到了很大的提高。SPCE061 A既具有體積小、集成度高、可靠性好的特點(diǎn),又具有較強(qiáng)的中斷處理能力、高性能的價(jià)格比和功能強(qiáng)、效率高的指令系統(tǒng)及低功耗、低電壓的特點(diǎn),以u(píng)39。頭部發(fā)射電機(jī):藍(lán)色和淺藍(lán)色連線。將訓(xùn)練好的語(yǔ)音模型導(dǎo)出存儲(chǔ)到FLASH中使用庫(kù)函數(shù)BSR_ExportSDWord(uiCommandID);進(jìn)行操作,然后再調(diào)用讀寫FLASH中的函數(shù)進(jìn)行。開始初始化RAM執(zhí)行訓(xùn)練,獲得訓(xùn)練結(jié)果訓(xùn)練成功返回開始定時(shí)采集語(yǔ)音樣本返回語(yǔ)音特征模型開始初始化識(shí)別器獲得識(shí)別結(jié)果識(shí)別出語(yǔ)音命令執(zhí)行相應(yīng)操作返回YNNY中斷服務(wù)識(shí)別過程識(shí)別過程訓(xùn)練過程 語(yǔ)音識(shí)別的實(shí)現(xiàn) 初始化過程【API格式】C:int BSR_DeleteSDGroup(0)【功能說明】SRAM初始化?!緟?數(shù)】無。BSR_ImportSDWord(int CommandID)可以把BSR_SDModel 數(shù)組中的數(shù)據(jù)導(dǎo)入為某條語(yǔ)音命令的特征模型。語(yǔ)音識(shí)別基本原理圖如下():預(yù)處理特征提取模式匹配后處理主意模型庫(kù)輸入語(yǔ)音識(shí)別訓(xùn)練初步識(shí)別結(jié)果識(shí)別結(jié)果 語(yǔ)音識(shí)別基本原理 語(yǔ)音合成技術(shù)將以其他方式表示或存儲(chǔ)的信息轉(zhuǎn)換成語(yǔ)音。最近,隨著非線性系統(tǒng)理論的發(fā)展,如人工神經(jīng)網(wǎng)絡(luò),混沌與分形,可能應(yīng)用這些理論到語(yǔ)音識(shí)別中。這些信號(hào)特征構(gòu)成了語(yǔ)音信號(hào)最基本的光譜結(jié)構(gòu)。 Knodt,1998)。經(jīng)過半個(gè)學(xué)期的忙碌和工作,本次畢業(yè)設(shè)計(jì)已經(jīng)接近尾聲,作為一個(gè)本科生的畢業(yè)設(shè)計(jì),由于經(jīng)驗(yàn)的匱乏,難免有許多考慮不周全的地方,如果沒有導(dǎo)師的督促指導(dǎo),以及一起工作的同學(xué)們的支持,想要完成這個(gè)設(shè)計(jì)是難以想象的。我們?cè)谝黄鸬娜兆?,我永遠(yuǎn)記著的!最后要感謝的是我的父母,他們不僅培養(yǎng)了我對(duì)中國(guó)傳統(tǒng)文化的濃厚興趣,讓我在漫長(zhǎng)的人生旅途中使心靈有了虔敬的歸依,而且也為我能夠順利的完成畢業(yè)論文提供了巨大的支持與幫助。學(xué)習(xí)者不會(huì)被告之他們發(fā)音的準(zhǔn)確率。 Knodt,1998)。輸入信號(hào)將會(huì)被確認(rèn)為造成詞,其精確度是可以評(píng)估的。 Choi,1998),New Dynamic English (DynEd,1997),English Discoveries (Edusoft,1998),and See it,Hear It,SAY IT! (CPI,1997).Most of these programs do not provide any feedback on pronunciation accuracy beyond simply indicating which written dialogue choice the user has made,based on the closest pattern match.Learners are not told the accuracy of their pronunciation.In particular,Neri,et al. (2002) criticizes the graphical wave forms presented in products such as Talk to Me and Tell Me More because they look flashy to buyers,but do not give meaningful feedback to users.The 2000 version of Talk to Me has incorporated more of the features that Hinks (2003),for example,believes are useful to learners:u A visual signal allows learners to pare their intonation to that of the model speaker.u The learners39。在觸發(fā)第一條指令,然后再觸發(fā)第二條指令,就可以識(shí)別第三條指令,:名稱再來一曲開始準(zhǔn)備跳舞