【正文】
寬端點(diǎn)限制的DTW算法。雖然HMM 模型和ANN 在連續(xù)語音大詞匯量語音識(shí)別系統(tǒng)優(yōu)于DTW, 但由于DTW 算法計(jì)算量較少、無需前期的長(zhǎng)期訓(xùn)練, 也很容易將DTW 算法移植到嵌入式設(shè)備上實(shí)現(xiàn), 而且能滿足實(shí)時(shí)性要求, 故其在孤立詞語音識(shí)別系統(tǒng)中仍然得到了廣泛的應(yīng)用。故本設(shè)計(jì)采用DTW算法。由于HMM 模型需要大量的前期訓(xùn)練工作和大量的存儲(chǔ)資源,并且計(jì)算復(fù)雜,不太適合于在DSP 系統(tǒng)中實(shí)現(xiàn),更適合于在PC 機(jī)上完成。但是很多不同的詞語的矢量序列在特征空間中存在混疊現(xiàn)象,甚至有些不同詞語的混疊程度會(huì)超過同一詞語的不同次發(fā)音,從而降低識(shí)別率。在安靜環(huán)境下有聲段和無聲段時(shí)能量存在很大差異,由此判斷語音的起點(diǎn)。(2) 噪聲影響當(dāng)實(shí)際環(huán)境中有噪聲存在時(shí),容易造成訓(xùn)練與測(cè)試環(huán)境不匹配導(dǎo)致語音識(shí)別系統(tǒng)性能急劇下降。特征參數(shù)提取是語音識(shí)別的關(guān)鍵問題,特征參數(shù)選擇的好壞直接影響語音識(shí)別的精度。加窗分幀是為提取特征參數(shù)做準(zhǔn)備,分幀采用交疊分段的方法,這是為了使幀與幀之間平滑過渡,保持信號(hào)的連續(xù)性和保證特征參數(shù)的相關(guān)性。SPCE061A單片機(jī)對(duì)語音輸入信號(hào)進(jìn)行A/D轉(zhuǎn)換具有其專門的通道,并對(duì)較弱的語音還設(shè)計(jì)了帶自動(dòng)增益控制的放大器。在識(shí)別階段,語音信號(hào)經(jīng)過相同的通道得到語音特征參數(shù),生成測(cè)試模板,與參考模板進(jìn)行匹配,將匹配分?jǐn)?shù)最高的參考模板作為識(shí)別結(jié)果。提取的特征參數(shù)必須滿足以下的要求:(1)提取的特征參數(shù)能有效地代表語音特征,具有很好的區(qū)分性;(2)各階參數(shù)之間有良好的獨(dú)立性;(3)特征參數(shù)要計(jì)算方便,最好有高效的算法,以保證語音識(shí)別的實(shí)時(shí)實(shí)現(xiàn)。預(yù)處理階段主要對(duì)語音信號(hào)中諸如呼吸氣流、外部噪音等非平穩(wěn)信號(hào)進(jìn)行剔除,包括預(yù)濾波、采樣和量化、加窗、端點(diǎn)檢測(cè)、預(yù)加重等過程。在系統(tǒng)識(shí)別階段中, 根據(jù)不同的識(shí)別算法, 分析出語音信號(hào)的特征參數(shù), 然后按照一定的判別準(zhǔn)則和測(cè)度與系統(tǒng)模型進(jìn)行比較, 通過判決得出識(shí)別結(jié)果。3 語音識(shí)別原理及算法語音識(shí)別一般分為兩個(gè)步驟: 首先是系統(tǒng)的訓(xùn)練階段, 其次是系統(tǒng)識(shí)別階段。 制作成本高。其缺點(diǎn)是: 硬件電路復(fù)雜。要求電路盡量設(shè)計(jì)得簡(jiǎn)單明了,使用的元器件盡可能的少,但是要求其功能明顯,穩(wěn)定性高,靈敏度高。第五章實(shí)物的制作,簡(jiǎn)要描述了一下實(shí)物的焊接和組裝過程及遇到的一些小問題;簡(jiǎn)要說明一下遇到的問題和解決方法;第六章結(jié)論與展望,對(duì)所做的工作進(jìn)行總結(jié),并展望今后語音識(shí)別技術(shù)的發(fā)展。聲控失物找尋器是一種能夠?qū)ふ宜栉锲返穆暱剡b控器找尋器,將找尋器跟物品固定在一起,根據(jù)事先錄在找尋器里面的固定聲音,當(dāng)外界有同一聲音發(fā)出時(shí),找尋器上的報(bào)警器就會(huì)發(fā)出相應(yīng)的報(bào)警聲音,同時(shí)亦可在找尋器上安裝上閃光燈,在接收到該語音信號(hào)時(shí)同時(shí)發(fā)出光亮,達(dá)到在光線不足時(shí)也能夠辨別其位置的目的,為人們的日常生活提供方便本文的內(nèi)容共分為六章。該系統(tǒng)對(duì)新聞?wù)Z音識(shí)別具有較高的精度,是目前具有代表性的漢語連續(xù)語音識(shí)別系統(tǒng)。98。比較有代表性的系統(tǒng)有:IBM公司推出的ViaVoice和DragonSystem公司的NaturallySpeaking,Nuance公司的NuanceVoicePlatform語音平臺(tái),Microsoft的Whisper,Sun的VoiceTone等。 20世紀(jì)90年代前期,許多著名的大公司如IBM、蘋果、AT&T和NTT都對(duì)語音識(shí)別系統(tǒng)的實(shí)用化研究投以巨資。在語言層面上,通過統(tǒng)計(jì)真實(shí)大規(guī)模語料的詞之間同現(xiàn)概率即N元統(tǒng)計(jì)模型來區(qū)分識(shí)別帶來的模糊音和同音詞。 統(tǒng)計(jì)方法將研究者的視線從微觀轉(zhuǎn)向宏觀,不再刻意追求語音特征的細(xì)化,而是更多地從整體平均(統(tǒng)計(jì))的角度來建立最佳的語音識(shí)別系統(tǒng)。HMM模型的廣泛應(yīng)用應(yīng)歸功于ATamp。 實(shí)驗(yàn)室語音識(shí)別研究的巨大突破產(chǎn)生于20世紀(jì)80年代末:人們終于在實(shí)驗(yàn)室突破了大詞匯量、連續(xù)語音和非特定人這三大障礙,第一次把這三個(gè)特性都集成在一個(gè)系統(tǒng)中,比較典型的是卡耐基梅隆大學(xué)(CarnegieMellonUniversity)的Sphinx系統(tǒng),它是第一個(gè)高性能的非特定人、大詞匯量連續(xù)語音識(shí)別系統(tǒng)。 隨著應(yīng)用領(lǐng)域的擴(kuò)大,小詞匯表、特定人、孤立詞等這些對(duì)語音識(shí)別的約束條件需要放寬,與此同時(shí)也帶來了許多新的問題:第一,詞匯表的擴(kuò)大使得模板的選取和建立發(fā)生困難;第二,連續(xù)語音中,各個(gè)音素、音節(jié)以及詞之間沒有明顯的邊界,各個(gè)發(fā)音單位存在受上下文強(qiáng)烈影響的協(xié)同發(fā)音(Coarticulation)現(xiàn)象;第三,非特定人識(shí)別時(shí),不同的人說相同的話相應(yīng)的聲學(xué)特征有很大的差異,即使相同的人在不同的時(shí)間、生理、心理狀態(tài)下,說同樣內(nèi)容的話也會(huì)有很大的差異;第四,識(shí)別的語音中有背景噪聲或其他干擾。這首先是因?yàn)橛?jì)算機(jī)技術(shù)的發(fā)展為語音識(shí)別的實(shí)現(xiàn)提供了硬件和軟件的可能,更重要的是語音信號(hào)線性預(yù)測(cè)編碼(LPC)技術(shù)和動(dòng)態(tài)時(shí)間規(guī)整(DTW)技術(shù)的提出,有效的解決了語音信號(hào)的特征提取和不等長(zhǎng)匹配問題。T貝爾實(shí)驗(yàn)室的Audry系統(tǒng),它是第一個(gè)可以識(shí)別十個(gè)英文數(shù)字的語音識(shí)別系統(tǒng)。 中科院自動(dòng)化所及其所屬模式科技(Pattek)公司2002年發(fā)布了他們共同推出的面向不同計(jì)算平臺(tái)和應(yīng)用的“天語”中文語音系列產(chǎn)品——PattekASR,結(jié)束了中文語音識(shí)別產(chǎn)品自1998年以來一直由國(guó)外公司壟斷的歷史。在有5%的拒識(shí)率情況下,%(不定長(zhǎng)數(shù)字串)%(定長(zhǎng)數(shù)字串),這是目前國(guó)際最好的識(shí)別結(jié)果之一,其性能已經(jīng)接近實(shí)用水平。中科院自動(dòng)化所、聲學(xué)所、清華大學(xué)、北京大學(xué)、哈爾濱工業(yè)大學(xué)、上海交通大學(xué)、中國(guó)科技大學(xué)、北京郵電大學(xué)、華中科技大學(xué)等科研機(jī)構(gòu)都有實(shí)驗(yàn)室進(jìn)行過語音識(shí)別方面的研究,其中具有代表性的研究單位為清華大學(xué)電子工程系與中科院自動(dòng)化研究所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室。從1987年開始執(zhí)行國(guó)家863計(jì)劃后,國(guó)家863智能計(jì)算機(jī)專家組為語音識(shí)別技術(shù)研究專門立項(xiàng),每?jī)赡隄L動(dòng)一次。我國(guó)語音識(shí)別研究工作起步于五十年代,但近年來發(fā)展很快。由于聲控報(bào)警器體積小,靈敏度高具有很強(qiáng)的隱蔽性和保密性,因此在防盜、警戒等安保裝置中得到了廣泛的應(yīng)用,此外報(bào)警器亦可以用于物品的找尋方面。,價(jià)格高昂,一般人們難以接受。語音識(shí)別技術(shù)的出現(xiàn),使人們和機(jī)器通過自然語言交流成為可能,不僅解決了人機(jī)“交流”大眾化中的障礙,了人機(jī)交互的效率,而且給人體無法接觸或不便接觸來實(shí)現(xiàn)操作控制的場(chǎng)合帶來了極大的方便。s lives with the sound Wants, more fortable, more convenient. The design of paper is based on the Sunplus 61 microcontroller as the main ponents and to bine SPLC501 LCD module also has voice recognition and display. This product belongs to the finder, mainly used in small household devices quick find. Finder system modular design method, the hardware include: the power area, download area, audio area, SPCE061A with neighboring keying District, reset district, port district, the display area。整個(gè)設(shè)計(jì)結(jié)構(gòu)簡(jiǎn)單,使用方便。對(duì)語音信號(hào)的識(shí)別采用DTW算法,配合音頻解碼達(dá)到識(shí)別特定語音的效果。尋找器系統(tǒng)采用模塊化設(shè)計(jì)法,其硬件主要包括:電源區(qū)、下載區(qū)、音頻區(qū)、SPCE061A與周邊、鍵控區(qū)、復(fù)位區(qū)、端口區(qū)、顯示區(qū);軟件部分有C語言編程,實(shí)現(xiàn)對(duì)各個(gè)模塊的控制。本文的設(shè)計(jì)是以凌陽61單片機(jī)為主要元器件并結(jié)合SPLC501液晶顯示模組使產(chǎn)品同時(shí)具有語音識(shí)別和顯示功能。與傳統(tǒng)方案相比,具有結(jié)構(gòu)簡(jiǎn)單、成本低、易實(shí)現(xiàn)的特點(diǎn),能縮短開發(fā)周期,并且可擴(kuò)充性強(qiáng)。它得到了迅猛發(fā)展, 支持語音識(shí)別的各種產(chǎn)品紛紛面世。聲控遙控器找尋器摘 要隨著計(jì)算機(jī)軟硬件技術(shù)、半導(dǎo)體技術(shù)、電子技術(shù)、通訊技術(shù)等的飛速發(fā)展人類已經(jīng)進(jìn)入后PC時(shí)代。然而人類科技的發(fā)展總是離不開以人為本這一永恒的主題,家庭日用品更是被人們?cè)O(shè)計(jì)的越來越人性化,越來越便于使用,例如:語音識(shí)別技術(shù)。在我們生活中常見的語音識(shí)別技術(shù)產(chǎn)品有語音命令控制空調(diào)、電視、燈光、自動(dòng)窗簾等的使用,讓人們的生活“隨音所欲”,更加舒適,更加便捷。本設(shè)計(jì)方案可應(yīng)用于家電產(chǎn)品及其他電子產(chǎn)品,還可利用此系統(tǒng)的語音處理的優(yōu)勢(shì)組成語音應(yīng)答系統(tǒng)、語音合成系統(tǒng)、互動(dòng)式玩具等,具有廣闊的市場(chǎng)前景。此產(chǎn)品屬于尋找器,主要應(yīng)用于家庭小器件的快速尋找。設(shè)計(jì)時(shí)首先對(duì)61單片機(jī)進(jìn)行語音訓(xùn)練,再利用61單片機(jī)的語音接收模塊接收語音信號(hào),接收后送入語音處理模塊進(jìn)行識(shí)別處理,與模板匹配后發(fā)出相應(yīng)的語音報(bào)警信號(hào),達(dá)到找尋的目的。經(jīng)過多次訓(xùn)練與調(diào)試,對(duì)于特定人語音的識(shí)別這一預(yù)期的效果已經(jīng)達(dá)到。關(guān)鍵字: SPCE061A單片機(jī) 語音識(shí)別 找尋器Voiceactivated remote control finderAbstractAlong with the rapid development of the puter software , hardware technology, semiconductor technology, electronic technology and the munication technology ,the PC era after the people has already entered into. However, the development of human technology, always inseparable from the peopleoriented the eternal theme, household items designed to be more humane, more and more easy to use, for example: voice recognition technology. It has been the rapid development of a variety of products have emerged to support voice recognition. In our lives in mon speech recognition voice mands to control the use of air conditioning, TV, lights, automatic curtain, so that people39。 software part of the C programming language, to achieve on eachthe control of the module. The design of the first 61 singlechip voice training, reuse the voice of 61 singlechip receiver module to receive the voice signal into the voice processing module received recognition processing, voice alarm signal issued by the appropriate template matching to achieve the purpose of looking for. In addition, the identification of the voice signal using the DTW algorithm, with the audio decoder to identify the effect of a particular voice. After several rounds of training and missioning, the desired effect for a specific voice recognition has been achieved. The entire design structure is simple, easy to use.keyword: SPCE061A speech recognition alarm 1 緒論近年來,語音識(shí)別技術(shù)取得了飛速發(fā)展,并逐漸應(yīng)用于通信、軍事、人工智能、工業(yè)自動(dòng)化等多個(gè)領(lǐng)域。隨著改革開放的深入發(fā)展,生活步伐明顯提高,在高效率的生活節(jié)奏下,找尋一些常用卻經(jīng)常會(huì)遺忘的用品成了人人都會(huì)遇到的小難題,因此設(shè)計(jì)生產(chǎn)出一種體積嬌小的掛件式聲控報(bào)警器顯得非常必要。如果再設(shè)計(jì)和生產(chǎn)一種價(jià)廉、性能靈敏可靠的報(bào)警器,必將在防盜和保證財(cái)產(chǎn)安全方面發(fā)揮更加有效的作用。如果設(shè)計(jì)出一種體積小、靈敏度高、且具有語音識(shí)別功能的報(bào)警器當(dāng)做提醒器用于日常生活,將會(huì)給我們的日常生活帶來很大的幫助,其價(jià)格低廉、技術(shù)性能穩(wěn)定等特點(diǎn)也必將受到廣大用戶和專業(yè)人士的歡迎。研究水平也從實(shí)驗(yàn)室逐步走向?qū)嵱?。我?guó)語音識(shí)別技術(shù)的研究水平已經(jīng)基本上與國(guó)外同步,在漢語語音識(shí)別技術(shù)上還有自己的特點(diǎn)與優(yōu)勢(shì),并達(dá)到國(guó)際先進(jìn)水平。 清華大學(xué)電子工程系語音技術(shù)與專用芯片設(shè)計(jì)課題組,研發(fā)的非特定人漢語數(shù)碼串連續(xù)語音識(shí)別系統(tǒng)的識(shí)別精度,%(不定長(zhǎng)數(shù)字串)%(定長(zhǎng)數(shù)字串)。%,%;并且可以識(shí)別普通話與四川話兩種語言,達(dá)到實(shí)用要求。國(guó)外對(duì)語音識(shí)別的研究工作可以追溯到20世紀(jì)50年代ATamp。但真正取得實(shí)質(zhì)性進(jìn)展,并將其作為一個(gè)重要的課題開展研究則是在60年代末70年代初。這一時(shí)期的語音識(shí)別主要基于模板匹配原理,研究的領(lǐng)域局限在特定人,小詞匯表的孤立詞識(shí)