【正文】
............................ 17 第 3 章 軟件電路設(shè)計(jì) ................................................................................................ 20 167。 子程序模塊 ..................................................................................................... 21 167。 隨著數(shù)字化信息處理、合成技術(shù)和大規(guī)模集成電路的發(fā)展,各種語(yǔ)音合成芯片相應(yīng)產(chǎn)生,但對(duì)它的控制大都采用 PC 機(jī)或微控制器的方法。此外, ISD4004 具有記錄時(shí)間長(zhǎng) (可達(dá) 16 分鐘,本文采用的為 8 分鐘的 ISD4004 語(yǔ)音芯片 )的優(yōu)點(diǎn)。本設(shè)計(jì)應(yīng)用性比較強(qiáng),可以應(yīng)用在語(yǔ)音監(jiān)控、電話遠(yuǎn)程播放、安防報(bào)警等。 第三章是軟件的設(shè)計(jì),分別介紹了主程序、 錄音 子程序、 放音 子程序、停止 子程序以及顯示子程序的設(shè)計(jì),是實(shí)現(xiàn)功能的靈魂 。 2. 經(jīng)濟(jì)性要求。 3. 可靠性要求主要考慮的方面是語(yǔ)音的清晰度,在音頻處理部份用了LM386 它 是一種音頻集成功放,具有自身功耗低、電壓增益可調(diào)整、電源電壓范圍大、外接元件少和總諧波失真小等優(yōu)點(diǎn) 。 系統(tǒng)的功能的要求 利用單片機(jī)和數(shù)字語(yǔ)音電路進(jìn)行分段錄放控制。 總體方案的選定 本設(shè)計(jì)基本出發(fā)點(diǎn)就是利用現(xiàn)有工藝條件,采用微型計(jì)算機(jī)處理技術(shù),提高芯片工作效率,拓展其功能,滿足多方面的需求。錄放鍵盤(pán)留給用使用,方便的控制, LED 顯示當(dāng)前系統(tǒng)的工作狀態(tài)。 單片機(jī)的選型 單片機(jī)以 AT89C52 單片機(jī)采用 INTEL 內(nèi)核 [1],結(jié) 合 ATMEL 公司閃存技術(shù)制造,性能穩(wěn)定可靠,在程序不太復(fù)雜的情況下,無(wú)需擴(kuò)展外部存儲(chǔ)器,因此,對(duì)于追求可靠性、追求體積輕巧靈便的裝置而言顯得尤為重要。圖 21 為 AT89C52 單片機(jī)的基本組成功能方塊圖 [4]。時(shí)鐘電路應(yīng)用十分廣泛,如電腦的時(shí)鐘電路、電子表的時(shí)鐘電路以及 MP3MP4 的時(shí)鐘電路。 圖 22 AT89C52的時(shí)鐘電路 167。由于微機(jī)電路是時(shí)序數(shù)字電路,它需要穩(wěn)定的時(shí)鐘信號(hào),因此在電源上電時(shí),只有當(dāng) VCC 超過(guò) 低于 以及晶體振蕩器穩(wěn)定工作時(shí),復(fù)位信號(hào)才 被撤除,微機(jī)電路開(kāi)始正常工作。 圖 24 電源電路原理圖 167。 ISD4004 芯片介紹 ISD 公司多電位直接模擬量存儲(chǔ)的專利技術(shù)成功地將模擬語(yǔ)音數(shù)據(jù)直接寫(xiě)入芯片內(nèi)存儲(chǔ)單元中,不需要經(jīng)過(guò) A/D 或 D/A 轉(zhuǎn)換即可真實(shí)地、自然地再現(xiàn)語(yǔ)音信號(hào)。采樣頻率可為 、 、 、 ,頻率越低,錄放的時(shí)間越長(zhǎng),而音質(zhì)則有所下降。 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 12 圖 26 ISD4004 原理圖 167。輸入放大器可用單端或差分驅(qū)動(dòng)。信號(hào)通過(guò)耦合電容輸入 ,最大幅度為峰峰值 16mV[10]。 8. 串行輸出 (MISO): ISD 的串行輸出端。 10. 中斷 (/INT):本端為漏極開(kāi)路輸出。 OVF 標(biāo)志 —— 指示 ISD 的錄、放操作已到達(dá)存儲(chǔ)器的未尾。該信號(hào) 175ms 保持高電平 ,低電平為 25ms。芯片內(nèi)部的采樣時(shí)鐘在出廠前已調(diào)校 ,誤差在 +1%內(nèi)。由于內(nèi)部的防混淆及平滑濾波器已設(shè)定 ,故上述推薦的時(shí)鐘頻率不應(yīng)改變。通常本端對(duì)地接 1mF 的電容 ,構(gòu)成內(nèi)部信號(hào)電平峰值檢測(cè)電路的一部分。本端接 VCCA 則禁止自動(dòng)靜噪。協(xié)議的具體內(nèi)容為 [12]: 1. 所有串行數(shù)據(jù)傳輸開(kāi)始于 SS 下降沿。 5. 指令格式是 (8 位控制碼 )加 (16 位地址碼 )。當(dāng)然 ,也允許在一個(gè) SPI 周期里 ,同時(shí)執(zhí)行讀狀態(tài)和開(kāi)始新的操作 (即新移入的數(shù)據(jù)與器件當(dāng)前的操作可以不兼容 )。 語(yǔ)音輸入電路 ISD4004 的輸入端接的是一個(gè)模擬輸入信號(hào),通過(guò)一個(gè)駐極話筒的連接,從而達(dá)到錄制聲音的目的 [13],電路圖如圖 28。它是一片極薄的塑料膜,當(dāng)遇到聲波振動(dòng)時(shí),引起電容兩端的電場(chǎng)發(fā)生變化,從而產(chǎn)生了隨聲波變化而變化的交變電壓。 語(yǔ)音輸出電路 LW386 是一種集成音頻功放,具有自身功耗低、電壓增益可調(diào)整、電源電壓范圍大、外接元件少和總諧波失真小等優(yōu)點(diǎn)。 變壓電路 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 17 由于 ISD4004 的工作電壓為 3 伏,而單片機(jī)所需要供電電壓為 5 伏,因此需要采用變壓電路得到 3 伏的電壓供 ISD4004 使用 , 如圖 210。 錄音電路及放音電路 ( 1) 錄音工作原理: ISD 器件采用錄音時(shí)間為 8 分鐘的 ISD4004— 8 器件,以單片機(jī) AT89c52為微控制器,外接語(yǔ)音段錄放控制鍵盤(pán)和 LED 顯示器,外部存儲(chǔ)器 24C02用于保存各語(yǔ)音段首地址及總語(yǔ)音段數(shù),為了改善語(yǔ)音量,要提高輸入端信噪比,因此在 ISD 語(yǔ)音輸入端采用放大電路單端輸入 [15]。 接 ISD4004 的片選引腳/ss,以便與 AT89C52 進(jìn)行 SPI 通信時(shí)控制選通 ISD4004 芯片。對(duì)于 ISD4004 芯片所需要的連接還有音頻信號(hào)輸出引腳AUDOUT,該引腳通過(guò)一個(gè)濾波電容與揚(yáng)聲器連接。從上面的分析可知,只要給語(yǔ)音芯片的 MOSI 弓 [腳輸入 8 位控制命令就可使 ISD芯片從當(dāng)前地址執(zhí)行相應(yīng)的錄放 操作;同樣使用 8 位的讀指令,就能在串行輸出 MlSO 引腳獲得 VOF 和 EOM 信息。其軟件部分主要涉及啟動(dòng)錄音和停止錄音、啟動(dòng)放音和停止放音、檢測(cè) EOM 和 OV F 信號(hào)的外部中斷 0 等子程序模塊。錄音過(guò)程中若產(chǎn)生 OVF 中斷,則停止錄音,另外此信號(hào)還可用于級(jí)聯(lián)。因此,用戶發(fā)完上電指令后,必須等待。 2. 等待 TPUD(上電延時(shí) )。 二、從 00 處錄音,則按以下時(shí)序。 4. 等待 2 倍 TPUD。錄音停止。自動(dòng)讀出第一段的放音內(nèi)容.如果不是首次按下,程序則首先判斷當(dāng)前位置,并以該位置為依據(jù)獲得存放該站放音內(nèi)容的首地址。 167。 //發(fā) POWER UP 命令 。 //發(fā) POWER UP 命令 cmdSend(addrs,0xa0)。 } 圖 31 程序流程原理圖 上電 初始化 按鍵查詢 減一鍵按下 停止鍵按下 放音鍵按下 加一鍵按下 執(zhí)行放音子程序 執(zhí)行加一鍵程序 執(zhí)行減一鍵程序 執(zhí)行停止子程序 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 23 圖 32 錄音子程序流程原理圖 167。 //上電延時(shí) cmdSend(addrs,0xe0)。 } void delay(uchar k) { unsigned char a,b。b。 ISD 器件的音頻信號(hào)輸出功率很小,需要加音頻功放如 LM386 或 TD,娩 003 驅(qū)動(dòng)揚(yáng)聲器:同時(shí) ISD 輸出的信號(hào)直流分量若直接加在 LM386 上,會(huì)使它處于飽和狀態(tài),無(wú)聲音輸出,需要通過(guò)耦合電容割斷直流。之后再由D/A 轉(zhuǎn)換為模擬信號(hào),達(dá)到放音的目的。通過(guò)對(duì)基于單片機(jī)控制系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)了語(yǔ)音的錄入和播放。 通過(guò)此次設(shè)計(jì)掌握了一些常用的基本理論知識(shí),更深入的掌握單片機(jī)的開(kāi)發(fā)應(yīng)用和 PC 編程控制。同時(shí),感謝所有任課老師和所有同學(xué)在這四年來(lái)給自己的指導(dǎo)和幫助,是他們教會(huì)了我專業(yè)知識(shí),教會(huì)了我如何學(xué)習(xí),教會(huì)了我如何做人。j++) for(i = 0。 //設(shè)置 MOSI,SCK,SS 為 OUTPUT,其它為 INPUT SPCR = (1SPE)|(1MSTR)|(1SPR0)|BIT(SPR1)|BIT(DORD)。//Wait for transmission finish } //cmdSend void cmdSend(unsigned int Addr,unsigned char cmd) { PORTB = PORTBamp。 //傳地址低位 SpiTransmit(Addr8)。//為保證那個(gè) 500ns } //放音函數(shù) void play(unsigned int addrs) { cmdSend(0x0000,0x20)。 //發(fā) Play 命令 } 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)論文 33 //錄音函數(shù) void rec(unsigned int addrs) { cmdSend(0x0000,0x20)。 cmdSend(0x0000,0x20)。 //發(fā) REC 命令。a0。 } void main() { unsigned int j = 0。= ~BIT(DD_MOSI)。 PORTA = 0xff。 } stop()。 } 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)論文 35 英文翻譯 Improved speech recognition method for intelligent robot 1. Overview of speech recognition Speech recognition has received more and more attention recently due to the important theoretical meaning and practical value [5 ]. Up to now, most speech recognition is based on conventional linear system theory, such as Hidden Markov Model (HMM) and Dynamic Time Warping(DTW) . With the deep study of speech recognition, it is found that speech signal is a plex nonlinear process. If the study of speech recognition wants to break through, nonlinear system theory method must be introduced to it. Recently, with the developmentof nonlineasystem theories such as artificial neural works(ANN) , chaos and fractal, it is possible to apply these theories to speech recognition. Therefore, the study of this paper is based on ANN and chaos and fractal theories are introduced to process speech recognition. Speech recognition is divided into two ways that are speaker dependent and speaker independent. Speaker dependent refers to the pronunciation model trained by a single person, the identification rate of the training person?sorders is high, while others’orders is in low identification rate or can’t be recognized. Speaker independent refers to the pronunciation model trained by persons of different age, sex and region, it can identify a group of persons’orders. Generally, speaker independent system ismorewidely used, since the user is not required to conduct the training. So extraction of speaker independent features from the speech signal is the fundamental problem of speaker recognition system. Speech recognition can be viewed as a