freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計(jì)語音文本顯示系統(tǒng)-文庫吧

2025-10-30 17:54 本頁面


【正文】 域。語音識別系統(tǒng)的實(shí)用化研究是語音識別研究的一個主要方向。 語言是人類特有的功能 ,是人們思維最重要的寄托體,是人類交流最主要的途徑。語音是語言的聲學(xué)表現(xiàn),是人類交流信息最 自然 、最有效、最方便的手段。語言和語音與人類社會 科學(xué) 文化發(fā)展緊密相連。 語音識別技術(shù)是讓機(jī)器接收,識別和理解語音信號 ,并將其轉(zhuǎn)換成相應(yīng)的數(shù)字信號的技術(shù)。它是一門交叉學(xué)科,涉及到語音語言學(xué)、數(shù)理統(tǒng)計(jì)、 計(jì)算 機(jī)、信號處理等一系列學(xué)科。 發(fā)展歷史 語音 識別技術(shù)的研究開始二十世紀(jì) 50 年代。 1952 年, ATamp。Tbell 實(shí)驗(yàn)室的Davis 等人成功研制出了世界上第一個能識別十個英文數(shù)字發(fā)音的實(shí)驗(yàn)系統(tǒng):Audry 系統(tǒng)。 60年代計(jì)算機(jī)的應(yīng)用推動了語音識別技術(shù)的發(fā)展,提出兩大重要研 究成果: 動態(tài)規(guī) 劃 (Dynamic Planning, DP)和線性 預(yù)測分析 (Linear Predict, LP),其中后者較好的解決了語音信號產(chǎn)生模型的問題,對語音識別技術(shù)的發(fā)展產(chǎn)生了深遠(yuǎn)影響。 70 年代,語音識別領(lǐng)域取得突破性進(jìn)展。線性預(yù)測編碼技術(shù) (Linear Predict Coding, LPC)被 Itakura 成功應(yīng)用于語音識別; Sakoe 和 Chiba 將動態(tài)規(guī)劃的思想應(yīng)用到語音識別并提出動態(tài)時間規(guī)整算法,有效的解決了語音信號的特征提取和不等長語音匹配問題;同時提出了矢量量化( VQ) 和隱馬爾可夫模型( HMM)理論。 80 年代,連續(xù)語音識別成為語音識別的研究重點(diǎn)之一。 Meyers 和 Rabiner 研究出多級動態(tài)規(guī)劃語音識別算法 (Level Building, LB)這一連續(xù)語音識別算法。 80 年代另一個重要的發(fā)展是概率統(tǒng)計(jì)方法成為語音識別研究方法的主流,其顯著特征是 HMM 模型在語音識別中的成功應(yīng)用。 1988 年,美國卡內(nèi)基-梅隆大學(xué) (CMU)用 VQ/HMM 方法蘭州工業(yè)學(xué)院畢業(yè)設(shè)計(jì)說明書(論文) 2 實(shí)現(xiàn)了 997 詞的非特定人連續(xù)語音識別系統(tǒng) SPHINX。在這一時期,人工神經(jīng)網(wǎng)絡(luò)在語音識別中也得到成功應(yīng)用。進(jìn)入 90年代后,隨著多媒體時代的來臨,迫切要求語音識別系統(tǒng)從實(shí)驗(yàn)走向?qū)嵱茫S多發(fā)達(dá)國家如美國、日本、韓國以及 IBM、 Apple、 ATamp。T、 NTT等著名公司都為語音識別系統(tǒng)實(shí)用化的開發(fā)研究投以巨資。最具代表性的是 IBM 的 ViaVoice 和 Dragon 公司的 Dragon Dectate系統(tǒng)。這些系統(tǒng)具有說話人自適應(yīng)能力,新用戶不需要對全部詞匯進(jìn)行訓(xùn)練便可在使用中不斷提高識別率。 我國在七十年代末就開始了語音技術(shù)的研究,但在很長一段時間內(nèi),都處于緩慢發(fā)展的階段。由于起步晚、基礎(chǔ)薄弱,計(jì)算機(jī)水平不發(fā)達(dá),導(dǎo)致在整個八十年代,我國在語音識別研究方面并沒有形成自己的特色,更沒有取得顯著的成果和開發(fā)出大型性能優(yōu)良的實(shí)驗(yàn)系統(tǒng)。但進(jìn)入九十年代后,我國語音識 別研究的步伐就逐漸緊追國際先進(jìn)水平了,在“八五”、“九五”國家科技攻關(guān)計(jì)劃、國家自然科學(xué)基金、國家 863 計(jì)劃的支持下,我國在中文語音技術(shù)的基礎(chǔ)研究方面也取得了一系列成果。但是,這些成 果并沒有得到很好的應(yīng)用,沒有轉(zhuǎn)化成產(chǎn)業(yè);相反, 中文語音技術(shù)在技術(shù)、人才、市場等方面正面臨著來自國際競爭環(huán)境中越來越嚴(yán)峻的挑戰(zhàn)和壓力。 具體應(yīng)用 隨著計(jì)算機(jī)技術(shù)、模式識別等技術(shù)的發(fā)展,適應(yīng)不同場合的語音識別系統(tǒng)相繼被開發(fā)出來,語音識別及處理技術(shù)已經(jīng)越來越突現(xiàn)出其強(qiáng)大的技術(shù)優(yōu)勢。近三十年來,語音識別在計(jì)算機(jī)、信息處理、通 信與 電子 系統(tǒng)、自動控制等領(lǐng)域的應(yīng)用越來越廣泛。 目前,語音識別技術(shù)己經(jīng)在生活中的諸多方面有了廣泛的應(yīng)用,而這方面的例子已經(jīng)屢見不鮮,其主要的應(yīng)用場合如下: ( 1) 聲控應(yīng)用 在很多場合與特定環(huán)境中,使用聲控系統(tǒng)可以大大提高生活質(zhì)量和便利程度。比如司機(jī)通過語音進(jìn)行電話撥號,可以減少交通事故的發(fā)生率,而很多行動不便的人通過聲控系統(tǒng)更是可以將生活質(zhì)量提高 。 蘭州工業(yè)學(xué)院畢業(yè)設(shè)計(jì)說明書(論文) 3 ( 2) 數(shù)據(jù)庫檢索 在 不少行業(yè)部門當(dāng)中都需要對龐大的數(shù)據(jù)進(jìn)行檢索和查詢,這是一項(xiàng)非常復(fù)雜的 I 作。語音識別的引入可以大大的減少勞動量,既方便又節(jié)約人力成本 。 ( 3) 語音聽寫機(jī) 用口述來代替人工輸入文檔,提高了輸入速度,而且更加方便,可以為辦公自動化帶來革命性的變化。比如 IBM 出品的 Via Voicc 系列產(chǎn)品就是這個方面典型的應(yīng)用。 ( 4) 自動口譯 將語音識別應(yīng)用于自動口語翻譯是未來的 一 大趨勢,不僅可以節(jié)省大量的人力。同時也讓翻譯工作變得更加輕松簡單。一些發(fā)達(dá)國家在自動口譯方面的研究己經(jīng)取得了一定的 進(jìn)展。目前,語音識別技術(shù)仍在高速發(fā)展之中。隨著時代的進(jìn)步,越來越多的領(lǐng)域開始引入這項(xiàng)技術(shù),人類的日常生活會級此而帶來更大改變。 本設(shè)計(jì)介 紹了一種以 ARM 為核心的嵌入式語音識別模塊的設(shè)計(jì)與實(shí)現(xiàn)。本模塊以對話管理單元為中心,通過以 LD 3320 芯片為核心的硬件單元實(shí)現(xiàn)語音識別功能,經(jīng)過大量的實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證,本文設(shè)計(jì)的語音識別模塊具有高實(shí)時性、高識別率、高穩(wěn)定性的優(yōu)點(diǎn)。 蘭州工業(yè)學(xué)院畢業(yè)設(shè)計(jì)說明書(論文) 4 1 系統(tǒng)整體方案 總體方案 基于現(xiàn)有技術(shù)開發(fā)嵌入式語音交互系統(tǒng),目前主要有兩種方式:一種是直接在嵌入式處理器中調(diào)用 語音開發(fā)包;另一種是嵌入式處理器外圍擴(kuò)展語音芯片。第一種方法程序量大,計(jì)算復(fù)雜,需要占用大量的處理器資源,開發(fā)周期長;第二種方法相對簡單,只需要關(guān)注語音芯片的接口部分與微處理器相連,結(jié)構(gòu)簡單,搭建方便,微處理器的計(jì)算負(fù)擔(dān)大大降低,增強(qiáng)了可靠性,縮短了開發(fā)周期。 本 設(shè)計(jì) 的語音識別方案是以嵌入式微處理器 ARM S3C2410 芯片為核心,配合 A/D, D/A 電路,控制電路,接口電路和存儲電路來實(shí)現(xiàn)語音識別的訓(xùn)練和識別過程。 外圍加非特定人語音識別芯片及相關(guān)電路構(gòu)成。語音識別芯 片 選用 ICRoute 公司的 LD 3320 芯片 , 由于 LD 3320 可以動態(tài)編輯的識別關(guān)鍵詞語列表,因此其可以應(yīng)用的范圍大大超過了那些不可以改變識別列表的芯片。又由于 LD 3320 是一顆真正的單芯片解決方案,不需要輔助的外圍 Flash/RAM/AD,從而降低了系統(tǒng)的成本。 在用戶的語音進(jìn)入語音識別部分后, LD 3320 將把處理過的數(shù) 據(jù)并行傳輸?shù)街骺刂破?,主控制器處理后,發(fā)送命令數(shù)據(jù)到可擴(kuò)展外圍串行設(shè)備實(shí)現(xiàn)控制操作 .所 接收的數(shù)據(jù)最后通過帶漢字庫的12864 液晶屏顯示出相應(yīng)的漢字。 語音識別 原理 在計(jì)算機(jī)系統(tǒng)中,語音信號本身的不確定性、 動態(tài)性和連續(xù)性是語音識別的難點(diǎn) ,主流的語音識別技術(shù)是基于統(tǒng)計(jì)模式識別的基本理論, 語音識別過程圖語音識別通常需要兩個階段完成。第一階段是訓(xùn)練,主要是提取語音特征,用戶往往需要進(jìn)行幾次語音訓(xùn)練,經(jīng)過預(yù)處理和特征提取后獲得相應(yīng)特征參數(shù)。第二階段是識別,識別過程就是將輸入的語音特征參數(shù)和模型庫中的參數(shù)進(jìn)行相似性比較,最后輸出匹配度最高的特征參數(shù)完成識別過程。語音識別過程 原 理如圖 11 所示 : 蘭州工業(yè)學(xué)院畢業(yè)設(shè)計(jì)說明書(論文) 5 圖 11 語音識別過程 語音識別過程圖語音識別通常需要兩個 階段完成。第一階段是訓(xùn)練,主要是提取語音特征,用戶往往需要進(jìn)行幾次語音訓(xùn)練,經(jīng)過預(yù)處理和特征提取后獲得相應(yīng)特征參數(shù)。第二階段是識別,識別過程就是將輸入的語音特征參數(shù)和模型庫中的參數(shù)進(jìn)行相似性比較,最后輸出匹配度最高的特征參數(shù)完成識別過程。 目前 , 語音識別技術(shù)按照識別對象的類型可以分 為特定人和非特定人語音識別。特定人是指識別對象 為專門的人,非特定人是 指識別對象 是針對大多數(shù)用 戶,一般需要采集多個人的語音進(jìn)行錄音和訓(xùn)練,經(jīng)過 學(xué)習(xí),從而達(dá)到較高的識別率 。 語音識別技術(shù)在國內(nèi)外的發(fā)展十分迅速。在嵌入式應(yīng)用領(lǐng)域,具有代 表性的有凌陽的 SPCE061A、 ICRoute 的 LD 3320。 本文的語音識別方案是以嵌入式微處理器為核心,外圍加非特定人語音識別芯片 LD 3320 及相關(guān)電路構(gòu)成 。 語音采集設(shè)備如話筒、電話等將語音轉(zhuǎn)換成模擬信號。 數(shù)字化一般包括預(yù)濾波、采樣和 A/D 變換。該過程將模擬信號轉(zhuǎn)變成計(jì)算機(jī)能處理的數(shù)字信號。 預(yù)處理一般包括預(yù)加重、加窗分幀。經(jīng)預(yù)處理后的信號被轉(zhuǎn)換成了幀序列的加窗的短時信號。 參數(shù)分析是對短時信號進(jìn)行分析,提取語音特征參數(shù)的過程,如時域、頻域分析,矢 量量化等。 預(yù)處理 特征 提取 模式 匹配 后處理 語音模型 庫 輸入 語音 識別 訓(xùn)練 識別 結(jié)果 蘭州工業(yè)學(xué)院畢業(yè)設(shè)計(jì)說明書(論文) 6 語音識別是目標(biāo)語音根據(jù)特征參數(shù)與模型庫中的參數(shù)進(jìn)行匹配,產(chǎn)生識別結(jié)果的過程。一般有模板匹配法、隨機(jī)模型法和神經(jīng)網(wǎng)絡(luò)等。 應(yīng)用程序根據(jù)識別結(jié)果產(chǎn)程預(yù)定動作 。 該過程是語音模型的學(xué)習(xí)過程。 蘭州工業(yè)學(xué)院畢業(yè)設(shè)計(jì)說明書(論文) 7 2 系統(tǒng)硬件設(shè)計(jì) 硬件模塊 主體 關(guān)系 本設(shè)計(jì)由 LD 3320 芯片和三星公司的 S3C2410 芯片為核心 ,配合 A/D、D/A 電路 ,控制電路 ,接口電路和存儲電路來實(shí)現(xiàn)語音識別的訓(xùn)練和識別過程。S3C2410 主要負(fù)責(zé)系統(tǒng)的控制和識別工作,而語音信號的特 征提取和訓(xùn)練算法全部由 LD 3320 來完成。 S3C2410 處理器采用的是 ARM920T 內(nèi)核 ,5 級流水線指令結(jié)構(gòu) ,片內(nèi)鎖相環(huán) ,內(nèi)部時鐘可達(dá)到 200 MHz,因此可以用來進(jìn)行復(fù)雜的控制算法以提高控制精度。 S3C2410 有 117 個 I/O 口和 24 個外部中斷源 ,內(nèi)部具有豐富的接口控制器,可以簡化外圍電路 ,同時其內(nèi)部時鐘可達(dá)到 200MHz。 LD 3320 是一顆基于非特定人語音識別技術(shù)的語音識別 /聲控芯片 ,該芯片集成了語音識別處理器和一些外部電路,包括 ADC、 DAC、麥克風(fēng)接口、聲音輸出接口 等。該芯片不需要外接任何的輔助芯片如 Flash、 RAM 等,直接集成在現(xiàn)有的產(chǎn)品中,即可以實(shí)現(xiàn)語音識別 /聲控 /人機(jī)對話功能 。 具有較強(qiáng)的中斷處理能力 , 適合實(shí)時語音處理。 芯片采用 48 腳 QFN塑料封裝,工作供電為 。其核心是語音識別運(yùn)算器,配合輸入、輸出、 AD/DA 轉(zhuǎn)換等模塊,完成語音識別的功能。 LD 3320 還支持并行和串行接口,串行方式可以簡化與其他模塊的連接 并具有 ,為語音處理帶來了極大的便利。 電路主要由主控制器電路和語音識別電路組成。 ARM S3C2410 處理器 控制 LD 3320 語音 識別電路,輸出結(jié) 果由 ARM S3C2410 處理器 處理,然后通過總線來控制不同的設(shè)備 。 12864 漢字圖形點(diǎn)陣液晶顯示模塊,是 128 64 點(diǎn)陣的漢字圖形型液晶顯示模塊,可顯示漢字及圖形,內(nèi)置 8192 個中文漢字( 16X16 點(diǎn)陣)、 128 個字符( 8X16 點(diǎn)陣)及 64X256 點(diǎn)陣顯示 RAM( GDRAM)??膳c CPU 直接接口,提供兩種界面來連接微處理機(jī) , 8 位并行及串行兩種連接方 式。 各硬件模塊關(guān)系圖如圖 21 所示: 蘭州工業(yè)學(xué)院畢業(yè)設(shè)計(jì)說明書(論文) 8 圖 21 各硬件模塊關(guān) 系圖 電源模塊 本系統(tǒng)采用 供電,主要控制及識別部分采用 ,語音播放及繼電器部分采用 7812 為其提供穩(wěn)定的電流電壓。電源模塊電路圖如圖 22 所示 : 12JBC O N 2C 1 71 0 u F / 1 6 Vc 1 810uFV C C V i n1GND2V o u t3U4 L M 1 1 1 7 M P X 3 . 3 V o u t 4 2V C C 3 3 V 1 6 V 圖 22 電源模塊電路圖 參數(shù)特性 麥克風(fēng) 揚(yáng)聲器 語音識別芯片 LD 3320 ARM9 S3C2410 12864 液晶 顯示器 模擬 信號 模擬 信號 數(shù)字 信號 控制 指令 控制 指令 JTAG 程序 調(diào)試下載 EPROMM FLASH JTAG 程序 調(diào)試下載 蘭州工業(yè)學(xué)院畢業(yè)設(shè)計(jì)說明書(論文) 9 ( 1) 輸入電壓 (V): ~ 12; ( 2) 輸出電流 (A): 1; ( 3) 輸出電壓 (V): ; ( 4) 壓差 (V): 1。 封裝 ( 1) 類型 : SOT223; ( 2) 引腳: 3; ( 3) 體寬: mm; ( 4) 長度: mm; ( 5) 引腳間距: mm。 寄存器模塊 本系統(tǒng)采用 華邦 SPI flash 芯片 W25
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1