freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音識別的特征參數(shù)的提取與研究的畢業(yè)論文(已修改)

2025-07-01 13:41 本頁面
 

【正文】 桂林航天工業(yè)學院畢業(yè)設(shè)計(論文)語音識別的特征參數(shù)的提取與研究的畢業(yè)論文目 錄評語                             Ⅰ答辯記錄                             Ⅱ畢業(yè)設(shè)計任務書 Ⅲ畢業(yè)設(shè)計開題報告 Ⅳ中英文摘要    V引言 11 緒論 2 2 3 42 語音信號預處理 5 6 7 8 語音端點檢測 9 語音信號短時平均能量 10 語音信號短時平均過零率 12 3 語音特征參數(shù)提取 13 14 15 線性預測倒譜分析 15 MEL倒譜系數(shù)MFCC 16 MEL頻率 16 17 實驗仿真結(jié)果與分析 184 結(jié)論 20謝辭 23參考文獻 24附錄 26第I頁桂林航天工業(yè)學院畢業(yè)設(shè)計(論文)引 言語音信號處理是語音學與數(shù)字信號處理技術(shù)相結(jié)合的交叉學科,它和認知科學、心理學、語言學、計算機科學、模式識別和人工智能等學科聯(lián)系緊密。語音信號處理技術(shù)的發(fā)展依賴于這些學科的發(fā)展,而語音信號處理技術(shù)的進步也會促成這些學科的進步。語音信號處理的目的是要得到某些語音特征參數(shù)以便高效地傳輸或存儲;或者是通過某種處理運算以達到某種用途的要求,如人工合成語音、辨識出講話者、識別出講話的內(nèi)容等。語音合成技術(shù)、語音編碼技術(shù)及語音識別技術(shù)作為語音信號處理的三個分支。語言作為人類最重要的交流工具,是人類獲得信息的重要來源之一,讓計算機能“聽懂”人類的語言,也是人與計算機之間進行溝通最方便的形式之一。用語音來實現(xiàn)人與計算機之間的交互,主要包括三項技術(shù),即語音識別、自然語言理解和語音合成。隨著計算機處理能力的迅速提高,語音識別技術(shù)得到了飛速發(fā)展。20世紀90年代,語音識別技術(shù)從實驗室走向應用,今天,語音識別技術(shù)受到了國內(nèi)外研究機構(gòu)的廣泛關(guān)注和高度重視,其應用也必將帶來良好的社會和經(jīng)濟效益。1 緒論人類的語言在人們的生活中起著極其重要的作用,人與人之間的交流方式有很多種,但是70%都是通過語音來有效的完成的。語音是人類相互之間進行交流時,使用最多、最自然、最基本的信息載體。與機器進行語音交流,讓機器明白你說什么,這是人們長期以來夢寐以求的事情。而語音識別技術(shù)就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳奈谋净蛎畹母呒夹g(shù)。 語音識別發(fā)展歷史及趨勢語音識別,就是讓計算機聽得懂人說的話,并能做出相應的處理,也是人機交互最重要的第一步。它是語音信號處理的一個重要研究方向,是模式識別的一個分支,它涉及到生理學、心理學、語言學、計算機科學、通信科學以及信號處理等諸多領(lǐng)域,甚至還涉及到人的體態(tài)語言。就語音識別技術(shù)而言,其基本任務是將輸入語音轉(zhuǎn)化為相應的文本或命令。語音識別的市場前景廣泛,在一些應用領(lǐng)域中正迅速成為一個關(guān)鍵的具有競爭力的技術(shù)。例如在聲控應用中,計算機識別輸入的語音內(nèi)容,并根內(nèi)容來執(zhí)行相應的動作,這包括聲控電話轉(zhuǎn)換、聲控語音撥號系統(tǒng)、聲控智能玩具、信息網(wǎng)絡查詢、家庭服務、賓館服務、醫(yī)療服務等等。語音識別也可用于將文字以口授的方式輸入到計算機中,即廣泛開展的聽寫機研究,如聲控打字機等。語音識別技術(shù)還可以用于自動口語翻譯,即通過將口語識別技術(shù)、機器翻譯技術(shù)、語音合成技術(shù)等相結(jié)合,可將一種語言輸入的語音翻譯成另一種語言的語音輸出,實現(xiàn)跨語言的交流。對說話人識別技術(shù),近年來已經(jīng)在安全加密、銀行信息電話查詢服務等方面得到了很好的應用。此外,在公安機關(guān)破案和法庭取證方面也發(fā)揮著重要的作用。語音識別技術(shù)的研究開始于上世紀40年代末,起初發(fā)展很慢。到了上世紀50年代初,當時ATamp。TBell實驗室實現(xiàn)了第一個可識別十個英文數(shù)字的語音識別系統(tǒng)——Audry系統(tǒng),也標志著語音識別技術(shù)的研究真正開始了。到了60年代,計算機應用更加的普遍,也推動了語音識別技術(shù)的發(fā)展,人們完成了幾項對今后20年語音識別發(fā)展產(chǎn)生重要影響的工作。到了70年代,語音識別領(lǐng)域取得了更大的突破在理論上,LP技術(shù)得到進一步發(fā)展,人們將在語音壓縮領(lǐng)域取得了巨大成功的線性預測編碼技術(shù)(LPC)引入了語音識別。動態(tài)時間歸整技術(shù)(DTW)基本成熟,并且在語音識別領(lǐng)域得到了全面的應用。80年代,語音識別研究更加的深入,語音識別領(lǐng)域出現(xiàn)了里程碑式的成果。進入90年代,多媒體時代的到來,人們對智能化的需求越來越迫切,這就要求語音識別系統(tǒng)走出實驗室走向市場。隨著科技的發(fā)展和人們對語音識別理論的逐漸深入化的研究,理論體系的日趨成熟,隨著數(shù)字信號處理技術(shù)的發(fā)展,在未來20年,語音識別技術(shù)將逐漸的進入工業(yè)、家電、通信、汽車電子、醫(yī)療以及各種電子設(shè)備中??梢钥隙ǖ卣f,語音識別技術(shù)必將成為未來信息產(chǎn)業(yè)中的一項關(guān)鍵的技術(shù)。但是也不可否認,它還有很長的一段路需要走,要真正的商業(yè)化,還需要在多方面取得突破性的進展,還需要借助于其它相關(guān)學科的發(fā)展。 語音識別系統(tǒng)原理的組成語音識別本質(zhì)上是一種模式識別的過程,它主要包括語音信號預處理、特征提取、特征建模、測度估計、識別判決等幾個功能模塊。一個語音識別主要由學習和識別兩個過程組成,學習階段就是要采用語言的分析方法分析出某種識別方法所要求的語音特征參數(shù),這些參數(shù)被存儲起來作為模板。識別過程就是模式匹配的過程,它也是整個系統(tǒng)的核心,其作用是根據(jù)語音和不同的層面按照相應的準則求取待測語音特征參數(shù)和語音信息與模式庫中相應模板之間的測度,形成系最佳的識別輸出。語音識別基本結(jié)構(gòu)預處理特征提取模式匹配后處理語音模式庫語音識別系統(tǒng)本質(zhì)上是一種多維模式識別系統(tǒng)。 預處理包括預加重、反混疊濾波、模/數(shù)轉(zhuǎn)換、自動增益控制等處理過程,用于去除聲門激勵、口鼻輻射、高于1/2采樣頻率的高頻和噪聲信號的影響,實現(xiàn)語音信號的數(shù)字化。在語音識別中,預處理還包括在聲學參數(shù)分析之前正確選擇識別基本的問題。經(jīng)過預處理后的語音信號,要對其進行特征提取,即特征參數(shù)分析。該過程就是從原始語音信號中抽取出能夠反映語音本質(zhì)的特征參數(shù),形成特征矢量序列。語音模型庫即聲學參數(shù)模板,它是用聚類分析等方法,從一個講話者或多個講話者的多次重復的語音參數(shù),經(jīng)過長時間的訓練得到的。將輸入語音的特征參數(shù)同訓練得到的語音模式庫進行比較分析,從而得到初步識別結(jié)果。根據(jù)模式識別方法的不同,用于語音識別系統(tǒng)時有統(tǒng)計模式識別法和句法模式識別法兩類。(1) 統(tǒng)計模式識別法:建立在最大似然決策貝葉斯判決基礎(chǔ)之上,大致的識別過程是:首先,提取語音的特征,并訓練識別用的參數(shù)模板;然后,利用可以衡量未知模式和參考模式的似然度來測量函數(shù);最后,選用一種最佳準則及專家知識作為識別決策,對識別候選者進行最后判決,得到最好的識別結(jié)果作為輸出。(2)句法模式識別法:類似于文章中的句法分析。它不僅應用于語音識別,還廣泛的應用于手寫文字及圖像的識別上。在大詞匯量連續(xù)語音識別系統(tǒng)中,為了提高識別正確率需要使用語言模式,利用語言識別單位之間連接時的相互制約關(guān)系,采取統(tǒng)計方法與語法相結(jié)合的方法建立語言模型,達到限制識別器譯碼時的自由度,提高系統(tǒng)的性能。目前后處理在嵌入式語音系統(tǒng)中還很難使用。 語音特征參數(shù)的提取在語音識別中的作用語音特征參數(shù)的提取是語音識別的一個重要步驟。所謂特征提取,即對不同的語音尋找其內(nèi)在特征,由此來差別出未知語音,所以每個語音識別系統(tǒng)都必須進行特征提取。特征的選擇對識別效果至關(guān)重要,選擇的標準應體現(xiàn)對異音字之間的距離盡可能大,而同音字之間的距離應盡可能小。同時還要考慮特征參數(shù)的計算量,應在保持高識別率的情況下,盡可能減少特征以減小存儲要求和利于實時實現(xiàn)。孤立詞語音識別系統(tǒng)的特征提取一般需要解決兩個問題,一個是從語音信號中提?。ɑ驕y量)有的合適的特征參數(shù);另一個是進行適當?shù)臄?shù)據(jù)壓縮。而對于非特定人語音識別來講,則希望特征參數(shù)盡可能多地反映主義信息,盡量減少說話人的個人信息。計算機語音識別是一個模式識別匹配的過程。在這個過程中,計算機首先要根據(jù)人的語音特點建立語音模型,對輸入的語音信號進行分析,并抽取所需的特征參數(shù),在此基礎(chǔ)上才能建立語音識別所需的模板。而計算機在識別過程中要根據(jù)語音識別的整體模型,將計算機中存放的語音模板與輸入的語音信號的特征進行比較,根據(jù)一定的搜索和匹配策略,找出一系列最優(yōu)的與輸入的語音匹配的模板,求出識別結(jié)果。顯然,這種最優(yōu)的結(jié)果與特征的選擇、語音模型和語言模型的好壞、模板是否準確等都有直接的關(guān)系。因此,語音的特征提取在語音識別處理中具有舉足輕重的作用。語音的特征提取實質(zhì)上是起降維的作用,用較少的維數(shù)來表示說話人的特征。常用的語音特征包括Pitch(基音)、Formant(共振峰)、LPCC(線性預測倒譜系數(shù))、MFCC(Mel頻率倒譜系數(shù))。近幾年,科學工作者在研究語音識別時,用的最多的特征提取方法就是基于線性預測倒譜系數(shù)方法。語音信號完成分幀處理和端點檢測后,下一步就是特征參數(shù)的提取。在語音識別中,我們不能將原始波形直接用于識別,必須通過一定的變換,提取語音特征參數(shù)來進行識別,而提取的特征必須滿足:1.特征參數(shù)應當反映語音的本質(zhì)特征,對于非特定人語音識別,特征參數(shù)則應盡量不含有說話人的信息。2.特征參數(shù)各分量之間的耦合應盡可能地小,以起到壓縮數(shù)據(jù)的作用。3.特征參數(shù)要計算方便,最好有高效的算法。語音特征參數(shù)可以是能量、基音頻率、共振峰值等語音參數(shù),目前在語音識別中較為常用的特征參數(shù)為線性預測倒譜系數(shù)(LPCC)與Mel倒譜系數(shù)(MFCC)。二者都是將語音從時域變換到倒譜域上,前者從人的發(fā)聲模型角度出發(fā),利用線性預測編碼(LPC)技術(shù)求倒譜系數(shù)。后
點擊復制文檔內(nèi)容
教學課件相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1