freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于虛擬儀器的語(yǔ)音識(shí)別算法研究(編輯修改稿)

2025-07-24 21:05 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 對(duì)話框;展開彈出對(duì)話框左欄中的“Editor/Debugger”項(xiàng),出現(xiàn)以下4個(gè)子項(xiàng):“Font amp。 Colors”子項(xiàng):在對(duì)應(yīng)該項(xiàng)的右側(cè)欄中,可以對(duì)字體大小、顏色、類型進(jìn)行設(shè)置。“Display”子項(xiàng):如果勾選“Enable data tips in edit mode”,那么當(dāng)光標(biāo)移動(dòng)到該編輯器文件中的某個(gè)變量名時(shí),就會(huì)出現(xiàn)一個(gè)現(xiàn)場(chǎng)菜單,但顯示出該變量?jī)?nèi)容的前提是,改變量已存在于MATLAB的工作空間?!癒eyboard amp。 indenting”子項(xiàng):對(duì)應(yīng)欄用來設(shè)置快捷鍵習(xí)慣和文件段落縮進(jìn)的習(xí)慣?!癆uto save”子項(xiàng):編輯器窗口中的文件發(fā)生改動(dòng)后,文件會(huì)自動(dòng)進(jìn)行備份。通過該子項(xiàng)中的“Save options”欄,可以設(shè)置自動(dòng)備份的時(shí)間間隔。說明:1.運(yùn)行M文件的方法有很多種,而最常用的方法是:(1)在指令窗中直接運(yùn)行M文件名(不帶擴(kuò)展名);(2)在當(dāng)前目錄窗中,用鼠標(biāo)右鍵單擊所要運(yùn)行的文件,再?gòu)囊龅默F(xiàn)場(chǎng)菜單中選擇[Run]菜單項(xiàng)。2.腳本文件第一行中的注釋文件名一般與實(shí)際存放在目錄上的文件名相同。但這樣做的目的僅僅是為了管理上的一致,也為了便于用戶記憶和查詢。事實(shí)上,*.m的存放和調(diào)用與注釋行中的名稱并無關(guān)聯(lián)。3.當(dāng)使用M文件編輯器調(diào)試并保存文件時(shí),或在MATLAB指令窗中運(yùn)行M文件時(shí)。4.在M文件編輯調(diào)試器中,可以用漢字注釋,也可獲得正確顯示。5.注意:在MATLAB中,若發(fā)生漢字輸入困難,可用鼠標(biāo)右鍵點(diǎn)擊,引出現(xiàn)場(chǎng)菜單;選中“屬性”菜單項(xiàng),引出“對(duì)話框”,或采取在微軟輸入法中選擇“逐鍵指示”,或在智能輸入法中選中“固定”。本課題研究的主要內(nèi)容和方法如下:根據(jù)識(shí)別的需求,分析語(yǔ)音識(shí)別技術(shù)的重要性,針對(duì)語(yǔ)音識(shí)別系統(tǒng)的實(shí)用性提出本文研究的目標(biāo)就是設(shè)計(jì)實(shí)現(xiàn)一個(gè)基于模板匹配識(shí)別算法的語(yǔ)音識(shí)別系統(tǒng)。對(duì)語(yǔ)音識(shí)別系統(tǒng)進(jìn)行設(shè)計(jì)研究,針對(duì)語(yǔ)音識(shí)別的功能需求,對(duì)比研究VQ和 DTW 算法的識(shí)別算法,結(jié)合 LABVIEW 和 MATLAB 各自優(yōu)點(diǎn)綜合設(shè)計(jì)出基于虛擬儀器的語(yǔ)音識(shí)別系統(tǒng),用于語(yǔ)音識(shí)別功能的進(jìn)一步研究。本文共分為六個(gè)章節(jié),具體結(jié)構(gòu)如下:第一章介紹了語(yǔ)音識(shí)別的學(xué)科背景與研究的發(fā)展歷程,歷史意義,本設(shè)計(jì)的軟件平臺(tái)以及本文選題的依據(jù)和內(nèi)容安排。第二章介紹了語(yǔ)音信號(hào)的實(shí)時(shí)采集及預(yù)處理,對(duì)語(yǔ)音信號(hào)的產(chǎn)生與數(shù)字化進(jìn)行了分析,并詳細(xì)介紹了語(yǔ)音信號(hào)的小波消噪及端點(diǎn)檢測(cè)以及語(yǔ)音信號(hào)的特征提取,其中對(duì)當(dāng)前應(yīng)用較廣泛的MFCC特征參數(shù)提取過程做了詳細(xì)的討論?! 〉谌陆榻B了語(yǔ)音識(shí)別的幾種算法,并對(duì)這幾種算法作進(jìn)一步的研究和改進(jìn),選擇一種自認(rèn)為比較合適的算法用于本次設(shè)計(jì)。第四章介紹了非特定人連續(xù)語(yǔ)音識(shí)別系統(tǒng)的實(shí)現(xiàn)問題,介紹了系統(tǒng)的具體設(shè)計(jì)步驟,及其模板的建立與讀取,并對(duì)試驗(yàn)結(jié)果進(jìn)行了分析。第五章簡(jiǎn)單介紹了整個(gè)設(shè)計(jì)所得出的結(jié)論。第六章 總結(jié)與展望,對(duì)本文的研究工作進(jìn)行階段性總結(jié),討論了當(dāng)前存在的問題和將來可能的研究方向。第二章 語(yǔ)音識(shí)別基本技術(shù)語(yǔ)音識(shí)別基本技術(shù)包括語(yǔ)音信號(hào)的預(yù)處理、分幀、加窗和端點(diǎn)檢測(cè)等時(shí)域和頻域分析。在語(yǔ)音識(shí)別系統(tǒng)中主要是采用基于模板匹配識(shí)別算法的研究,進(jìn)行待測(cè)語(yǔ)音和模板語(yǔ)音的對(duì)比分析,再根據(jù)特定的判定準(zhǔn)則得出最終的識(shí)別結(jié)果。本章主要介紹語(yǔ)音識(shí)別基本技術(shù)。 語(yǔ)音信號(hào)的采集 語(yǔ)音識(shí)別系統(tǒng)基本框架語(yǔ)音識(shí)別系統(tǒng)一般采用的是模式匹配的原理 [8],所以本質(zhì)上是一種模式識(shí)別系統(tǒng)。 所示,主要分為信號(hào)預(yù)處理、特征參數(shù)提取、模式匹配和參考模板庫(kù)幾個(gè)單元。語(yǔ)音信號(hào)是短時(shí)平穩(wěn)隨機(jī)信號(hào),產(chǎn)生機(jī)理非常的復(fù)雜、內(nèi)容較豐富并且有很大的不確定性,這使得語(yǔ)音識(shí)別比一般模式識(shí)別要困難很多。圖 語(yǔ)音識(shí)別系統(tǒng)基本結(jié)構(gòu)圖語(yǔ)音識(shí)別系統(tǒng)的處理過程從一開始的對(duì)語(yǔ)音信號(hào)進(jìn)行采集,即模擬語(yǔ)音信號(hào)轉(zhuǎn)化為數(shù)字語(yǔ)音信號(hào),隨機(jī)語(yǔ)音經(jīng)過錄音設(shè)備轉(zhuǎn)化為數(shù)字信號(hào)(語(yǔ)音信號(hào))輸入到語(yǔ)音識(shí)別系統(tǒng)進(jìn)行識(shí)別。對(duì)原始語(yǔ)音信號(hào)進(jìn)行抗混疊濾波、去噪聲,預(yù)加重處理和端點(diǎn)檢測(cè);根據(jù)端點(diǎn)檢測(cè)得到有效語(yǔ)音信號(hào),對(duì)其進(jìn)行特征參數(shù)提取,較好的特征參數(shù)應(yīng)具備的特點(diǎn)是:(1) 特征參數(shù)矢量的各分量之間具有良好的獨(dú)立性;(2)特征參數(shù)能有效地代表該語(yǔ)音段,具有良好的區(qū)分度; (3)特征參數(shù)的計(jì)算要高效,最好也比較容易實(shí)現(xiàn),保證語(yǔ)音識(shí)別的實(shí)時(shí)實(shí)現(xiàn)。由于語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)的特性,所以語(yǔ)音信號(hào)的特征參數(shù)都是以一段短時(shí)語(yǔ)音信號(hào)為單位的,一般短時(shí)時(shí)間段取值為 20ms~30ms 之間。對(duì)于識(shí)別參數(shù)的訓(xùn)練,根據(jù)識(shí)別方法的不同運(yùn)用不同的訓(xùn)練方案,參考模板的特征參數(shù)一般是離線計(jì)算并存儲(chǔ)起來的,為此,在系統(tǒng)使用前事先要錄入一些已知信號(hào),通過提取它們的特征參數(shù)矢量序列,根據(jù)不同的識(shí)別方法進(jìn)行訓(xùn)練,作為參考模式,這個(gè)過程就叫做訓(xùn)練過程。識(shí)別過程就是通過對(duì)輸入的語(yǔ)音信號(hào)與參考模板庫(kù)中的語(yǔ)音模板進(jìn)行比較,以特定的測(cè)度標(biāo)準(zhǔn)得出的最優(yōu)參考模板作為輸入語(yǔ)音信號(hào)的識(shí)別結(jié)果輸出,這個(gè)就是語(yǔ)音識(shí)別的識(shí)別全過程。顯然,最佳識(shí)別結(jié)果的準(zhǔn)確度跟語(yǔ)音模型的好壞、特征參數(shù)的選擇和參考模板是否準(zhǔn)確都有直接關(guān)系,這也正是目前語(yǔ)音識(shí)別過程中需要解決的一個(gè)難點(diǎn)。下面根據(jù)語(yǔ)音識(shí)別的過程,分別介紹各個(gè)過程的關(guān)鍵技術(shù)和基本理論,預(yù)處理和語(yǔ)音自動(dòng)分割算法以及三種語(yǔ)音特征參數(shù)提取技術(shù)。 語(yǔ)音信號(hào)的采集通常語(yǔ)音信號(hào)是一種連續(xù)的模擬信號(hào),計(jì)算機(jī)無法直接對(duì)其做數(shù)字化處理,因此需要經(jīng)過一種轉(zhuǎn)換將模擬信號(hào)轉(zhuǎn)化成數(shù)字信號(hào),我們把這個(gè)過程叫做模/數(shù)轉(zhuǎn)換(A/D轉(zhuǎn)換)。正常人的發(fā)音頻率范圍一般是40Hz到3400Hz左右,根據(jù)奈奎斯特采樣定律(Nyquist Sampling Theorem),那么采樣頻率應(yīng)為原始語(yǔ)音頻率的兩倍以上,本次設(shè)計(jì)采用8KHz采樣率()。將模擬語(yǔ)音信號(hào)轉(zhuǎn)化為數(shù)字語(yǔ)音信號(hào)需要聲音采集卡即聲卡的支持,不同聲卡的信噪比存在一定的差異,所以質(zhì)量不同的聲卡采集到的語(yǔ)音信號(hào)對(duì)系統(tǒng)的識(shí)別率也有一定的影響。 本文采用筆記本電腦自帶的聲卡進(jìn)行語(yǔ)音信號(hào)的采集,此次設(shè)計(jì)采集的語(yǔ)音信號(hào)以8KHz,16位,單通道格式錄入存儲(chǔ),得到需要的*.wav文件。 語(yǔ)音信號(hào)采集顯示的前面板圖 語(yǔ)音信號(hào)采集顯示的程序框圖 語(yǔ)音信號(hào)的數(shù)字化語(yǔ)音信號(hào)的數(shù)字化一般包括采樣、放大、增益控制、反混疊濾波、A/D變換及編碼。其中反混疊濾波的目的主要有兩個(gè):一方面抑制輸入信號(hào)在頻域中的各分量頻率超出f /2的所有分量(人為采樣頻率),以防止混疊產(chǎn)生的干擾。另一方面抑制50Hz的電源產(chǎn)生的工頻干擾。在本設(shè)計(jì)中由筆記本自帶的麥克風(fēng)采集語(yǔ)音信號(hào),接著將采集的語(yǔ)音信號(hào)從聲音波形轉(zhuǎn)換成電信號(hào),然后借助模數(shù)轉(zhuǎn)換器選擇合適的采樣率對(duì)模擬的聲音信號(hào)進(jìn)行采樣,最后再以一定的量化精度對(duì)其進(jìn)行量化,得到計(jì)算機(jī)能夠處理的數(shù)字語(yǔ)音信號(hào)。為了防止混疊效應(yīng),選擇的采樣頻率必須滿足Nyquist采樣定理,一般用的采樣頻率有fs1=8KHz, fs2=11KHz, fs3=16KHz等,在本設(shè)計(jì)中采樣率為8KHz。在將語(yǔ)音信號(hào)進(jìn)行數(shù)字化前,必須先進(jìn)行防混疊濾波,濾除噪聲或高于1/2采樣率的信號(hào)成分。一般模數(shù)轉(zhuǎn)換器和防混疊濾波通常做在一個(gè)集成塊內(nèi),就目前來說,從市面上購(gòu)買到的普通聲卡在這方面做的都還可以,對(duì)語(yǔ)音信號(hào)進(jìn)行數(shù)字化的質(zhì)量還是有一定保證的。語(yǔ)音信號(hào)的聲波通過麥克輸入到聲卡后就可直接獲得離散的數(shù)字信號(hào),該信號(hào)是經(jīng)過防混疊濾波、A/D變換、量化處理的。要將原始語(yǔ)音模擬信號(hào)轉(zhuǎn)變成數(shù)字語(yǔ)音信號(hào),一定要經(jīng)過采樣和量化這兩個(gè)步驟,從而得到在時(shí)間和幅度上均為離散的數(shù)字語(yǔ)音信號(hào)。根據(jù)采樣定理,當(dāng)采樣的頻率大于信號(hào)頻率的兩倍帶寬時(shí),采樣的過程中不會(huì)丟失信息,利用理想濾波器就可從采樣信號(hào)中不失真地重構(gòu)原始語(yǔ)音信號(hào)的波形。 語(yǔ)音信號(hào)預(yù)處理語(yǔ)音信號(hào)的預(yù)處理過程一般包括預(yù)加重處理、分幀處理、加窗處理、端點(diǎn)檢測(cè)幾個(gè)部分, 描述了整個(gè)預(yù)處理過程。 語(yǔ)音信號(hào)預(yù)處理過程示意圖 預(yù)加重處理語(yǔ)音信號(hào)的平均功率受聲門激勵(lì)和口鼻腔輻射的影響,大約在 800Hz 以上的高頻段,平均功率以 6dB/倍頻程下降,所以語(yǔ)音信號(hào)高頻部分頻譜比實(shí)際語(yǔ)音頻譜要低,因此造成高頻部分的頻譜比低頻部分頻譜更難計(jì)算。因此,在對(duì)語(yǔ)音信號(hào)進(jìn)行處理之前有必要對(duì)其高頻部分進(jìn)行提升。預(yù)加重是通過數(shù)字濾波器實(shí)現(xiàn)的,該數(shù)字濾波器的傳遞函數(shù)為:H (Z) =1 az1 (21)其中α為預(yù)加重系數(shù),值接近于 1,典型值取值為 。其時(shí)域表達(dá)式為: (22)預(yù)加重的物理意義是,通過數(shù)字濾波增加一個(gè)零點(diǎn),信號(hào)的頻譜變得平坦而且各共振峰幅度接近,即高頻部分得到提升,語(yǔ)音中聲道部分得到強(qiáng)化,所提取的特征更能符合原聲道模型,有利于語(yǔ)音信號(hào)的識(shí)別。圖 。圖中可以看出,預(yù)加重后信號(hào)的高頻分量相對(duì)低頻分量有明顯的提升。 原始信號(hào)頻譜與預(yù)加重后數(shù)字5的語(yǔ)音幅頻特性 分幀、加窗語(yǔ)音信號(hào)是一種典型的非平穩(wěn)信號(hào),但是由于發(fā)聲器官的物理結(jié)構(gòu)變化速度遠(yuǎn)遠(yuǎn)小于語(yǔ)音信號(hào)的變化,因此通常我們將語(yǔ)音信號(hào)看作是短時(shí)平穩(wěn)的,一般認(rèn)為20ms ~30ms 內(nèi),聲道物理特征基本保持不變,所以對(duì)連續(xù)的語(yǔ)音信號(hào)進(jìn)行分幀然后按幀處理。為了保證特征矢量參數(shù)變換的平滑性,分幀時(shí)使幀與幀之間有部分樣本重疊,這樣就可以用平穩(wěn)過程的分析方法來處理非平穩(wěn)的語(yǔ)音信號(hào)了。如果用一個(gè)數(shù)組表示每一幀語(yǔ)音信號(hào),那么一個(gè)連續(xù)的語(yǔ)音信號(hào)分幀之后就可以用一個(gè)依賴時(shí)間的數(shù)組序列來表示。設(shè)原始信號(hào)采樣序列為 S ( m ),分幀采用一個(gè)窗函數(shù)乘以原始信號(hào)并不斷平移得到幀語(yǔ)音序列。窗函數(shù)為 w( m ),一般形式為: (23)其中 N 為窗長(zhǎng),即每幀語(yǔ)音信號(hào)所含有的樣本數(shù)量,ψ[]是在原信號(hào)上的某種變換,線性或者非線性,當(dāng)時(shí), 為短時(shí)平均能量;當(dāng)時(shí),為短時(shí)平均過零率。加窗的物理意義可以理解為離散信號(hào)經(jīng)過一個(gè)單位沖擊為{w ( m )}的有限沖激響應(yīng)低通濾波器產(chǎn)生的輸出,常用的窗函數(shù)有三種,矩形窗,漢明(Hamming)窗和漢寧( Hanning )窗,其分別定義為:矩形窗: (24)漢明窗: (25)漢寧窗: (26)其中 N 為窗長(zhǎng)。由于漢明窗的主瓣較寬而旁瓣幅值較低,能有效地克服窗泄露現(xiàn)象,具有平滑低通特性,因此應(yīng)用廣泛,同時(shí)漢明窗可以加強(qiáng)相鄰幀左右兩端的連續(xù)性。在本文后續(xù)章節(jié)中窗函數(shù)均選擇漢明窗。圖 。 漢明窗時(shí)域波形與頻譜圖 端點(diǎn)檢測(cè)語(yǔ)音端點(diǎn)檢測(cè)是從一段語(yǔ)音信號(hào)中計(jì)算真正語(yǔ)音信號(hào)的起始點(diǎn)和終止點(diǎn),來獲得真正語(yǔ)音信號(hào)的方法。對(duì)于孤立詞識(shí)別來說,語(yǔ)音信號(hào)端點(diǎn)檢測(cè)的正確性直接影響到識(shí)別效果。漢語(yǔ)的音節(jié)末尾都是濁音,只用短時(shí)平均能量就能較好的判斷一個(gè)詞語(yǔ)的末點(diǎn)。實(shí)際應(yīng)用中,末點(diǎn)的誤差不會(huì)明顯地影響識(shí)別結(jié)果。因?yàn)榇蠖鄶?shù)聲母都是清聲母,例如 h 等,還有送氣與不送氣的賽音和塞擦音,將它們與環(huán)境噪聲分辨是比較困難的,所以漢語(yǔ)語(yǔ)音識(shí)別中重點(diǎn)在起始點(diǎn)檢測(cè)。端點(diǎn)檢測(cè)的準(zhǔn)確性對(duì)識(shí)別的效率和結(jié)果有直接影響[11]。有時(shí)一些突發(fā)性的噪聲也有可能引起過零率或短時(shí)能量的數(shù)值很高,但這種噪聲不能持續(xù)足夠長(zhǎng)的時(shí)間。例如物體的碰撞、門窗的開關(guān)等引起的噪聲,這些噪聲都可以通過設(shè)定最短的時(shí)間門限來判別。如果當(dāng)前狀態(tài)處于語(yǔ)音段時(shí),兩個(gè)參數(shù)的數(shù)值也降低到低門限以下,且最短時(shí)間門限也大于總的計(jì)時(shí)長(zhǎng)度,那么就認(rèn)為這是一段噪音,繼續(xù)掃描以后的語(yǔ)音數(shù)據(jù)。否則就標(biāo)記好結(jié)束端點(diǎn),并返回。: 硬件實(shí)現(xiàn)端點(diǎn)檢測(cè)程序流圖在程序中使用一個(gè)變量來表示當(dāng)前語(yǔ)音信號(hào)所處的狀態(tài),整個(gè)語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)一般可以分為四段:靜音段、過渡段、語(yǔ)音段、結(jié)束段。在靜音段,如果過零率或能量超過了低門限,則開始標(biāo)記為起始點(diǎn),隨后進(jìn)入到過渡段。在過渡段,由于參數(shù)的數(shù)值一般比較小,不能確信語(yǔ)音信號(hào)是否處于真正的語(yǔ)音段,因此只有當(dāng)兩個(gè)參數(shù)的數(shù)值都回落到低門限以下,那么就將當(dāng)前狀態(tài)恢復(fù)到靜音狀態(tài)。如果在過渡段中,只要兩個(gè)參數(shù)中的任何一個(gè)超過了高門限,就可以確信進(jìn)入真正的語(yǔ)音段了。下面將逐一介紹短時(shí)過零率法和能量法。端點(diǎn)檢測(cè)的短時(shí)過零率法 首先介紹一下過零率,在一段語(yǔ)音波形中,單位時(shí)間內(nèi)信號(hào)通過零線的次數(shù)我們就稱為過零率,它可作為信號(hào)頻率的一個(gè)度量。離散時(shí)間情況下,如果相鄰的抽樣具有不同的代數(shù)符號(hào),也就是相鄰抽樣的代數(shù)符號(hào)不同就稱為發(fā)生了過零。由于語(yǔ)音信號(hào)是寬帶信號(hào),所以采用了短時(shí)平均過零率來粗略的估計(jì)其譜特性[13]。具體計(jì)算公式為: (27)其中 (28) (29)語(yǔ)音信號(hào)中,清音語(yǔ)音能量大多集中在較高頻率段內(nèi),濁音語(yǔ)音能量大多集中在較低的頻率段內(nèi) (3KHz以下),而頻率的高低又意味著過零率的高低 ,所以根據(jù)此可以大致判斷出濁音與清音。端點(diǎn)檢測(cè)的短時(shí)能量法語(yǔ)音信號(hào)的短時(shí)能量反映了語(yǔ)音信號(hào)幅度隨時(shí)間的變化,計(jì)算公式為[12]: (210)亦可表示為: (211) 其中。此式表明,短時(shí)能量相當(dāng)于語(yǔ)音信號(hào)平方通過一個(gè)單位函數(shù)相應(yīng)為h(n)的線性濾波器的輸出。 由于式(211)是卷積形式的,因此可以理解為離散信號(hào)經(jīng)過一個(gè)單位脈沖的FIR低通濾波器產(chǎn)生的輸出。為了使算法簡(jiǎn)單化,避免高信號(hào)電平對(duì)它的干擾,那么短時(shí)能量函數(shù)可以用平均幅度函數(shù)來代替[12]。這時(shí),能量的主要意義在于能量函數(shù)可用來大致確
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1