freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)本科畢業(yè)設(shè)計(jì)(更新版)

  

【正文】 濾波器,其頻率分辨率提高,相當(dāng)于短時(shí)處理時(shí)窗寬較寬的那種情況。與一股的單門(mén)限過(guò)零率法相河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) 14 比,可明顯地減少前端誤判,但是有時(shí)存在 較大時(shí)延。與 Rn(k)相反的是,在周期的各個(gè)整數(shù)倍點(diǎn)上 Fn(k)具有谷值而不是峰值。利用快速傅立葉變換等簡(jiǎn)化計(jì)算方法都無(wú)法避免乘法運(yùn)算。在背景噪聲較小的情況下,短時(shí) 能量比較準(zhǔn)確,但當(dāng)背景噪聲較大時(shí),短時(shí)平均過(guò)零率可以獲得較好的檢測(cè)效果。從圖中可觀察到,短時(shí)平均幅度對(duì)能量小的信號(hào)累計(jì)效果要比短時(shí)能量好。通常在 l0kHz 采樣頻率下, L 折衷選擇為 100~ 200 個(gè)采樣點(diǎn) (即持續(xù)時(shí)間為 10~ 20ms)。 在 10~ 20ms 這樣的時(shí)間段內(nèi),數(shù)字化后的語(yǔ)音信號(hào)的頻譜特性和某些物理特征參量可近似地看作是不變地。在語(yǔ)音信號(hào)處理中,一般用循環(huán)隊(duì)列的方式來(lái)存儲(chǔ)這些數(shù)據(jù),以便用一個(gè)有限容量的數(shù)據(jù)區(qū)來(lái)應(yīng)付數(shù)量極大的語(yǔ)音數(shù)據(jù)。圖 “ 0”的預(yù)加重處理結(jié)果。 由于語(yǔ)音信號(hào)的平均功率譜受聲門(mén)激勵(lì)和鼻輻射的影響,在 800Hz以上的高 頻時(shí)約按6dB/oct 衰減,為此要在預(yù)處理中進(jìn)行預(yù)加重。信號(hào)與量化噪聲的功率之比為量化信噪比。圖 給出了經(jīng)典的語(yǔ)音信號(hào)的產(chǎn)生模型,語(yǔ)音信號(hào)被看成是線性時(shí)不變系統(tǒng)在隨機(jī)噪聲或準(zhǔn)周期脈沖序列激勵(lì)下的輸出。一般來(lái)說(shuō),彎頭段和降尾段對(duì)聲調(diào)的聽(tīng)辨不起作用,起作用的是調(diào)型段。輔音也有清濁之分。 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) 5 音素是語(yǔ)音信號(hào)的最基本組成單位,可分為濁音和清音兩大類。 (1)物理學(xué) (聲學(xué) ):聲音產(chǎn)生與傳播原理、聲電轉(zhuǎn)換以及聲音在房間回響等相關(guān)知識(shí)。自然語(yǔ)音數(shù)據(jù)庫(kù)的設(shè)計(jì):語(yǔ)音特征的提取;利用語(yǔ)音料庫(kù)進(jìn)行聲學(xué)模型訓(xùn)練的研究;適應(yīng)說(shuō)話人聲學(xué)模型的研究;語(yǔ)音識(shí)別算法的研究:語(yǔ)言翻譯和對(duì)話處理的研究等成為語(yǔ)音技術(shù)的熱點(diǎn)方向。而一旦用戶以跟人交談的方式來(lái)進(jìn)行語(yǔ)音輸入時(shí),口語(yǔ)的語(yǔ)法不規(guī)范和語(yǔ)序不正常的特點(diǎn)會(huì)給語(yǔ)義的分析和理解帶來(lái)困難。實(shí)際應(yīng)用中,噪音是無(wú)法避免的。對(duì)某一種口音,語(yǔ)言的聲學(xué)模型的適應(yīng)性決定了基礎(chǔ)識(shí)別率,而在此基礎(chǔ)上的優(yōu)化和模型適應(yīng)方案則提供了很好的解決方案。 語(yǔ)音識(shí)別技術(shù)難點(diǎn) 雖然語(yǔ)音識(shí)別已突破了最初對(duì)技術(shù)的檢驗(yàn)階段,而進(jìn)入通過(guò)對(duì)話及系統(tǒng)形象的設(shè)計(jì),建立用戶喜愛(ài)的應(yīng)用系統(tǒng)時(shí)期。 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) 3 語(yǔ)音識(shí)別系統(tǒng)的基本構(gòu)成 語(yǔ)音識(shí)別系統(tǒng)的典型實(shí)現(xiàn)方案為:輸入的模擬語(yǔ)音信號(hào) 首先要進(jìn)行預(yù)處理,包括預(yù)濾波、采樣和量化、加窗、端點(diǎn)檢測(cè)、預(yù)加重等。連接詞語(yǔ)音識(shí)別支持一個(gè)小的語(yǔ)法網(wǎng)絡(luò) ,其內(nèi)部形成一個(gè)狀態(tài)機(jī),可以實(shí)現(xiàn)簡(jiǎn)單的家用電器的控制,而復(fù)雜的連接詞語(yǔ)音識(shí)別系統(tǒng)可以用于電話語(yǔ)音查詢、航空定票等系統(tǒng)。在聲學(xué)識(shí)別層次,以多個(gè)說(shuō)話人發(fā)音的大規(guī)模語(yǔ)音數(shù)據(jù)為基礎(chǔ),以馬爾可夫鏈為基礎(chǔ)的語(yǔ)音序列建模方法 HMM(隱含馬爾可夫模型 )比較有效的解決了語(yǔ)音信號(hào)短時(shí)穩(wěn)定、長(zhǎng)時(shí)時(shí)變 的特性,并且能根據(jù)一些基本建模單元構(gòu)造成連續(xù)語(yǔ)音的句子模型,達(dá)到了比較高的建模精度和建模靈活性。 我國(guó)語(yǔ)音識(shí)別研究工作近年來(lái)發(fā)展很快,同時(shí)也從實(shí)驗(yàn)室逐步走向?qū)嵱谩? 語(yǔ)音識(shí)別研究現(xiàn)狀 20世紀(jì) 90年代后,在細(xì)化模型的設(shè)計(jì)、參數(shù)提取和優(yōu)化,以及系統(tǒng)的自適應(yīng)技術(shù)上取得了一些關(guān)鍵進(jìn)展。 語(yǔ)音識(shí)別中的說(shuō)話人辨認(rèn)的研究始于 20世紀(jì) 30年代。 Matlab 是一款功能強(qiáng)大的數(shù)學(xué)軟件,它附帶大量的信號(hào)處理工具箱為信號(hào)分析研究,特別是文中主要探討的聲波分析研究帶來(lái)極大便利。語(yǔ)音識(shí)別技術(shù)既是國(guó)際競(jìng)爭(zhēng)的一項(xiàng)重要技術(shù),也是每一個(gè)國(guó)家經(jīng)濟(jì)發(fā)展不可缺少的重要技術(shù)支撐。 關(guān)鍵詞 :語(yǔ)音識(shí)別算法; HMM 模型; Matlab; GUI ABSTRACT Speech Recognition is designed to allow machines to understand what people say,and accurately identify the contents of voice to execute the intent of recognition technology is not only an important internationally peted technology,but also an indispensable foundational technology for the national economic on the mathematical model from the speech signal,this paper analyze audio signal from the time domain,frequency domain proceeding,and discussed the basic theory of speech recognition algorithm are discussed:Dynamic Time Warping(DTW)、 Rulebased Artificial Intelligence,Artificial Neural Network(ANN),Hidden Markov Model(HMM),HMM bined with focus is put in the theoretical studies of Hidden Markov(HMM) model algorithm,and the classical HMM algorithm is improved. Speech recognition algorithm is realized in various programs,this article taking the method is to use Matlab powerful mathematical operation ability to realize the recognition of speech signal isolation. Matlab is a powerful mathematic software with a mass of toolboxes dealing with signal processing. It gives a terrific shortcut to the research of signal processing,especially the wave analysis. We can characterize the sound with key parameters such as intensity, frequency etc. In this paper, hidden Markov model (HMM) recognition algorithm using MFCC (MEL 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) II frequency cepstral coefficients) as the main voice characteristic parameters, the establishment of a Chinese digital speech recognition system, including the preprocessing of the speech signal,the extraction of characteristic parameters the training of the recognition template,identifying matching algorithm。 Bell實(shí)驗(yàn)室的 S. Pruzansky提出了模版匹配和概率統(tǒng)計(jì)方差分析的聲紋識(shí)別方法,形成了聲紋識(shí)別研究的一個(gè)高潮。 IBM、 Microsoft、 Lamp。漢語(yǔ)語(yǔ)音識(shí)別研究已經(jīng)走上組織化的道路。 語(yǔ)音識(shí)別系統(tǒng)的分類 語(yǔ)音識(shí)別是近年來(lái)十分活躍的一個(gè)研究領(lǐng)域。 從識(shí)別對(duì)象的類型來(lái)看,語(yǔ)音識(shí)別可以分為特定人 (Speaker Dependent)語(yǔ)音識(shí)別和非特定人 (Speaker Independent)語(yǔ)音識(shí) 別。 2,各階參數(shù)之間有良好的獨(dú)立性。 首先,帶口音 (Dialect)語(yǔ)音的識(shí)別。優(yōu)化過(guò)程對(duì)所有系統(tǒng)的表現(xiàn)都會(huì)有提高,也可以解決小范圍的口音問(wèn)題。在這方面, Nuance優(yōu)化的語(yǔ)音參數(shù)、靈活的模型結(jié)構(gòu)、新 的建模方法以及獨(dú)有的噪音抑制功能,使得系統(tǒng)在背景環(huán)境噪聲、手機(jī)、車載免提等高噪音環(huán)境下能保持良好的工作狀況。例如,“我對(duì)我的手機(jī)上的一些功能不太明白,想問(wèn)一下”,或者“嗯,我的賬單應(yīng)該到期了,請(qǐng)幫我查一下要交多少錢(qián)”。 一位業(yè)界的資深人士對(duì) IT產(chǎn)業(yè)發(fā)展的提出的八大預(yù)言之一即為:語(yǔ)音成為 新人機(jī)界面。 (4)信息理論和計(jì)算機(jī)科學(xué):各種算法的研究、快速搜索查找匹配的方法。 音節(jié)是由音素結(jié)合而成的發(fā)聲最小單位,一個(gè)音節(jié)由“元音”和“輔音”構(gòu)成。所以,在漢語(yǔ)的相互交談中,不但要憑借不同的元音和輔音來(lái)辨別這些字或詞的意義,還需要從不同的聲調(diào)來(lái)區(qū)別它,也就是說(shuō)聲調(diào)有辨義作用。 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) 6 圖 聲調(diào)的四種模式 語(yǔ)音信號(hào)是聲道被激勵(lì)發(fā)生共振而產(chǎn)生的輸出。在實(shí)際語(yǔ)音信號(hào)處理中,采樣頻率通常為 7~ 10kHz。上式表明,量化器中每位字長(zhǎng)對(duì) SNR貢獻(xiàn)為 6dB。這樣,不僅能夠進(jìn)行預(yù)加重,而且可以壓縮信號(hào)的動(dòng)態(tài)范圍,有效地提高信噪比。如果頻率干擾 (50或 60Hz)不嚴(yán)重或另有抗干擾措施,則不必用帶通濾波器而只用低通濾波器即可。在河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) 9 取數(shù)據(jù)時(shí),前一幀與后一幀的交疊部分稱為幀移。其一般式為 ????? ??? mn mnwmxTQ )()]([,其中T[*]表示某種運(yùn)算 {x(m)}為輸入信號(hào)序列。可以看出,短時(shí)能量可以看作語(yǔ)音信號(hào)的平方經(jīng)過(guò)一個(gè)線性濾波器的輸出,該線性濾波器的單位沖激響應(yīng)為 h(n),如圖 。對(duì)于離散信號(hào),它實(shí)質(zhì)上是信號(hào)采樣點(diǎn)符號(hào)變化的次數(shù)。 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) 12 圖 語(yǔ)音信號(hào)“ 0”的短時(shí)平均過(guò)零率 語(yǔ)音信號(hào) xw(n)的短時(shí)自相關(guān)函數(shù) Rn(k)的計(jì)算式如下: ? ? ? ? ? ? ? ?KkmxmxkR nkNm nn ???? ??? 010 (28) 這里 K 是最大的延遲點(diǎn)數(shù)。 ),則相距為周期的整數(shù)倍的樣點(diǎn)上的幅值是相等的,差值為零。正確確定語(yǔ) 音端點(diǎn)也會(huì)減少系統(tǒng)的計(jì)算量和存儲(chǔ)量。因此,對(duì)語(yǔ)音信號(hào)進(jìn)行頻譜分析,是認(rèn)識(shí)語(yǔ)音信號(hào)和處理語(yǔ)音信號(hào)的的重要方法。這種信號(hào)可以輸入計(jì)算機(jī)進(jìn)行各種分析和處理。 短時(shí)功率譜實(shí)際上是短時(shí)傅立葉變換幅度的平方,它是信號(hào) x(n)的短時(shí)自相關(guān)函數(shù)的傅立葉變換,即 ? ? ? ? ? ???????? k jwnjwnjwn kekReXeP 2 (213) 式中 Rn( k)是自相關(guān)函數(shù)。 Mel頻率倒譜系數(shù) 美爾頻標(biāo)倒譜系數(shù) (Mel Frequency Cepstrum Coefficient, MFCC)考慮了人耳的聽(tīng)覺(jué)特性,將頻譜轉(zhuǎn)化為基于 Mel 頻標(biāo)的非線性頻譜,然后轉(zhuǎn)換到倒譜域上。在實(shí)際應(yīng)用中, MFCC倒譜系數(shù)計(jì)算過(guò)程如下: (1)將信號(hào)進(jìn)行分幀,預(yù)加重和加哈明窗處理,然后進(jìn)行短時(shí)傅立葉變換并得到其頻譜。用于孤立詞識(shí)別, DTW 算法與 HMM 算法在相同的環(huán)境條件下,識(shí)別效果相差不大,但 HMM算法要復(fù)雜得多,主要體現(xiàn)在 HMM 算法在訓(xùn)練階段需要提供大量的語(yǔ)音數(shù)據(jù),通過(guò)反復(fù)計(jì)算才能得到模型參數(shù),而 DTW 算法的訓(xùn)練中 幾乎不需要額外的計(jì)算。設(shè) n和 m 分別是T 和 R 中任意選擇的幀號(hào), d[T(n),R(m)]表示這兩幀之間的距離。因而更多地是采用動(dòng)態(tài)規(guī)劃 (DP)的方法。其系統(tǒng)開(kāi)銷小,識(shí)別速度快,在對(duì)付小詞匯量的語(yǔ)音命令控制系統(tǒng)中是一個(gè)非常有效的算法。知識(shí)和規(guī)則的方法之所以很難取得更大的進(jìn)展,既由于語(yǔ)音的多變,又由于規(guī)則的難以搜集完備,還有執(zhí)行規(guī)則的算法難以高效運(yùn)行。神經(jīng)網(wǎng)絡(luò)之所以能吸引眾多研究人員的興趣,在于它具有一系列傳統(tǒng)的數(shù)字計(jì)算機(jī)系統(tǒng)及線性網(wǎng)絡(luò)所沒(méi)有的優(yōu)點(diǎn)。信息存儲(chǔ)和信息處理二者密不可分,信息處理過(guò)程同人腦一樣,如同一個(gè)黑箱。語(yǔ)音信號(hào)是一種典型的動(dòng)態(tài)模式序列,前后幀之間的 時(shí)間相關(guān)性非常強(qiáng),所以要將神經(jīng)網(wǎng)絡(luò)應(yīng)用于語(yǔ)音識(shí)別,必須解決好瞬時(shí)輸出的記憶問(wèn)題。而這種隱含關(guān)系在 HMM 模型中通常以概率形式表現(xiàn)出來(lái),模型的輸出結(jié)果也以概率形式給出。這在實(shí)際工作中占有很大的工作量。 ANN 和 HMM 可以以不同的方式進(jìn)行結(jié)合,如 ANN 直接實(shí)現(xiàn) HMM,兩者在幀層面上的結(jié)合,語(yǔ)音層面上的結(jié)合, 音段層面的結(jié)合和子層面上的結(jié)合等方式,而 HMM和 ANN 混合模型的結(jié)合,即能優(yōu)化 HMM 模型,又能充分利用每一種技術(shù)的長(zhǎng)處: HMM 的時(shí)間建模和 ANN河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) 22 的聲學(xué)建模,特別是用神經(jīng)網(wǎng)絡(luò)計(jì)算 HMM 狀態(tài)的觀測(cè)概率。而且在系統(tǒng)體系上又保持了 HMM的框架,所以混合 HMM/ANN模型是 HMM 和 ANN兩種模型的有機(jī)結(jié)合,具有 明確的數(shù)學(xué)和物理意義。 所以混合模型在系統(tǒng)框架上保持了傳統(tǒng) HMM的框架,而局部功能模塊如:概率估計(jì)、上下文關(guān)聯(lián)等則通過(guò) ANN 實(shí)現(xiàn),這樣有機(jī)地將 HMM 和 ANN 的各自優(yōu)勢(shì)統(tǒng)一在一個(gè)系統(tǒng)之中.又彌補(bǔ)了各自的不足。分類網(wǎng)絡(luò)具有簡(jiǎn)單直觀、在本質(zhì)上是區(qū)分性的、在設(shè)計(jì)上是模塊化的、可以方便地組合成更大的系統(tǒng)、具有完善的數(shù)學(xué)解釋等優(yōu)點(diǎn),所以可以很容易地集成到
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1