freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)本科畢業(yè)設(shè)計(jì)-在線瀏覽

2024-10-30 15:19本頁(yè)面
  

【正文】 dealing with signal processing. It gives a terrific shortcut to the research of signal processing,especially the wave analysis. We can characterize the sound with key parameters such as intensity, frequency etc. In this paper, hidden Markov model (HMM) recognition algorithm using MFCC (MEL 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說明書 II frequency cepstral coefficients) as the main voice characteristic parameters, the establishment of a Chinese digital speech recognition system, including the preprocessing of the speech signal,the extraction of characteristic parameters the training of the recognition template,identifying matching algorithm。以語(yǔ)音識(shí)別開發(fā)出的產(chǎn)品應(yīng)用領(lǐng)域非常廣泛,有聲控電話交換、語(yǔ)音撥號(hào)系統(tǒng)、信息網(wǎng)絡(luò)查詢、家庭服務(wù)、賓館服務(wù)、旅行社服務(wù)系統(tǒng)、訂票系統(tǒng)、聲控智能玩具、醫(yī)療服務(wù)、銀行服務(wù)、股票查詢服務(wù)、計(jì)算機(jī)控制、工業(yè)控制、語(yǔ)音通信系統(tǒng)、軍事監(jiān)聽、信息檢索、應(yīng)急服務(wù)、翻譯系統(tǒng)等,幾乎深入到社會(huì)的每個(gè)行業(yè)、每個(gè)方面,其應(yīng)用和經(jīng)濟(jì)社會(huì)效益前景非常廣泛。研究語(yǔ)音識(shí)別,開發(fā)相應(yīng)的產(chǎn)品有著廣泛的社會(huì)意義和經(jīng)濟(jì)意義。早期的工作主要集中在人耳聽辨試驗(yàn)和探討聽音識(shí)別的可能性方面。 Bell實(shí)驗(yàn)室的 S. Pruzansky提出了模版匹配和概率統(tǒng)計(jì)方差分析的聲紋識(shí)別方法,形成了聲紋識(shí)別研究的一個(gè)高潮。研究特點(diǎn)是以孤立字語(yǔ)音識(shí)別為主,通常把孤立字作為一個(gè)整體來建立模板。另一個(gè)重要發(fā)展是語(yǔ)音識(shí)別算法從模板匹配技術(shù)轉(zhuǎn)向基于統(tǒng)計(jì)模型技術(shù)。語(yǔ)音識(shí)別技術(shù)進(jìn)一步成熟,并開始向市場(chǎng)提供產(chǎn)品 。 IBM、 Microsoft、 Lamp。 IBM開發(fā)的 Viavoice和 Microsoft開發(fā)的中文識(shí)別引擎代表了當(dāng)前漢語(yǔ)語(yǔ)音識(shí)別的最高水平。日本也先 后在語(yǔ)音識(shí)別領(lǐng)域大展頭角,還有如 Philips公司開發(fā)的 Speech— Media和 Speech Pearl兩套軟件,涵蓋了自然語(yǔ)音識(shí)別與理解的對(duì) 話系統(tǒng)。從 1987年開始執(zhí)行 863計(jì)劃后,國(guó)家 863《智能計(jì)算機(jī)主題》專家組為語(yǔ)音識(shí)別研究立項(xiàng)。漢語(yǔ)語(yǔ)音識(shí)別研究已經(jīng)走上組織化的道路。 語(yǔ)音識(shí)別發(fā)展到一定階段,世界各國(guó)都加快了語(yǔ)音識(shí)別引用系統(tǒng)的研究開發(fā),通常連續(xù)語(yǔ)音是含有較完整語(yǔ)法信息的連續(xù)語(yǔ)句,最接近于人的自然講話方式,從非連續(xù)語(yǔ)音到連續(xù)語(yǔ)音的研究 面臨著很多完全不同的技術(shù)難點(diǎn),非連續(xù)語(yǔ)音的識(shí)別是一些孤立的聲波片段,連續(xù)語(yǔ)音則面臨著如何切分聲波的問題。 經(jīng)過幾十年的發(fā)展和摸索,人們終于在實(shí)驗(yàn)室突破了大詞匯量、連續(xù)語(yǔ)音和非特定人這三大障礙,第一次把這三個(gè)特性一起集中于一個(gè)系統(tǒng)中,并以此確定了統(tǒng)計(jì)方法和模型在語(yǔ)音識(shí)別和語(yǔ)音處理中的主流地位。 目前在語(yǔ)音識(shí)別研究領(lǐng)域非常活躍的課題為穩(wěn)健語(yǔ)音識(shí)別、說話人自適應(yīng)技術(shù)、大詞匯量關(guān)鍵詞識(shí)別算法、語(yǔ)音識(shí)別的可信度評(píng)測(cè)算法、基于類的語(yǔ)言模型和自適應(yīng)語(yǔ)言模型,以及深層次的自然語(yǔ)音的理解。 語(yǔ)音識(shí)別系統(tǒng)的分類 語(yǔ)音識(shí)別是近年來十分活躍的一個(gè)研究領(lǐng)域。本文介紹了語(yǔ)音識(shí)別的基本流程、所用到的語(yǔ)音參數(shù)算法、語(yǔ)音識(shí)別的訓(xùn)練算法和識(shí)別算法做初步的探究,主要運(yùn)用了特定人孤立詞識(shí)別的 DTW算法和非特定人識(shí)別的連續(xù) HMM算法的 Matlab識(shí)別系統(tǒng)。孤立詞識(shí)別是指說話人每次只說一個(gè)詞或短語(yǔ),每個(gè)詞或短語(yǔ)在詞匯表中都算作一個(gè)詞條,一般用在語(yǔ)音電話撥號(hào)系統(tǒng)中。連續(xù)語(yǔ)音識(shí)別是指對(duì)說話人以日常自然的方式發(fā)音,通常特指用于語(yǔ)音錄入的聽寫機(jī)。 從識(shí)別對(duì)象的類型來看,語(yǔ)音識(shí)別可以分為特定人 (Speaker Dependent)語(yǔ)音識(shí)別和非特定人 (Speaker Independent)語(yǔ)音識(shí) 別。實(shí)際上,非特定人語(yǔ)音識(shí)別的初始識(shí)別率往往都比較低,一般都要求用戶花一定的時(shí)間對(duì)系統(tǒng)進(jìn)行訓(xùn)練,將系統(tǒng)的參數(shù)進(jìn)行一定的自適應(yīng)調(diào)整,才能使識(shí)別率達(dá)到滿意的程度。目前的連續(xù)語(yǔ)音識(shí)別大多是基于 HMM(隱馬爾可夫模型 )框架,并將聲學(xué)、語(yǔ)言學(xué)的知識(shí)統(tǒng)一引入來改善這個(gè)框架,其硬件平臺(tái)通常是功能強(qiáng)大的工作站或 PC機(jī)。語(yǔ)音信號(hào)經(jīng)預(yù)處理后,接下來很重要的一環(huán)就是特征參數(shù)提取。 2,各階參數(shù)之間有良好的獨(dú)立性。 在訓(xùn)練階段,將特征參數(shù)進(jìn)行一定的處理之后,為每個(gè)詞條得到一個(gè)模型,保存為模版庫(kù)。同時(shí) 還可以在很多先驗(yàn)知識(shí)的幫助下,提高識(shí)別的準(zhǔn)確率。然而語(yǔ)音技術(shù)本身仍在不斷進(jìn)步,為市場(chǎng)提供更新更好的應(yīng)用模式和技術(shù)。 首先,帶口音 (Dialect)語(yǔ)音的識(shí)別。例如,中國(guó)的八大方言多屬于與普通話 (北方語(yǔ)系 )不同的語(yǔ)系。而對(duì)于口音的適應(yīng)性首先是由聲學(xué)模型本身的品質(zhì)決定的。例如 Nuance公司,作為擁有最大市場(chǎng)和最多用戶的公司,也擁有最多的用戶語(yǔ)音數(shù)據(jù),保證了它極高的基礎(chǔ)識(shí)別率。優(yōu)化過程對(duì)所有系統(tǒng)的表現(xiàn)都會(huì)有提高,也可以解決小范圍的口音問題。 焦點(diǎn)之二是背景噪音。它將破壞原始語(yǔ)音的頻譜,或者把原始語(yǔ)音部分或全部掩蓋掉,造成識(shí)別率下降。研究將要解決的問題就是如何把原始語(yǔ)音從背景噪音中分離出來,即所謂提高音質(zhì)(speech enhancement)或減噪 (noise reduction)的預(yù)處理。在這方面, Nuance優(yōu)化的語(yǔ)音參數(shù)、靈活的模型結(jié)構(gòu)、新 的建模方法以及獨(dú)有的噪音抑制功能,使得系統(tǒng)在背景環(huán)境噪聲、手機(jī)、車載免提等高噪音環(huán)境下能保持良好的工作狀況。這就是用戶說話的自由度問題。語(yǔ)音識(shí)別技術(shù)的最終目的是要讓用戶在“人機(jī)對(duì)話”的時(shí)候,能夠像進(jìn)行“人人對(duì)話”一樣自然。你也許接觸到一些語(yǔ)音軟件聲稱是可以做到自然語(yǔ)言識(shí)別,而在這方面真正有實(shí)用商業(yè)系統(tǒng)的只有 Nuance公司。例如,“我對(duì)我的手機(jī)上的一些功能不太明白,想問一下”,或者“嗯,我的賬單應(yīng)該到期了,請(qǐng)幫我查一下要交多少錢”。 語(yǔ)音識(shí)別發(fā)展前景 語(yǔ)音技術(shù)是目前世界上最熱門和最具有發(fā)展前景的技術(shù)之一。語(yǔ)音作為當(dāng)前通訊系統(tǒng)中最自 然的通信媒介,隨著計(jì)算機(jī)和語(yǔ)音處理技術(shù)的發(fā)展,不同語(yǔ)種之間的語(yǔ)音翻譯將成為語(yǔ)音研究的熱點(diǎn)。語(yǔ)音識(shí)別研究的另一個(gè)發(fā)展方向是人體語(yǔ)言與口語(yǔ)相結(jié)合的多媒體人機(jī)交互。 一位業(yè)界的資深人士對(duì) IT產(chǎn)業(yè)發(fā)展的提出的八大預(yù)言之一即為:語(yǔ)音成為 新人機(jī)界面。未來幾年里,真正實(shí)用的語(yǔ)音識(shí)別和音字轉(zhuǎn)換技術(shù)將首次走出實(shí)驗(yàn)室,走進(jìn)千家萬(wàn)戶的電器設(shè)備中。 另外,語(yǔ)音識(shí)別是一門交叉學(xué)科, 語(yǔ)音識(shí)別技術(shù)關(guān)系到多學(xué)科的研究領(lǐng)域,在不同領(lǐng)域上的進(jìn)步都會(huì)促進(jìn)語(yǔ)音識(shí)別的發(fā)展。 (2)生理學(xué):有關(guān)人的聲道與耳朵的生理結(jié)構(gòu)、耳朵的聽覺特征,在腦內(nèi)高層的語(yǔ)言處理等。 (4)信息理論和計(jì)算機(jī)科學(xué):各種算法的研究、快速搜索查找匹配的方法。 (7)數(shù)字信號(hào)處理技術(shù):信號(hào)的時(shí)域分析、 噪聲消除、數(shù)字濾波、線性預(yù)測(cè)等方面的知識(shí)。 二、語(yǔ)音信號(hào)分析 語(yǔ)音學(xué)知識(shí) 在連續(xù)數(shù)字語(yǔ)音識(shí)別過程中,為了提高連續(xù)數(shù)字匹配搜索算法的有效性以及數(shù)字的識(shí)別率,必須要將對(duì)數(shù)字語(yǔ)音的研究細(xì)化到語(yǔ)音學(xué)的層次上,包括對(duì)各數(shù)字的音素和音節(jié)的特性和各數(shù)字的聲調(diào)進(jìn)行深入研究。 濁音通過喉部發(fā)聲,發(fā)聲時(shí)聲帶振動(dòng),聲帶 振動(dòng)的基本頻率稱為“基音頻率”,其倒數(shù)稱為“基音周期”。 音節(jié)是由音素結(jié)合而成的發(fā)聲最小單位,一個(gè)音節(jié)由“元音”和“輔音”構(gòu)成。元音構(gòu)成一個(gè)音節(jié)的主干,無論從長(zhǎng)度還是能量上看,元音在音節(jié)中都占主要部分。發(fā)音時(shí)呼出的氣流,由于通路的某一部分封閉起來或受到阻礙, 氣流被阻不能暢通,而克服發(fā)音器官的這種阻礙而產(chǎn)生的音素稱為輔音。輔音出現(xiàn)在音節(jié)的前端或者后端或前后兩端。所以,在漢語(yǔ)的相互交談中,不但要憑借不同的元音和輔音來辨別這些字或詞的意義,還需要從不同的聲調(diào)來區(qū)別它,也就是說聲調(diào)有辨義作用。聲調(diào)的變化就是濁音基音周期 (或基音頻率 )的變化,各個(gè)韻母段中基音周期隨時(shí)問的變化產(chǎn)生了聲調(diào),變化的軌跡稱為聲調(diào)曲線。不同聲調(diào)的聲調(diào)曲線的開始段稱為彎頭段,呈共同上升走向;末尾一段呈共同下降走向,稱為降尾段;而中間一段具有不同的特點(diǎn),這一段稱為調(diào)型段。而一段語(yǔ)音,它的起始和結(jié)尾處的波形幅度較小,要準(zhǔn)確地測(cè)出這些地方的基音周期并不容易,因此可將這兩處的波形忽略,只測(cè)調(diào)型 段這一部分波形的基音周期。 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說明書 6 圖 聲調(diào)的四種模式 語(yǔ)音信號(hào)是聲道被激勵(lì)發(fā)生共振而產(chǎn)生的輸出。理想的模型是線性的,且時(shí)不變的;但是語(yǔ)音信號(hào)是一連串的時(shí)變過程,且聲門和聲道相互耦合形成了語(yǔ)音信號(hào)的非線性特性。它包括激勵(lì)模型、聲道模型、和輻射模型。 圖 語(yǔ)音信號(hào)產(chǎn)生模型 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說明書 7 語(yǔ)音信號(hào)數(shù)字化和預(yù)處理 為了將原始的模擬語(yǔ)音信號(hào)變?yōu)閿?shù)字信號(hào),必須經(jīng)過采樣和量化兩個(gè)步驟,從而得到時(shí)間和幅度上均為離散的數(shù)字語(yǔ)音信號(hào)。在實(shí)際語(yǔ)音信號(hào)處理中,采樣頻率通常為 7~ 10kHz。此時(shí),信號(hào)中的高頻成分將產(chǎn)生失真。量化后的信號(hào)值與原始信號(hào)之間的差值為量化誤差,又稱為量化噪聲。若用 2x? 表示輸入語(yǔ)音信號(hào)序列的方差, max2X 表示信號(hào)的峰值, B 表示量化分辨率 (量化位長(zhǎng) ), 2e? 表示噪聲序列的方差,則量化信噪比為: )lg ()lg (10 m a x22 xex XBS N R ??? ???? ( ) 假設(shè)語(yǔ)音信號(hào)的幅度服從 Laplacian 分布,此時(shí)信號(hào)幅度超過 x?4 的概率很小 ,只有%,因而可以取 xX ?4max? 。上式表明,量化器中每位字長(zhǎng)對(duì) SNR貢獻(xiàn)為 6dB。此時(shí)量化后的語(yǔ)音質(zhì)量能滿足一般通信系統(tǒng)的要求。為了在語(yǔ)音信號(hào)變化范圍內(nèi)保持 35dB 的信噪比,常用 12 位來量化,其中附加的 5 位用于補(bǔ)償 30dB左右的輸入動(dòng)態(tài)范圍變化。預(yù)加重的目的是提升高頻部分,使信號(hào)的頻譜變得平坦,以便于進(jìn)行聲道參數(shù)分析或頻譜分析。這樣,不僅能夠進(jìn)行預(yù)加重,而且可以壓縮信號(hào)的動(dòng)態(tài)范圍,有效地提高信噪比。同時(shí),預(yù)加重也可在 A/D 轉(zhuǎn)換之后進(jìn)行,用具有 6dB/oct 地提升高頻特性地預(yù)加重?cái)?shù)字濾波器實(shí)現(xiàn)。 加重的信號(hào)在分析處理后,需要進(jìn)行去加重處理,即加上 6dB/oct的下降的頻率特性來還原成原來的特性。從下圖可以明顯河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說明書 8 的看出,加重后語(yǔ)音信號(hào)中高頻分量增強(qiáng)。如果頻率干擾 (50或 60Hz)不嚴(yán)重或另有抗干擾措施,則不必用帶通濾波器而只用低通濾波器即可。 A/D 轉(zhuǎn)換后采用低通濾波器作為平滑濾波器,對(duì)重構(gòu)的語(yǔ)音波形的高次諧波起平滑作用,以去除高次諧波失真。 已經(jīng)數(shù)字化的語(yǔ)音信號(hào)序列將被依次存入一個(gè)數(shù)據(jù)區(qū)。在進(jìn)行處理時(shí),按幀從此數(shù)據(jù)區(qū)中取出數(shù)據(jù),處理完成后再取一幀,如此進(jìn)行下去。在河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說明書 9 取數(shù)據(jù)時(shí),前一幀與后一幀的交疊部分稱為幀移。在對(duì)語(yǔ)音信號(hào)進(jìn)行短時(shí)分析的過程中,信號(hào)流的處理用分段或分幀來實(shí)現(xiàn)。分幀既可連續(xù),也可采用交疊分段的方法,用可移動(dòng)的有限長(zhǎng)度窗口進(jìn)行加權(quán)的方法來實(shí)現(xiàn)。這樣就可以采用平穩(wěn)過程的分析處理方法來處理了。其一般式為 ????? ??? mn mnwmxTQ )()]([,其中T[*]表示某種運(yùn)算 {x(m)}為輸入信號(hào)序列。本文主要采用哈明窗,其公式為: ? ?????????????? ? ???其他nLnL mnw,0~0,1 12c o )( ? (22) 其中 L 是窗長(zhǎng)。然而,不同人的基音周期變化范圍很大,從女性兒童的 2ms到老年男子的 14ms(即基音頻率為 50~ 70Hz),所以 L 的選擇比較困難。 語(yǔ)音信號(hào)的時(shí)域分析 對(duì)信號(hào)分析最自然最直接的方法是以時(shí)間為自變量進(jìn)行分析,語(yǔ)音信號(hào)典型的時(shí)域特征包括短時(shí)能量、短時(shí)平均過零率、短時(shí)自相關(guān)系數(shù)和短時(shí)平均幅度差。可以看出,短時(shí)能量可以看作語(yǔ)音信號(hào)的平方經(jīng)過一個(gè)線性濾波器的輸出,該線性濾波器的單位沖激響應(yīng)為 h(n),如圖 。 圖 “ 0”的短時(shí)能力函數(shù) 利用短時(shí)能量可以區(qū)分清音和濁音,因?yàn)闈嵋舻哪芰勘惹逡舻哪芰看蟮枚?;其次可以用短時(shí)能量對(duì)有聲段和無聲段進(jìn)行判定,對(duì)聲母和韻母分界,以及對(duì)連字分界等。 短時(shí)能量由于是對(duì)信號(hào)進(jìn)行平方運(yùn)算,因而認(rèn)為增加了高低信號(hào)之間的差距,因此要采用短時(shí)平均幅度來表示能量的變化,其公式為: ? ? ? ? ? ??? ?? ????? ??? 1Nn nm wmn mxmnwmxM (25) 如圖 “ 0”的短時(shí)平均幅度圖。 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說明書 11 圖 語(yǔ)音信號(hào)“ 0”的短時(shí)平均幅度 短時(shí)平均過零率是指每幀內(nèi)信號(hào)通過零值的次數(shù)。對(duì)于離散信號(hào),它實(shí)質(zhì)上是信號(hào)采樣點(diǎn)符號(hào)變化的次數(shù)。短時(shí)平均過零率公式為: ? ?? ? ? ?? ? ? ?? ?? ? ? ?? ?????????????????1 1s g ns g n211s g ns g n21Nnnm
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1