freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語(yǔ)音識(shí)別輸入系統(tǒng)設(shè)計(jì)-在線(xiàn)瀏覽

2025-07-10 21:03本頁(yè)面
  

【正文】 , Rie 和 Fe 采用數(shù)字計(jì)算機(jī)識(shí)別英文元音和孤立詞,從此開(kāi)始了計(jì)算機(jī)語(yǔ)音識(shí)別。 60 年代末、 70 年代初的重要成果是提出了信號(hào)線(xiàn)性預(yù)測(cè)編碼 (LPC)技術(shù)和動(dòng)態(tài)時(shí)間規(guī)整 (DTW)技術(shù),有效地解決了語(yǔ)音信號(hào)的特征提取和不等長(zhǎng)語(yǔ)音匹配問(wèn)題 ; 同時(shí)提出了矢量量化 (VQ)和隱馬爾可夫模型 (HMM)理論。 1988 年, FULEE Kai 等用 VQ/IIMM 方法實(shí)現(xiàn)了 997 個(gè)詞匯的非特定 人連續(xù)語(yǔ)音識(shí)別系統(tǒng) SPHINX。 進(jìn) 入 90 年代后,語(yǔ)音識(shí)別技術(shù)進(jìn)一步成熟,并開(kāi)始向市場(chǎng)提供產(chǎn)品。T、 Microsoft 等公司都為語(yǔ)音識(shí)別系統(tǒng)的實(shí)用化開(kāi)發(fā)研究投以巨資。 IBM 開(kāi)發(fā)的 ViaVoice 和 Microsoft 開(kāi)發(fā)的中文識(shí)別引擎都具有了相當(dāng)高的漢語(yǔ)語(yǔ)音識(shí)別水平。基于語(yǔ)音識(shí)別 芯片的嵌入式產(chǎn)品也越來(lái)越多,如 Sensory 公司的 RSC 系列語(yǔ)音識(shí)別芯片、 Infineon 公司的 Unispeech 和 Unilite 語(yǔ)音芯片等,這些芯片在嵌入式硬件開(kāi)發(fā)中得到了廣泛的應(yīng)用。 我國(guó)語(yǔ)音識(shí)別研究一直緊跟國(guó)際水平,國(guó)家也很重視。 國(guó)家 863 智能計(jì)算機(jī)專(zhuān)家組為語(yǔ)音識(shí)別技術(shù)研究專(zhuān)門(mén)立項(xiàng),并取得了高水平的科研成果。 語(yǔ)音識(shí)別系統(tǒng)的分類(lèi) 語(yǔ)音識(shí)別系統(tǒng)可以根據(jù)對(duì)輸入語(yǔ)音的限制加以分類(lèi)。僅考慮對(duì)于專(zhuān)人的話(huà)音進(jìn)行識(shí)別。識(shí)別的語(yǔ)音與人無(wú)關(guān),通常要用大量不同 畢業(yè)設(shè)計(jì)(論文)報(bào)告紙 共 50 頁(yè) 第 5 頁(yè) ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 裝 ┊ ┊ ┊ ┊ ┊ 訂 ┊ ┊ ┊ ┊ ┊ 線(xiàn) ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 人的語(yǔ)音數(shù)據(jù)庫(kù)對(duì)識(shí)別系統(tǒng)進(jìn)行學(xué)習(xí)。通常能識(shí) 別一組人的語(yǔ)音,或者成為特定組語(yǔ)音識(shí)別系統(tǒng),該系統(tǒng)僅要求對(duì)要識(shí)別的那組人的語(yǔ)音進(jìn)行訓(xùn)練。孤立詞識(shí)別系統(tǒng)要求輸入每個(gè)詞后要停頓。連接詞輸入系統(tǒng)要求對(duì)每個(gè)詞都清楚發(fā)音,一些連音現(xiàn)象開(kāi)始出現(xiàn)。連續(xù)語(yǔ)音輸入是自然流利的連續(xù)語(yǔ)音輸入,大量連音和變音會(huì)出現(xiàn)。通常包括幾十個(gè)詞的語(yǔ)音識(shí)別系統(tǒng)。通常包括幾百個(gè)詞到上千個(gè)詞的識(shí)別系統(tǒng)。通常包括幾千到幾萬(wàn)個(gè)詞的語(yǔ)音識(shí)別系統(tǒng)。目前是中等詞匯量的識(shí)別系統(tǒng),將來(lái)可能就是小詞匯量的語(yǔ)音識(shí)別系統(tǒng)。 語(yǔ)音識(shí)別系統(tǒng)的基本原理 目 前,大多數(shù)語(yǔ)音識(shí)別系統(tǒng)都采用了模式匹配的原理。圖 11 是基于模式匹配原理的自動(dòng)語(yǔ)音識(shí)別系統(tǒng)方框圖。預(yù)處理包括語(yǔ)音信號(hào)采樣、反混疊帶通濾波、去除個(gè)體發(fā)音差異和設(shè)備、環(huán)境引起的噪聲影響等,并涉及到語(yǔ)音識(shí)別基元的選取和端點(diǎn)檢測(cè)問(wèn)題,有時(shí)還包括模數(shù)轉(zhuǎn)換器。訓(xùn)練在識(shí)別之前進(jìn)行, 是通過(guò)讓講話(huà)者多次重復(fù)語(yǔ)音,從原始語(yǔ)音樣本中去除冗余信息,保留關(guān)鍵數(shù)據(jù),再按語(yǔ)音輸入 預(yù)處理 特征提取 模式匹配 判別規(guī)則 模板庫(kù) 訓(xùn)練練 識(shí)別 識(shí)別結(jié)果 畢業(yè)設(shè)計(jì)(論文)報(bào)告紙 共 50 頁(yè) 第 6 頁(yè) ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 裝 ┊ ┊ ┊ ┊ ┊ 訂 ┊ ┊ ┊ ┊ ┊ 線(xiàn) ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 一定規(guī)則對(duì)數(shù)據(jù)加以聚類(lèi),形成模式庫(kù)。 所以,模板庫(kù)的 廣大和清晰度是衡量模板庫(kù)的兩個(gè)標(biāo)準(zhǔn)。 語(yǔ)音識(shí) 別的基本構(gòu)成 語(yǔ)音識(shí)別系統(tǒng)的典型實(shí)現(xiàn)方案為:輸入的模擬語(yǔ)音信號(hào)首先要進(jìn)行預(yù)處理,包括預(yù)濾波,采樣和量化,加窗,端點(diǎn)處理,預(yù)加重等。對(duì)特征參數(shù)的要求是: 1) 提取的特征參數(shù)能有效的代表語(yǔ)音特征,具有良好的區(qū)分性。 3) 特征參數(shù)要計(jì)算方便,最好有高效的計(jì)算方法,以保證語(yǔ)音識(shí)別的實(shí)時(shí)實(shí)現(xiàn)。在識(shí)別階段,語(yǔ)音喜好經(jīng)過(guò)相同的通道的到語(yǔ)音參數(shù),生成測(cè)試模板,與參考模板進(jìn)行匹 配,將匹配分?jǐn)?shù)最高的模板作為識(shí)別結(jié)果,同時(shí),還可以在許多先驗(yàn)知識(shí)的幫助下,提高準(zhǔn)確率。 DTW和 VQ DTW 是較早的一種模式匹配和模型訓(xùn)練技術(shù) , 它應(yīng)用動(dòng)態(tài)規(guī)劃方法成功解決了語(yǔ)音信號(hào)特征參數(shù)序列比 較時(shí)時(shí)長(zhǎng)不等的難題 , 在孤立詞語(yǔ)音識(shí)別中獲得了良好 性能 。 VQ 技術(shù)從訓(xùn)練語(yǔ)音提取特征矢量 , 得到特征矢量集 , 通過(guò) LBG 算法生成碼本 ,在識(shí)別時(shí)從測(cè)試語(yǔ)音提取特征矢量序列 , 把它們與各個(gè)碼本進(jìn)行匹配 , 計(jì)算各自的平均量化誤差 , 選擇平均量化誤差最小的碼本 , 作為被識(shí)別的語(yǔ)音 。 HMM模型 HMM 模型是語(yǔ)音信號(hào)時(shí)變特征的有參表示法,它由相互關(guān)聯(lián)的兩個(gè)隨機(jī)過(guò)程共同描述信號(hào)的統(tǒng)計(jì)特性 ,其中一個(gè)是隱蔽的(不可觀(guān)測(cè)的)具有有限狀態(tài)的 Markov 鏈,另一個(gè)是與 Markov 鏈的每一狀態(tài)相關(guān)聯(lián)的觀(guān)察矢量的隨機(jī)過(guò)程(可觀(guān)測(cè)的)。這樣,語(yǔ)音時(shí)變信號(hào)某一段的特征就 畢業(yè)設(shè)計(jì)(論文)報(bào)告紙 共 50 頁(yè) 第 7 頁(yè) ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 裝 ┊ ┊ ┊ ┊ ┊ 訂 ┊ ┊ ┊ ┊ ┊ 線(xiàn) ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 由對(duì)應(yīng)狀態(tài)觀(guān)察符號(hào)的隨機(jī)過(guò)程描述, 而信號(hào)隨時(shí)間的變化由隱蔽 Markov 鏈的轉(zhuǎn)移概率描述。按照隨機(jī)函數(shù)的特點(diǎn), HMM 模型可分為離散隱馬爾可夫模型(采用離散概率密度函數(shù),簡(jiǎn)稱(chēng) DHMM)和連續(xù)隱馬爾可夫模型( 采用連續(xù)概率密度函數(shù),簡(jiǎn)稱(chēng) CHMM)以及半連續(xù)隱馬爾可夫模型( SCHMM)。 HMM 模型統(tǒng)一了語(yǔ)音識(shí)別中聲學(xué)層和語(yǔ)音學(xué)層的算法結(jié)構(gòu),以概率的形式將聲學(xué)層中得到的信息和語(yǔ)音學(xué)層中已有的信息完美地結(jié)合在一起,極大地增強(qiáng)了連續(xù)語(yǔ)音識(shí)別的效果。 語(yǔ)音學(xué)的研究表明,語(yǔ)音單位在詞中的長(zhǎng)度有一個(gè)相對(duì)平穩(wěn)的分布。它是一個(gè)非齊次的 HMM 語(yǔ)音識(shí)別模型,從非平穩(wěn)的角度考慮問(wèn)題 , 用狀態(tài)的段長(zhǎng)分布函數(shù)替代了齊次 HMM 中的狀態(tài)轉(zhuǎn)移矩陣,徹底拋棄了 “平穩(wěn)的假設(shè) ”,使模型成為一種基于狀態(tài)段長(zhǎng)分布的隱含 Markov模型。由于該模型解除了對(duì)語(yǔ)音信號(hào)狀態(tài)的齊次性和對(duì)語(yǔ)音特征的非相關(guān)性的限制,因此為語(yǔ)音識(shí)別研究的深入發(fā)展提供了一個(gè)和諧的框架。 ANN本質(zhì)上是一個(gè)自適應(yīng)非線(xiàn)性動(dòng)力學(xué)系統(tǒng),模擬了人類(lèi)神經(jīng)元活動(dòng)的原理,具有自學(xué)、聯(lián)想、對(duì)比、推理和概括能力 。因此 , 人們嘗試研究基于 HMM 和 ANN 的混合模型,把二者的優(yōu)點(diǎn)有機(jī)結(jié)合起來(lái),從而提高整個(gè)模型的魯棒性,這也是現(xiàn)在研究的一個(gè)熱點(diǎn)。另外,語(yǔ)音識(shí)別系統(tǒng)在商品化的進(jìn)程中還要解決諸如識(shí)別速度、拒識(shí)問(wèn)題以及關(guān)鍵詞(句)檢測(cè)等具體問(wèn)題,主要表現(xiàn)在兩個(gè)方面:一是對(duì)環(huán)境的依賴(lài)性強(qiáng)。目前可采用麥克風(fēng)陣列技術(shù)消除單一麥克對(duì)語(yǔ)音的影響,同時(shí)在預(yù)處理階段通過(guò)語(yǔ)音增強(qiáng)算法,使語(yǔ)音的可懂度和信噪比增強(qiáng)。隨著 HMM語(yǔ)音識(shí)別方法研究工作的深入,人們也越來(lái)越認(rèn)識(shí)到經(jīng)典 HMM 語(yǔ)音識(shí)別模型在一些重要方面存在嚴(yán)重的缺陷,既不符合語(yǔ)音信號(hào)的實(shí)際情況,又使得模型的訓(xùn)練量和存儲(chǔ)量太大。 第二章 語(yǔ)音信號(hào)的預(yù)處理 概述 畢業(yè)設(shè)計(jì)(論文)報(bào)告紙 共 50 頁(yè) 第 9 頁(yè) ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 裝 ┊ ┊ ┊ ┊ ┊ 訂 ┊ ┊ ┊ ┊ ┊ 線(xiàn) ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 語(yǔ)音信號(hào)分析是語(yǔ)音信號(hào)處理的前提和基礎(chǔ),只有分析出可表示語(yǔ)音信號(hào)特征的參數(shù),才能利用這些參數(shù)進(jìn)行高效的語(yǔ)音識(shí)別處理。語(yǔ)音信號(hào)從整體開(kāi)看其特征和表征其特征的參數(shù)是隨時(shí)間變化的,所以它是一個(gè)非平衡態(tài)過(guò)程,不能用處理平衡信號(hào)的數(shù)字處理技術(shù)對(duì)其進(jìn)行分析處理。 不論分析怎樣的參數(shù)即采用什么分析方法,在按幀進(jìn)行語(yǔ)音分析,提取語(yǔ)音參數(shù)之前,有一些經(jīng)常使用的,共同的短時(shí)分析技術(shù)必須預(yù)先進(jìn)行,如語(yǔ)音信號(hào)的數(shù)字化,語(yǔ)音信號(hào)的預(yù)加重,加窗和分幀。如,用 Wavread函數(shù)對(duì)語(yǔ)音信號(hào)進(jìn)行采樣,記錄采樣頻率和采樣點(diǎn)數(shù)。以本實(shí)驗(yàn)中的 10個(gè)輸入的語(yǔ)音訓(xùn)練文件中的 “”文件進(jìn)行操作,使其顯示 “”文件的波形圖,和其語(yǔ)音起始處和結(jié) 束處的放大波形圖 如圖 21。顯示原始波形圖 ……39。 t=0:1/fs:(length(k)1)/fs。plot(t,k)。 title(39。)。Time:s39。ylabel(39。)。顯示語(yǔ)音起始處放大波形圖 ……39。 t1=:1/fs:。 subplot(3,1,2)。 axis([,min(k),max(k)])。(II) “”語(yǔ)音起始處放大波形圖 39。 xlabel(39。)。Amplitude(normalized)39。 disp(39。)。k1=k(*fs:*fs)。plot(t1,k1)。 title(39。)。Time:s39。ylabel(39。)。但研究發(fā)現(xiàn),語(yǔ)音信號(hào)在短時(shí)間內(nèi)頻譜特性保持平穩(wěn),即具有短時(shí)平穩(wěn)特性。分幀小能清楚地描繪語(yǔ)音信號(hào)的時(shí)變特征但計(jì)算量大;分幀大能減少計(jì)算量但相鄰幀間變化不大,容易丟失信號(hào)特征。 在 Matlab 環(huán)境中的分幀最常用的方法是使用 Voicebox 工具箱中的函數(shù) enframe(x,len,inc),其中 x 為語(yǔ)音信號(hào), len 為幀長(zhǎng), inc 為幀移。在本系統(tǒng)中幀長(zhǎng)取 240,幀移取 80。 程序示例如下: i=wavread(??)。whos i y。39。 len=240。 y=enframe(i,len,inc)。 subplot(1,2,1),plot(i)。 顯示波形如圖 22: 0 0 . 5 1 1 . 5 2x 1 04 0 . 1 5 0 . 1 0 . 0 500 . 0 50 . 10 . 1 50 . 20 100 200 300 0 . 1 5 0 . 1 0 . 0 500 . 0 50 . 10 . 1 50 . 2 圖 22 信號(hào)的波形及分幀后的波形圖 預(yù)加重 由于語(yǔ)音信號(hào)的平均功率受聲門(mén)激勵(lì)和口鼻輻射影響,高頻端大約在 800Hz以上按 6dB/倍頻程跌落,非平坦的,要遭預(yù)處理中進(jìn)行預(yù)加重處理。預(yù)加重可以在數(shù)字化之前,也可之后。因此必須對(duì)高頻進(jìn)行加重處理,一般是將語(yǔ)音信號(hào)通過(guò)一個(gè)一 階高通濾波器 ,即為預(yù)加重濾波器。在計(jì)算短時(shí)能量之前將語(yǔ)音信號(hào)通過(guò)預(yù)加重濾波
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1