freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音識別技術(shù)人工智能方面的論文-在線瀏覽

2024-08-04 18:15本頁面
  

【正文】 與四川話兩 種語言,達(dá)到實(shí)用要求。通過該系統(tǒng)觀眾與“熊貓”自然對話可以了解熊貓的生活習(xí)慣、生理結(jié)構(gòu)等信息,其形 式生動(dòng)、活潑,吸引了大量的學(xué)生與參觀者。 (1)基于語音學(xué)和聲學(xué)的方法  該方法起步較早,在語音識別技術(shù)提出的開始,就有了這方面的研究,但由于其模型及語音知識過于復(fù)雜,現(xiàn)階段沒有達(dá)到實(shí)用的階段。這樣該方法分為兩步實(shí)現(xiàn):   第一步,分段和標(biāo)號   把語音信號按時(shí)間分成離散的段,每段對應(yīng)一個(gè)或幾個(gè)語音基元的聲學(xué)特性。 (2)模板匹配的方法  模板匹配的方法發(fā)展比較成熟,目前已達(dá)到了實(shí)用階段。常用的技術(shù)有三種:動(dòng)態(tài)時(shí)間規(guī)整(DTW)、隱馬爾可夫(HMM)理論、矢量量化(VQ)技術(shù)。所謂端點(diǎn)檢測就是在語音信號中的各種段落(如音素、音節(jié)、詞素)的始點(diǎn)和終點(diǎn)的位置,從語音信號中排除無聲段。但效果往往不明顯。算法的思想就是把未知量均勻的升長或縮短,直到與參考模式的長度一致。   隱馬爾可夫法(HMM)   隱馬爾可夫法(HMM)是70年代引入語音識別理論的,它的出現(xiàn)使得自然語音識別系統(tǒng)取得了實(shí)質(zhì)性的突破。HMM是對語音信號的時(shí)間序列結(jié)構(gòu)建立統(tǒng)計(jì)模型,將之看作一個(gè)數(shù)學(xué)上的雙重隨機(jī)過程:一個(gè)是用具有有限狀態(tài)數(shù)的Markov鏈來模擬語音信號統(tǒng)計(jì)特性變化的隱含的隨機(jī)過程,另一個(gè)是與Markov鏈的每一個(gè)狀態(tài)相關(guān)聯(lián)的觀測序列的隨機(jī)過程。人的言語過程實(shí)際上就是一個(gè)雙重隨機(jī)過程,語音信號本身是一個(gè)可觀測的時(shí)變序列,是由大腦根據(jù)語法知識和言語需要(不可觀測的狀態(tài))發(fā)出的音素的參數(shù)流。   矢量量化(VQ)   矢量量化(VectorQuantization)是一種重要的信號壓縮方法。其過程是:將語音信號波形的k個(gè)樣點(diǎn)的每一幀,或有k個(gè)參數(shù)的每一參數(shù)幀,構(gòu)成k維空間中的一個(gè)矢量,然后對矢量進(jìn)行量化。矢量量化器的設(shè)計(jì)就是從大量信號樣本中訓(xùn)練出好的碼書,從實(shí)際效果出發(fā)尋找到好的失真測度定義公式,設(shè)計(jì)出最佳的矢量量化系統(tǒng),用最少的搜索和計(jì)算失真的運(yùn)算量,實(shí)現(xiàn)最大可能的平均信噪比。   在實(shí)際的應(yīng)用過程中,人們還研究了多種降低復(fù)雜度的方法,這些方法大致可以分為兩類:無記憶的矢量量化和有記憶的矢量量化。 (3)神經(jīng)網(wǎng)絡(luò)的方法  利用人工神經(jīng)網(wǎng)絡(luò)的方法是80年代末期提出的一種新的語音識別方法。但由于存在訓(xùn)練、識別時(shí)間太長的缺點(diǎn),目前仍處于實(shí)驗(yàn)探索階段。 六、語音識別系統(tǒng)的結(jié)構(gòu)  一個(gè)完整的基于統(tǒng)計(jì)的語音識別系統(tǒng)可大致分為三部分:   (1)語音信號預(yù)處理與特征提取。   (3)語言模型與語言處理、 (1)語音信號預(yù)處理與特征提取  選擇識別單元是語音識別研究的第一步。   單詞(句)單元廣泛應(yīng)用于中小詞匯語音識別系統(tǒng),但不適合大詞匯系統(tǒng),原因在于模型庫太龐大,訓(xùn)練模型任務(wù)繁重,模型匹配算法復(fù)雜,難以滿足實(shí)時(shí)性要求。因此,對于中、大詞匯量漢語語音識別系統(tǒng)來說,以音節(jié)為識別單元基本是可行的。原因在于漢語音節(jié)僅由聲母(包括零聲母有22個(gè))和韻母(共有28個(gè))構(gòu)成,且聲韻母聲學(xué)特性相差很大。由于協(xié)同發(fā)音的影響,音素單元不穩(wěn)定,所以如何獲得穩(wěn)定的音素單元,還有待研究。特征參數(shù)提取的目的是對語音信號進(jìn)行分析處理,去掉與語音識別無關(guān)的冗余信息,獲得影響語音識別的重要信息,同時(shí)對語音信號進(jìn)行壓縮。語音信號包含了大量各種不同的信息,提取哪些信息,用哪種方式提取,需要綜合考慮各方面的因素,如成本,性能,響應(yīng)時(shí)間,計(jì)算量等。   線性預(yù)測(LP)分析技術(shù)是目前應(yīng)用廣泛的特征參數(shù)提取技術(shù),許多成功的應(yīng)用系統(tǒng)都采用基于LP技術(shù)提取的倒譜參數(shù)。   Mel參數(shù)和基于感知線性預(yù)測(PLP)分析提取的感知線性預(yù)測倒譜,在一定程度上模擬了人耳對語音的處理特點(diǎn),應(yīng)用了人耳聽覺感知方面的一些研究成果。從目前使用的情況來看,梅爾刻度式倒頻譜參數(shù)已逐漸取代原本常用的線性預(yù)測編碼導(dǎo)出的倒頻譜參數(shù),原因是它考慮了人類發(fā)聲與接收聲音的特性,具有更好的魯棒性(Robustness)。 (2)聲學(xué)模型與模式匹配  聲學(xué)模型通常是將獲取的語音特征使用訓(xùn)練算法進(jìn)行訓(xùn)練后產(chǎn)生。   
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1