freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音識別技術(shù)人工智能方面的論文(留存版)

2025-08-08 18:15上一頁面

下一頁面
  

【正文】 統(tǒng)可大致分為三部分:   (1)語音信號預(yù)處理與特征提取。   線性預(yù)測(LP)分析技術(shù)是目前應(yīng)用廣泛的特征參數(shù)提取技術(shù),許多成功的應(yīng)用系統(tǒng)都采用基于LP技術(shù)提取的倒譜參數(shù)。由單個調(diào)母或由聲母與調(diào)母拼音成為音節(jié)。在此方面,微軟公司的研究人員率先取得了突破性進展,他們使用深層神經(jīng)網(wǎng)絡(luò)模型(DNN)后,語音識別錯誤率降低了30%,是近20年來語音識別技術(shù)方面最快的進步?! 、淡h(huán)境噪聲和干擾對語音識別有嚴重影響,致使識別率低。   語音識別技術(shù)發(fā)展到今天,特別是中小詞匯量非特定人語音識別系統(tǒng)識別精度已經(jīng)大于98%,對特定人語音識別系統(tǒng)的識別精度就更高。就像在60年代,誰又能預(yù)測今天超大規(guī)模集成電路技術(shù)會對我們的社會產(chǎn)生這么大的影響。特征方法有從倒譜矢量中減去其長時平均值和RASTA濾波,模型方法有倒譜平移。 ?、痴Z音的模糊性。目前比較成功的語言模型通常是采用統(tǒng)計語法的語言模型與基于規(guī)則語法結(jié)構(gòu)命令語言模型。必須根據(jù)不同語言的特點、識別系統(tǒng)詞匯量的大小決定識別單元的大小。特征參數(shù)提取的目的是對語音信號進行分析處理,去掉與語音識別無關(guān)的冗余信息,獲得影響語音識別的重要信息,同時對語音信號進行壓縮。 (3)神經(jīng)網(wǎng)絡(luò)的方法  利用人工神經(jīng)網(wǎng)絡(luò)的方法是80年代末期提出的一種新的語音識別方法。算法的思想就是把未知量均勻的升長或縮短,直到與參考模式的長度一致。研發(fā)的5000詞郵包校核非特定人連續(xù)語音識別系統(tǒng)的識別率達到98.73%,前三選識別率達99.96%;并且可以識別普通話與四川話兩 種語言,達到實用要求。這是世界上第1個高性能的非特定人、大詞匯量、連續(xù)語音識別系統(tǒng)。語音技術(shù)的應(yīng)用已經(jīng)成為一個具有競爭性的新興高技術(shù)產(chǎn)業(yè)。以語音識別技術(shù)開發(fā)出的產(chǎn)品應(yīng)用領(lǐng)域非常廣泛,如聲控電話交換、信息網(wǎng)絡(luò)查詢、家庭服務(wù)、賓館服務(wù)、醫(yī)療服務(wù)、銀行服務(wù)、工業(yè)控制、語音通信系統(tǒng)等,幾乎深入到社會的每個行業(yè)和每個方面。四.國內(nèi)研究歷史及現(xiàn)狀我國語音識別研究工作起步于五十年代,但近年來發(fā)展很快。在模板匹配方法中,要經(jīng)過四個步驟:特征提取、模板訓(xùn)練、模板分類、判決。與HMM相比,矢量量化主要適用于小詞匯量、孤立詞的語音識別中。   音節(jié)單元多見于漢語語音識別,主要因為漢語是單音節(jié)結(jié)構(gòu)的語言,而英語是多音節(jié),并且漢語雖然有大約1300個音節(jié),但若不考慮聲調(diào),約有408個無調(diào)音節(jié),數(shù)量相對較少。   也有研究者嘗試把小波分析技術(shù)應(yīng)用于特征提取,但目前性能難以與上述技術(shù)相比,有待進一步研究。   目前常用的聲學(xué)模型基元為聲韻母、音節(jié)或詞,根據(jù)實現(xiàn)目的不同來選取不同的基元。目前,國外的應(yīng)用一直以蘋果的siri為龍頭。解決辦法按針對語音特征的方法(以下稱特征方法)和模型調(diào)整的方法(以下稱模型方法)分為兩類。人們可以通過電話網(wǎng)絡(luò)用語音識別口語對話系統(tǒng)查詢有關(guān)的機票、旅游、銀行信息,并且取得很好的結(jié)果。   可以預(yù)測在近五到十年內(nèi),語音識別系統(tǒng)的應(yīng)用將更加廣泛。后者是利用少量的自適應(yīng)語料來修正或變換原有的說話人無關(guān)(SI)模型,從而使其成為說話人自適應(yīng)(SA)模型。八.語音識別主要有以下五個問題: ?、睂ψ匀徽Z言的識別和理解。   基于統(tǒng)計的語音識別模型常用的就是HMM模型λ(N,M,π,A,B),涉及到HMM模型的相關(guān)理論包括模型的結(jié)構(gòu)選取、模型的初始化、模型參數(shù)的重估以及相應(yīng)的識別算法等。在識別時將輸入的語音特征同聲學(xué)模型(模式)進行匹配與比較,得到最佳的識別結(jié)果。   音素單元以前多見于英語語音識別的研究中,但目前中、大詞匯量漢語語音識別系統(tǒng)也在越來越多地采用。量化時,將k維無限空間劃分為M個區(qū)域邊界,然后將輸入矢量與這些邊界進行比較,并被量化為“距離”最小的區(qū)域邊界的中心矢量值。   動態(tài)時間規(guī)整(DTW)   語音信號的端點檢測是進行語音識別中的一個基本步驟,它是特征訓(xùn)練和識別的基礎(chǔ)。從1987年開始執(zhí)行國家863計劃后,國家863智 能計算機專家組為語音識別技術(shù)研究專門立項,每兩年滾動一次。1959年,Rorgie和Forge采用數(shù)字計算機識別英
點擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1