freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于dtw算法的語(yǔ)音識(shí)別原理與實(shí)現(xiàn)-展示頁(yè)

2025-07-04 01:26本頁(yè)面
  

【正文】 窗口的選擇非常重要,不同的窗口將使能量的平均結(jié)果不同。用的最多的三種為矩形窗、漢明窗(Hamming)和漢寧窗(Hanning)。預(yù)加重濾波器在Matlab中可由語(yǔ)句x=filter([],1,x)實(shí)現(xiàn)。其目的是濾除低頻干擾,特別是50Hz到60Hz的工頻干擾,將對(duì)語(yǔ)音識(shí)別更為有用的高頻部分進(jìn)行頻譜提升。 預(yù)加重對(duì)于語(yǔ)音信號(hào)的頻譜,通常是頻率越高幅值越小,在語(yǔ)音信號(hào)的頻率增加兩倍時(shí),其功率譜的幅度下降6dB。在Matlab環(huán)境中的分幀最常用的方法是使用函數(shù)enframe(x,len,inc),其中x為語(yǔ)音信號(hào),len為幀長(zhǎng),inc為幀移。分幀小能清楚地描繪語(yǔ)音信號(hào)的時(shí)變特征但計(jì)算量大;分幀大能減少計(jì)算量但相鄰幀間變化不大,容易丟失信號(hào)特征。但研究發(fā)現(xiàn),語(yǔ)音信號(hào)在短時(shí)間內(nèi)頻譜特性保持平穩(wěn),即具有短時(shí)平穩(wěn)特性。第(I)幅圖為完整的語(yǔ)音波形,第(II)、(III)幅圖分別為語(yǔ)音的起始部分和結(jié)束部分的放大波形圖。 語(yǔ)音信號(hào)采集在Matlab環(huán)境中語(yǔ)音信號(hào)的采集可使用wavrecord(n,fs,ch,dtype)函數(shù)錄制,也可使用Windows的“錄音機(jī)”(file) 函數(shù)讀入。2 語(yǔ)音信號(hào)預(yù)處理語(yǔ)音信號(hào)的預(yù)處理模塊一般包括預(yù)濾波、采樣和量化、分幀、加窗、預(yù)加重、端點(diǎn)檢測(cè)等。圖11 語(yǔ)音識(shí)別系統(tǒng)原理框圖本文所描述的語(yǔ)音識(shí)別系統(tǒng)(下稱(chēng)本系統(tǒng))將對(duì)數(shù)字0~9共10段參考語(yǔ)音進(jìn)行訓(xùn)練并建立模板庫(kù),之后將對(duì)多段測(cè)試語(yǔ)音進(jìn)行識(shí)別測(cè)試。在識(shí)別階段,語(yǔ)音信號(hào)經(jīng)過(guò)相同的通道得到語(yǔ)音參數(shù),生成測(cè)試模板,與參考模板進(jìn)行匹配,將匹配分?jǐn)?shù)最高的參考模板作為識(shí)別結(jié)果。經(jīng)過(guò)預(yù)處理的語(yǔ)音數(shù)據(jù)就可以進(jìn)行特征參數(shù)提取。由于語(yǔ)音信號(hào)是一種典型的非平穩(wěn)信號(hào),加之呼吸氣流、外部噪音、電流干擾等使得語(yǔ)音信號(hào)不能直接用于提取特征,而要進(jìn)行前期的預(yù)處理。1 語(yǔ)音識(shí)別系統(tǒng)概述語(yǔ)音識(shí)別系統(tǒng)的典型原理框圖[1,910]如圖11所示。雖然HMM模型和ANN在連續(xù)語(yǔ)音大詞匯量語(yǔ)音識(shí)別系統(tǒng)優(yōu)于DTW,但由于DTW算法計(jì)算量較少、無(wú)需前期的長(zhǎng)期訓(xùn)練,也很容易將DTW算法移植到單片機(jī)、DSP上實(shí)現(xiàn)語(yǔ)音識(shí)別且能滿(mǎn)足實(shí)時(shí)性[7]要求,故其在孤立詞語(yǔ)音識(shí)別系統(tǒng)中仍然得到了廣泛的應(yīng)用。常見(jiàn)的語(yǔ)音識(shí)別方法有動(dòng)態(tài)時(shí)間歸整技術(shù)(DTW)、矢量量化技術(shù)(VQ)、隱馬爾可夫模型(HMM)、基于段長(zhǎng)分布的非齊次隱馬爾可夫模型(DDBHMM)和人工神經(jīng)元網(wǎng)絡(luò)(ANN)[1,9]。具有代表性的研究單位為清華大學(xué)電子工程系與中科院自動(dòng)化研究所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室,中科院聲學(xué)所等[9]。先后取得了線性預(yù)測(cè)分析(LP)、動(dòng)態(tài)時(shí)間歸整(DTW)、矢量量化(VQ)、隱馬爾可夫模型(HMM)等一系列關(guān)鍵技術(shù)的突破和以IBM的ViaVoice、Microsoft的VoiceExpress[9]為代表的一批顯著成果。在PDA、智能手機(jī)、智能家電、工業(yè)現(xiàn)場(chǎng)、智能機(jī)器人等方面語(yǔ)音識(shí)別技術(shù)都有著廣闊的前景。語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程把人類(lèi)的語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù),屬于多維模式識(shí)別和智能計(jì)算機(jī)接口的范疇[1]。 MFCC parameter。[關(guān)鍵字]語(yǔ)音識(shí)別;端點(diǎn)檢測(cè);MFCC系數(shù);DTW算法[中圖分類(lèi)號(hào)]  [文獻(xiàn)標(biāo)識(shí)碼]APrinciple and Realization of Speech Recognition Based on DTW AlgorithmAbstract With an example of the realization of a 0~9 identifiable speech recognition system, the paper described the basic principles and key technologies of isolated word speech recognition based on DTW algorithm, including method of endpoint detection, calculation of characteristic parameters, and implementation of DTW algorithm. Programming method under Matlab and experimental results are given at the end of the paper. Keyword speech recognition。基于DTW算法的語(yǔ)音識(shí)別原理與實(shí)現(xiàn)基于DTW算法的語(yǔ)音識(shí)別原理與實(shí)現(xiàn)[摘 要]以一個(gè)能識(shí)別數(shù)字0~9的語(yǔ)音識(shí)別系統(tǒng)的實(shí)現(xiàn)過(guò)程為例,闡述了基于DTW算法的特定人孤立詞語(yǔ)音識(shí)別的基本原理和關(guān)鍵技術(shù)。其中包括對(duì)語(yǔ)音端點(diǎn)檢測(cè)方法、特征參數(shù)計(jì)算方法和DTW算法實(shí)現(xiàn)的詳細(xì)討論,最后給出了在Matlab下的編程方法和實(shí)驗(yàn)結(jié)果。 endpoint detection。 DTW algorithm0 引言自計(jì)算機(jī)誕生以來(lái),通過(guò)語(yǔ)音與計(jì)算機(jī)交互一直是人類(lèi)的夢(mèng)想,隨著計(jì)算機(jī)軟硬件和信息技術(shù)的飛速發(fā)展,人們對(duì)語(yǔ)音識(shí)別功能的需求也更加明顯和迫切。傳統(tǒng)的鍵盤(pán)、鼠標(biāo)等輸入設(shè)備的存在大大妨礙了系統(tǒng)的小型化[10],而成熟的語(yǔ)音識(shí)別技術(shù)可以輔助甚至取代這些設(shè)備。語(yǔ)音識(shí)別技術(shù)起源于20世紀(jì)50年代,以貝爾實(shí)驗(yàn)室的Audry系統(tǒng)為標(biāo)志[1,8]。國(guó)內(nèi)的語(yǔ)音識(shí)別起步較晚,1
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1