freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語(yǔ)音識(shí)別控制小車設(shè)計(jì)-文庫(kù)吧資料

2025-07-13 15:51本頁(yè)面
  

【正文】 D2 = realmax。 % 動(dòng)態(tài)規(guī)劃 for i = 2:n for j = 1:m D1 = D(i1,j)。 end end % 累積距離矩陣 D = ones(n,m) * realmax。 if(abs(nm)6) % 幀匹配距離矩陣 d = zeros(n,m)。程序如下:function[dist]=fDTW(t,r)n = size(t,1)。 最后利用最小值函數(shù)min,找到三個(gè)前續(xù)格點(diǎn)的累積距離的最小值作為累積距離,與當(dāng)前幀的匹配距離d(i,j)相加,作為當(dāng)前格點(diǎn)的累積距離。接下來(lái)進(jìn)行動(dòng)態(tài)規(guī)劃,為每個(gè)格點(diǎn)(i,j)都計(jì)算其三個(gè)可能的前續(xù)格點(diǎn)的累積距離DD2和D3。這里n和m為測(cè)試模板與參考模板的幀數(shù)。D(N,M)即為最佳匹配路徑所對(duì)應(yīng)的匹配距離。 167。如果有必要的話,通過(guò)逐點(diǎn)向前尋找就可以求得整條路徑。對(duì)于(ni,mi),其可達(dá)到該格點(diǎn)的前一個(gè)格點(diǎn)只可能是(n ,m )、(n ,m 1)和(n ,m 2),那么(n ,m )一定選擇這3個(gè)距離之路徑延伸而通過(guò)(n ,m ),這時(shí)此路徑的積累距離為: D[(n ,m )]=d[T(n ),R(m )]+D[(n , m )] 其中的n = n 1 ,m 1由下式?jīng)Q定: D[(n ,m )]=min{D[(n , m )],D[(n , m 1)],D[(n , m 2)]} 這樣可以從(n ,m )=(1,1)出發(fā)搜索(n ,m ),再搜索(n ,m ),……,對(duì)每一個(gè)(n ,m )都存儲(chǔ)相應(yīng)的前一格點(diǎn)(n ,m )及相應(yīng)的幀匹配距離d[n ,m ]。(n ),使得沿路徑的積累距離達(dá)到最小值,即: 搜索該路徑的方法如下:搜索從(n ,m )點(diǎn)出發(fā),可以展開(kāi)若干條滿足?的路徑,假設(shè)可計(jì)算每條路徑達(dá)到(n ,m )點(diǎn)時(shí)的總的積累距離,具有最小累積距離者即為最佳路徑。為了使路徑不至于過(guò)傾斜,~2的范圍內(nèi),如果路徑已經(jīng)通過(guò)了格點(diǎn)(n ,m ),那么下一個(gè)通過(guò)的格點(diǎn)(n ,m )只可能是下列三種情況之一: (n ,m )=(n +1,m +2) (n ,m )=(n +1,m +1) (n ,m )=(n +1,m ) 用r表示上述三個(gè)約束條件。(1)=1,216。路徑可以用函數(shù)m =216。路徑不是隨意選擇的,首先任何一種語(yǔ)音的發(fā)音快慢都有可能變化,但是其各部分的先后次序不可能改變,因此所選的路徑必定是從左下角出發(fā),在右上角結(jié)束。 如果把測(cè)試模板的各個(gè)幀號(hào)n=1~N在一個(gè)二維直角坐標(biāo)系中的橫軸上標(biāo)出,把參考模板的各幀號(hào)m=1~M在縱軸上標(biāo)出,通過(guò)這些表示幀號(hào)的整數(shù)坐標(biāo)畫(huà)出一些縱橫線即可形成一個(gè)網(wǎng)絡(luò),網(wǎng)絡(luò)中的每一個(gè)交叉點(diǎn)(n,m)表示測(cè)試模式中某一幀的交匯點(diǎn)。但是這樣的計(jì)算沒(méi)有考慮到語(yǔ)音中各個(gè)段在不同情況下的持續(xù)時(shí)間會(huì)產(chǎn)生或長(zhǎng)或短的變化,因此識(shí)別效果不可能最佳。 若N=M則可以直接計(jì)算,否則要考慮將T(n)和R(m)對(duì)齊。設(shè)n和m分別是T和R中任意選擇的幀號(hào),d[T(n),R(m)]表示這兩幀特征矢量之間的距離。D[T,R],距離越小則相似度越高。參考模板與測(cè)試模板一般采用相同類型的特征矢量(如MFCC,LPC系數(shù))、相同的幀長(zhǎng)、相同的窗函數(shù)和相同的幀移。已存入模板庫(kù)的各個(gè)詞條稱為參考模板,一個(gè)參考模板可表示為R={R(1),R(2),……,R(m),……,R(M)},m為訓(xùn)練語(yǔ)音幀的時(shí)序標(biāo)號(hào),m=1為起點(diǎn)語(yǔ)音幀,m=M為終點(diǎn)語(yǔ)音幀,因此M為該模板所包含的語(yǔ)音幀總數(shù),R(m)為第m幀的語(yǔ)音特征矢量。所以在孤立詞語(yǔ)音識(shí)別中,DTW算法仍然得到廣泛的應(yīng)用。 在孤立詞語(yǔ)音識(shí)別中,最為簡(jiǎn)單有效的方法是采用DTW(Dynamic Time Warping,動(dòng)態(tài)時(shí)間歸整)算法,該算法基于動(dòng)態(tài)規(guī)劃(DP)的思想,解決了發(fā)音長(zhǎng)短不一的模板匹配問(wèn)題,是語(yǔ)音識(shí)別中出現(xiàn)較早、較為經(jīng)典的一種算法。它需要在訓(xùn)練階段提供大量的語(yǔ)音數(shù)據(jù),通過(guò)反復(fù)計(jì)算才能得到參數(shù)模型,而DTW算法的訓(xùn)練中幾乎不需要額外的計(jì)算。HMM是一種用參數(shù)表示的,用于描述隨機(jī)過(guò)程統(tǒng)計(jì)特性的概率模型。 DTW算法原理目前,語(yǔ)音識(shí)別的匹配主要應(yīng)用HMM和DTW兩種算法。167。這里x為一幀語(yǔ)音信號(hào),n為計(jì)算LPC參數(shù)的階數(shù)。 用MATLAB實(shí)現(xiàn)LPC系數(shù)的計(jì)算本系統(tǒng)使用的特征參數(shù)是線性預(yù)測(cè)系數(shù)(LPC)。(5)舍去代表直流成分的,取作為MFCC參數(shù)。(3)計(jì)算的自然對(duì)數(shù),得到。對(duì)每幀序列進(jìn)行預(yù)加重處理后再經(jīng)過(guò)離散FFT變換,取模的平方得到離散功率譜。首先要通過(guò)FFT得到該幀信號(hào)的功率譜,轉(zhuǎn)換為Mel頻率下的功率譜。再將此N 個(gè)參數(shù)進(jìn)行余弦變換(cosine transform) 求出L 階的Mel scale cepstrum 參數(shù)。所以通常將加窗后的幀經(jīng)過(guò)快速傅立葉變換(FFT),求出每幀的頻譜參數(shù)。從目前使用的情況來(lái)看,在大詞匯量語(yǔ)音識(shí)別應(yīng)用中已逐漸取代原本常用的線性預(yù)測(cè)編碼導(dǎo)出的倒頻譜參數(shù),原因是它考慮了人類發(fā)聲與接收聲音的特性,具有更好的魯棒性。近年來(lái),一種能夠比較充分利用人耳這種特殊的感知特性的參數(shù)得到了廣泛的應(yīng)用,這就是Mel尺度倒譜參數(shù)(Melscaled Cepstrum Coefficient),或稱Mel頻率倒譜系數(shù),簡(jiǎn)稱為MFCC。這種參數(shù)沒(méi)有充分利用人耳的聽(tīng)覺(jué)特性。序列x(n)及其復(fù)倒譜系數(shù)c(n)的遞推公式如下:…………………………………LPCC參數(shù)是一種非常重要的參數(shù),它不是由原始信號(hào)x(n)得到,而是由LPC系數(shù)得到的。LPC 倒譜系數(shù)是描述說(shuō)話人聲道特性的,廣泛應(yīng)用于聲紋識(shí)別。倒譜實(shí)際上是一種同態(tài)信號(hào)處理方法,標(biāo)準(zhǔn)的倒譜系數(shù)計(jì)算流程需要進(jìn)行FFT變換,對(duì)數(shù)操作和相位校正等步驟,運(yùn)算比較復(fù)雜。通常x為240點(diǎn)或256點(diǎn)的數(shù)據(jù),n取10~12,對(duì)語(yǔ)音識(shí)別來(lái)說(shuō)就已經(jīng)足夠。在MATLAB中利用lpc函數(shù)計(jì)算LPC系數(shù),其語(yǔ)法為:a = lpc(x,n)。求解該方程組,就可以得到系統(tǒng)的線性預(yù)測(cè)系數(shù)。因此僅用12個(gè)LPC系數(shù)就能很好地表示復(fù)雜語(yǔ)音信號(hào)的特征,這就大大降低了信號(hào)的冗余度并有效地減少了計(jì)算量和存儲(chǔ)量,使之成為語(yǔ)音識(shí)別和語(yǔ)音壓縮的基礎(chǔ)。一般情況下,極點(diǎn)的個(gè)數(shù)在12~16之間,就可以足夠清晰地描述語(yǔ)音信號(hào)的特征了。由于發(fā)音器官不可能毫無(wú)規(guī)律地快速變化,因此語(yǔ)音信號(hào)是準(zhǔn)穩(wěn)定的(quasi steady)。語(yǔ)音信號(hào)是一種典型的時(shí)變信號(hào),然而如果把觀察時(shí)間縮短到十毫秒至幾十毫秒,則可以得到一系列近似穩(wěn)定的信號(hào)。線性預(yù)測(cè)(Linear Prediction)分析是最有效的語(yǔ)音分析技術(shù)之一,在語(yǔ)音編碼、語(yǔ)音合成、語(yǔ)音識(shí)別和說(shuō)話人識(shí)別等語(yǔ)音信號(hào)處理領(lǐng)域中得到了廣泛的應(yīng)用。常見(jiàn)的有三種:(1)線形預(yù)測(cè)系數(shù)特征矢量(LPC)(2)LPC倒譜特征矢量(LPCC)(3)Mel倒譜系數(shù)(MFCC)1. 線性預(yù)測(cè)系數(shù)(LPC)這里我采用最簡(jiǎn)單的一種線形預(yù)測(cè)系數(shù)特征矢量(LPC)。 特征參數(shù)提取167。 再根據(jù)背景噪聲的過(guò)零率和音量積設(shè)定一個(gè)比TH 稍低的門限T L , 如果信號(hào)的能量大于 TL ,則所對(duì)應(yīng)的端點(diǎn)C、 D 之間仍是語(yǔ)音信號(hào),至此完成了第二級(jí)判斷。這里我對(duì)端點(diǎn)進(jìn)行了兩級(jí)判斷。 用過(guò)零率和音量積譜來(lái)檢測(cè)端點(diǎn)端點(diǎn)檢測(cè)算法常用的是由語(yǔ)音能量和過(guò)零率組合的有雙門限法,以及短時(shí)能量和過(guò)零率的乘積構(gòu)成的能頻值法。圖24展示了過(guò)零譜、音量譜和過(guò)零率和能量成績(jī)構(gòu)成的譜線。 過(guò)零率和音量積譜通常利用短時(shí)能量來(lái)檢測(cè)濁音,用過(guò)零率來(lái)檢測(cè)清音,兩者配合實(shí)現(xiàn)可靠的端點(diǎn)檢測(cè)。這里將每幀的幅度絕對(duì)值之和作為每一幀的總能量大小。 音量能量或者音量代表聲音的大小,可由聲音訊號(hào)的震幅來(lái)類比,又稱為能量(Energy)或強(qiáng)度(Intensity)等??梢钥闯?,平移后,話音可以很容易從噪音中區(qū)分開(kāi)來(lái)。一半情況下,噪聲的波形和聲音波形相比幅度非常小,為了排除噪聲對(duì)過(guò)零率產(chǎn)生的影響,我將聲音的原始譜向上平移,使得噪聲的過(guò)零點(diǎn)影響大大減小。 過(guò)零率過(guò)零率(Zero Crossing Rate)是在每個(gè)音框中,音訊通過(guò)零點(diǎn)的次數(shù)。因此, 端點(diǎn)檢測(cè)的效率、 質(zhì)量在語(yǔ)音處理系統(tǒng)中顯得至關(guān)重要。研究表明,即使是在安靜的環(huán)境下,語(yǔ)音識(shí)別系統(tǒng)一半以上的錯(cuò)誤可能主要來(lái)基于MTLAB編寫(xiě)的語(yǔ)音端點(diǎn)檢測(cè)程序。 端點(diǎn)檢測(cè)所謂端點(diǎn)檢測(cè),就是在實(shí)時(shí)輸入的聲音信號(hào)中,區(qū)分背景噪聲和環(huán)境噪聲,準(zhǔn)確地判斷出聲音信號(hào)的開(kāi)始點(diǎn)和結(jié)束點(diǎn)。語(yǔ)音信號(hào)是瞬時(shí)變化的,但在10~(n)以1024點(diǎn)為一幀進(jìn)行處理,幀移為512個(gè)采樣點(diǎn)。167。 欲加重處理預(yù)加重的目的在于濾除低頻干擾,尤其是50Hz或60Hz的工頻干擾,將對(duì)于語(yǔ)音識(shí)別更為有用的高頻部分的頻譜進(jìn)一步提升。167。, 8 bits/sample 本設(shè)計(jì)單次采樣總數(shù)為50000點(diǎn),采樣率為22000HZ。, 16 bits/sample(4) 39。, 16 bits/sample(3) 39。 (default value), 16 bits/sample(2) 39?!痙type’代表采樣數(shù)據(jù)的存儲(chǔ)類型,MATLA
點(diǎn)擊復(fù)制文檔內(nèi)容
職業(yè)教育相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1