freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于語音識(shí)別的智能小車設(shè)計(jì)_畢業(yè)設(shè)計(jì)-在線瀏覽

2024-10-29 14:51本頁面
  

【正文】 進(jìn)行聲音錄入。 wavrecord 是 MATLAB 的專有聲音錄入函數(shù),他有一下三種調(diào)用方式: ( 1) y = wavrecord(n,Fs) ( 2) y = wavrecord(n,Fs,ch) ( 3) y = wavrecord(n,Fs,39。) 其中 n 代表聲音錄入的總采樣數(shù)。 ch 代表聲音錄入采用的通道數(shù),當(dāng) ch 為 1 時(shí)為單聲道,當(dāng) ch 為 2 時(shí)為立體聲。double39。single39。int1639。uint839。 即: y=wavrecord(50000,22020)。 聲音的預(yù)處理 167。在計(jì)算短時(shí)能量之前應(yīng)用該濾波器,還可以起到消除直流漂移、抑制隨機(jī)噪聲和提升清音部分能量的效果。 分幀處理 在計(jì)算各個(gè)系數(shù)之前要先將語音信號(hào)作分幀處理。 167。 在語音識(shí)別系統(tǒng)中 ,正確、有效地進(jìn)行端點(diǎn)檢測(cè)不僅可以減少計(jì)算量和縮短處理時(shí)間 ,而且能排除無聲段的噪聲干擾、提高語音識(shí)別的正確率。除此之外 , 在語音合成、 編碼等系統(tǒng)中 ,高效的端點(diǎn)檢測(cè)也直接影響甚至決定著系統(tǒng)的主要性能。 167。一般而言,噪聲的過零率大于氣音的過零率,而氣音的過零率又大于有聲音的過零率。如下,圖 21 展示了沒有平移前的過零譜圖,圖 22 展示了河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 7 平移后的過零譜圖。 0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0421012聲音波形0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 040200400600過零譜 圖 21 平移前的過零譜 0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0421012聲音波形0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 040204060過零譜 圖 22 平移后的過零譜 167。 話音的能量遠(yuǎn)比噪聲的能量要大,故可河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 8 用能量來區(qū)分是靜音還是由話音。音量譜 如圖 23 所示 : 0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0421012聲音波形0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0405001000音量譜 圖 23 音量譜 167。端點(diǎn)檢測(cè)算法常用的是由語音能量和過零率組合的有雙門限法,以及短時(shí)能量和過零率的乘積構(gòu)成的能頻值法。 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 9 0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 04202聲音波形0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 04050過零譜0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0405001000音量譜0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 04024x 1 04過零音量積譜 圖 24 過零音量積譜 167。這里采用的是第二種方法,通過能量和過零率的乘積構(gòu)成的能頻值來判斷語音的端點(diǎn)。首先根據(jù) 過零率和音量積 設(shè)定一個(gè)較高的門限 T H , 若譜大于 T H ,則可確定 2 個(gè)端點(diǎn) A、 B, 并可認(rèn)為這 2 個(gè)端點(diǎn)之間是語音信號(hào) , 這樣相當(dāng)于完成初判。 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 10 判斷結(jié) 果 如圖 25 所示 : 0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0421012聲音波形1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 2 . 1x 1 0421012語音波形 圖 25 端點(diǎn)檢測(cè)出的語音波形 167。 特征參數(shù)概述 對(duì)于特征參數(shù),有多種參數(shù)可供選取。 線性預(yù)測(cè)(Linear Prediction)分析是最有效的語音分析技術(shù)之一,在語音編碼、語音合成、語音識(shí)別和說話人識(shí)別等語音信號(hào)處理領(lǐng)域中得到了廣泛的應(yīng)用。 語音信號(hào)是一種典型的時(shí)變信號(hào),然而如果把觀察時(shí)間縮短到十毫秒至幾十毫秒,則可以得到一系列近似穩(wěn)定的信號(hào)。 由于發(fā)音器官不可能毫無規(guī)律地快速變化,因此語音信號(hào)是準(zhǔn)穩(wěn)定的(quasi steady)。一般情況下,極點(diǎn)的個(gè)數(shù)在 12~16 之間,就可以足夠清晰地描述語音信號(hào)的特征了。因此僅用 12個(gè) LPC 系數(shù)就能很好地表示復(fù)雜語音信號(hào)的特征,這就大大降低了信號(hào)的冗余度并有效地減少了計(jì)算量和存儲(chǔ)量,使之成為語音識(shí)別和語音壓縮的基礎(chǔ)。求解該方程組,就可以得到系統(tǒng)的線性預(yù)測(cè)系數(shù)。 在 MATLAB 中利用 lpc 函數(shù)計(jì)算 LPC 系數(shù),其語法為: a = lpc(x,n)。通常 x 為 240 點(diǎn)或256 點(diǎn)的數(shù)據(jù), n 取 10~12,對(duì)語音識(shí)別來說就已經(jīng)足夠。倒譜實(shí)際上是一種同態(tài)信號(hào)處理方法,標(biāo)準(zhǔn)的倒譜系數(shù)計(jì)算流程需要進(jìn)行 FFT 變換,對(duì)數(shù)操作和相位校正等步驟,運(yùn)算比較復(fù)雜。 LPC 倒譜系數(shù)是描述說話人聲道特性的,廣泛應(yīng)用于聲紋識(shí)別。 序列 x(n)及其復(fù)倒譜系數(shù) c(n)的遞推公式如下: 100 , 0() ( ) ( )? ( ) , 0( 0) ( 0)nknxn x n k x n kx k nx n x?????? ?? ???? ?????????????? LPCC 參數(shù)是一種非常重要的參數(shù),它不是由原始信號(hào) x(n)得到,而是由 LPC 系數(shù) ma 得到的。 20 logcG? ????????????????????????? 11 ,1mm m k m kk kc a c a m pm???? ? ? ?? ???????????????? 11 ,mm k m kk kc c a m pm?????? ?????????????????? 3. Mel 尺度 倒譜系數(shù) (MFCC) LPC 模型是基于發(fā)音模型建立的, LPCC 系數(shù)也是一種基于合成的參數(shù)。實(shí)際上,人的聽覺系 統(tǒng)是一個(gè)特殊河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 13 的非線性系統(tǒng),它響應(yīng)不同頻率信號(hào)的靈敏度是不同的,基本上是一個(gè)對(duì)數(shù)的關(guān)系。大量的研究表明, MFCC參數(shù)能夠比 LPCC 參數(shù)更好地提高系統(tǒng)的識(shí)別性能。由于語音信號(hào)在時(shí)域上的變化快速而不穩(wěn)定,所以通常都將它轉(zhuǎn)換到頻域上來觀察,此時(shí)它的頻譜會(huì)隨著時(shí)間作緩慢的變化。再將每幀的頻譜參數(shù)通過一組 N 個(gè)( N 一般為 20 ~ 30 個(gè))三角形帶通濾波器所組成的 Mel 頻率濾波器,將每個(gè)頻帶的輸出取對(duì)數(shù),求出每一個(gè)輸出的對(duì)數(shù)能量( log energy)Ek, k =1, 2, ... N。 MFCC 參數(shù)的計(jì)算是以“ bark”為其頻率基準(zhǔn)的,它和線性頻率的轉(zhuǎn)換關(guān)系是: 102 5 9 5 lo g (1 )700mel ff ????????????????????? MFCC參數(shù)也是按幀計(jì)算的。這需要在計(jì)算之前先在語音的頻譜范圍內(nèi)設(shè)置若干個(gè)帶通濾波器: ( ) , 0 , 1 , , 1 , 0 , 1 , , 12m NH n m M n? ? ? ??????????? MFCC 參數(shù)的計(jì)算通常采用如 下的流程: ( 1) 首先確定每一幀語音采樣序列的點(diǎn)數(shù)。 ( 2)計(jì)算 ()Sn通過 M 個(gè) ()mHn后所得的功率值,即計(jì)算 ()Sn和 ()mHn在 各離散頻率點(diǎn)上 乘積之和,得到 M 個(gè)參數(shù) mP , 0,1, , 1mM??。 河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 14 ( 4)對(duì) 0 1 1, , , mL L L ? 計(jì)算其離散余弦變換,得到 mD , 0,1, , 1mM??。 167。 在 MATLAB 中利用 lpc 函數(shù)計(jì)算 LPC 系數(shù),其語法為: a = lpc(x,n)。通常 x 為 240 點(diǎn)或256 點(diǎn)的數(shù)據(jù), n 取 10~12,對(duì)語音識(shí)別來說就已經(jīng)足夠。 語音識(shí)別中的模式匹配 167。 DTW 算法由于沒有一個(gè)有效地用統(tǒng)計(jì)方法進(jìn)行訓(xùn)練的框架,也不容易將低層和頂層的各種知識(shí)用到語音識(shí)別算法中,因此在解決大詞匯量、連續(xù)語音、非特定人語音識(shí)別問題時(shí)較之 HMM 算法相形見絀。而對(duì)于孤立詞識(shí)別 ,HMM 算法和 DTW算法在相同條件下 ,識(shí)別效果相差不大 , 又由于 DTW 算法本身既簡(jiǎn)單又有效,但 HMM 算法要復(fù)雜得多。鑒于此 ,DTW 更適合本系統(tǒng)的要求。用于孤立詞識(shí)別, DTW 算法與 HMM 算法在訓(xùn)練階段需要提供大量的語音數(shù)據(jù),通過反復(fù)計(jì)算才能得到模型參數(shù),而 DTW 算法的訓(xùn)練中幾乎不需要額外的計(jì)算。 無論在訓(xùn)練和建立模板 階段還是在識(shí)別階段,都先采用端點(diǎn)算法確定語音的起點(diǎn)和終點(diǎn)。所要識(shí)別的一個(gè)輸入詞條語音稱為測(cè)試模板,可表示為 T={T( 1), T( 2),??, T( n),??, T( N) },n 為測(cè)試語音幀的時(shí)序標(biāo)號(hào), n=1 為起點(diǎn)語音幀, n=N 為終點(diǎn)語音幀,因此 N為該模板所包含的語音幀總數(shù) , T( n)為第 n 幀的語音特征矢量。 假設(shè)測(cè)試和參考模板分別用 T 和 R 表示,為了比較它們之間的相似度,可以計(jì)算它們之間的距離 D[T, R],距離越小則相似度越高。設(shè) n 和 m 分別是 T 和R 中任意選擇的幀號(hào), d[T( n), R( m) ]表示這兩幀特征矢量之間的距離。 若 N=M 則可以直接計(jì) 算,否則要考慮將 T( n)和 R( m)對(duì)齊。但是這樣的計(jì)算沒有考慮到語音中各個(gè)段在不同情況下的持續(xù)時(shí)間會(huì)產(chǎn)生或長(zhǎng)或短的變化,因此識(shí)別效果不可能最佳。 如果把測(cè)試模板的各個(gè)幀號(hào) n=1~N 在一個(gè)二維直角坐標(biāo)系中的橫軸上標(biāo)出,把參考模板的各幀號(hào) m=1~M 在縱軸上標(biāo)出,通過這些表示幀號(hào)的整數(shù)坐標(biāo)畫出一些縱橫線即可形成一個(gè)網(wǎng)絡(luò),網(wǎng)絡(luò)中的每一個(gè)交叉點(diǎn)( n, m)表示測(cè)試模式中某一幀的交匯點(diǎn)。路徑不是隨意選擇的,首先任何一種語音的發(fā)音快慢都有可能變化,但是其各部分的先后次序不可能改變,因此所選的路徑必定是從左下角出發(fā),在右上角結(jié)束。路徑可以用函數(shù) m =216。( 1) =1,河南科技大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 16 216。為了使路徑不至于過傾斜,可以約束斜率在 ~2 的范圍內(nèi),如果路徑已經(jīng)通過了格點(diǎn)( n , m ),那么下一個(gè)通過的格點(diǎn)( n , m )只可能是下列三種情況之一: ( n , m ) =( n +1, m +2) ( n , m ) =( n +1, m +1) ( n , m ) =( n +1, m ) 用 r 表示上述三個(gè)約束條件。( n ),使得沿路徑的積累距離達(dá)到最小值,即: 搜索該路徑的方法如下:搜索從( n , m )點(diǎn)出發(fā) ,可以展開若干條滿足 ?的路徑,假設(shè)可計(jì)算每條路徑達(dá)到( n , m )點(diǎn)時(shí)的總的積累距離,具有最小累積距離者即為最佳路徑。對(duì)于( ni, mi),其可達(dá)到該格點(diǎn)的前一個(gè)格點(diǎn)只可能是( n , m )、( n , m 1)和( n , m 2),那么( n , m )一定選擇這 3個(gè)距離之路徑延伸而通過( n , m ),這時(shí)此
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1