freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)論文基于dsp音視頻矩陣控制的研究與實現(xiàn)(文件)

2025-08-06 15:12 上一頁面

下一頁面
 

【正文】 語音識別過程與人對語音識別處理過程基本上是一致的。因此從信號流中檢測出語音信號是語音識別的必要的預處理過程。 在商用語音系統(tǒng)中,由于信號多變的背景和自然對話模式而更容易使句中有停頓 ( 非語音 ) ,特別是在爆發(fā)聲母前總會有無聲間隙 。 2. 拒絕非語音的信號 。 在現(xiàn)代通信技術中,凡是涉及到語音通信的,都需要應用到語音端點檢測這一技術,并且這一技術的重要性不僅體現(xiàn)在日常語音通信中,更體現(xiàn)在科研和國防建設上。 國內(nèi)外研究現(xiàn)狀 端點檢測算法的國內(nèi)外研究現(xiàn)狀 語音端點檢測算法經(jīng)過幾十年的發(fā)展,產(chǎn)生了很多方法,而且隨著語音技術在現(xiàn)代科學中的重要性不斷增大,也不斷的有新方法被提出來滿足需要。這些參數(shù)描述了此語音信號的重要的信息,繼而用一定的算法進行推理,從而可以判定此信號是 語音 段還是非 語音 段。 20xx 年 Gazor 提出了利用拉普拉斯概率密度函數(shù) (PDF)為帶噪語音和噪聲譜建模,它被證明是一個更好的純凈語音分布的模型。 由 此,首先,用主元分析 (PCA)分析噪聲觀察值的估計協(xié)方差矩陣構造噪聲特征空間。因此,基于可靠信息就可以實現(xiàn)魯棒性 VAD。隨著小波分析在信號處理領域的廣泛應用,也有不少基于小波分析語音端點檢測算法被提出,如:選擇小波部分子帶跟蹤信號的能量變化以實現(xiàn)端點檢測,將小波變換模極大值應用于信號突變點的檢測等 [6]。 DSP 發(fā)展歷程大致分為三個階段: 70 年代理論先行, 80 年代產(chǎn)品普及, 90 年代突飛猛進。隨著大規(guī)模集成電路技術的發(fā)展, 1982 年世界上誕生了首枚通用可編程 DSP 芯片 TI 公司 的TMS320xx。 90 年代 DSP 發(fā)展十分驚人,相繼出現(xiàn)了第四代和第五代 DSP器件。如 TI 公司的 TMS320C80 代表了新一代芯片集成技 5 術,它將 4 個 32 位的 DSP, 1 個 32 位 RISC 主處理器, 1 個傳輸控制器, 2個視頻控制器和 50Kb SRAM 集成在一個芯片上。按照CMOS 的發(fā)展趨勢, DSP 的運算速度提高到 1000MIPS 是完全有可能的。而以 C54xx 系列內(nèi)核為基礎的 DSP 器件 TMS320C5402 不僅繼承了上述優(yōu)點,而且存儲器有三個獨立的可選擇的空間:程序存儲空間、數(shù)據(jù)存儲空間和 I/O 空間。片上雙存取訪問 RAM 被組織在一些塊上,因為每個 DARAM塊能夠在每個機器周期中被訪問兩次,結合并行的體系結構,使得 5402 得以在一個指定的周期內(nèi)完成四個 并發(fā)的存儲器操作:一個取指操作、兩個數(shù)據(jù)讀操作和一個數(shù)據(jù)寫操作。本文開發(fā)的系統(tǒng)就是建立在 TMS320C5402 的基礎上。 2.使用 MATLAB 軟件進行算法仿真,分析實驗結果得出并驗證優(yōu)化后的算法。 7 第 2章 語音端點檢測算法的分析 及其優(yōu)化 語音分析的一般方法 計算機語音分析是計算機語音處理的一個重要內(nèi)容,也是計算機語音合成及語音識別的基礎 [8 ]。 國外的經(jīng)驗說明,語音分析的工作必須先于其它的語音處理工作。 時域分析法 時域 分析是最早被使用的一種方法,也是應用范圍最廣泛的一種方法。 2. 時域波形語音信號的數(shù)字處理實現(xiàn)起來比較簡單 。 8 圖 21 音頻時域波形圖 The plot of audio in time domain 頻域分析方法 頻域分析是常用的第二種語音分析方法。 圖 22 音頻頻域波形圖 plot of audio in frequency domain 9 頻域分析方法的特點是: 1. 語音信號的頻譜波形不太容易受外界環(huán)境的影響,而時域波形易隨外界環(huán)境變化 。 語譜分析法 利用語譜圖是第三種語音分析方法。 語譜分析法的特點是: 1. 它是時間、頻率、音強的三位顯示圖,同時 也是時域波形與頻譜圖的結合。 4. 由于語譜圖具有不同的黑白程度,形成不同的花紋,這種花紋被稱作聲紋。 語音端點檢測算法的分析 隨著越來越多的學者對語音 端點檢測技術的關注,大量新的語音端點檢測算法相繼被提出。主要體現(xiàn)在對環(huán)境條件的依賴性很強,繼續(xù)要保持測試條件和訓練條件的一致性,否則系統(tǒng)性能嚴重下降。然而 ,當語音處理由實驗室走向實際應用時,環(huán)境噪聲的存在所帶來的問題就變得越來越重要。并比較了各自的檢測性能,筆者針對不同的噪聲類型,采用相應比較合適的端點檢測算法從而取得更好的檢測結果。 簡而言之,小波就是小范圍的波。 在小波理論的發(fā)展過程中,一些已發(fā)展起來的問題經(jīng)常用小波變換作為理論基礎,看成是從不同角度應用小波所得的特例。二維情況下它除了 “顯微 ”能力外還具有 “極化 ”能力 ( 即方向選擇性 ) ,因而引人注意。 ??ft的小波變換 如式 (21)所示 。 t , ? 和 ? 都是連續(xù)變量,因此成為連續(xù)的小波變換 ( Continuous Wavelet Transform,簡記為 CWT) 。因此小波變換的逆變換公式不是 惟一 的。 13 ? ? ? ? ? ?0 0 0 020 1, , , , ,ffW T d W T K d? ? ? ? ? ? ? ? ? ??? ? ? ???? ?? (24) 式中 ? ?00, , ,K ? ? ?? 如式 (25)所示。 1. 尺度的離散化。為了防止信息的丟失,我們要求采樣間隔 ? 滿足 Nyquist 采樣定理,采樣率大于等于該尺度下頻率通帶的二倍。 ? ?220 0 0 0 0 0 0jjj j jt k t k? ? ? ? ? ? ? ? ??????? ??? ? ????? (27) 離散小波變換定義為 如式 (28)所示 。 ? ? ? ?2,02 2 0 , 1 , 2 , ,j jjk t t k j k Z? ? ?? ?? ? ? ??? ? (29) 我們把 ? 軸用 0? 歸一化, 0 1?? ,于是有 式 (210) ? ? ? ?2, 22j jjk t t k??? ??? (210) 此時,對應的 WT 為 ? ? ? ? ? ?,f j kW T j k f t t dt? ?? ? 多分辨率分析 我們把平方可積 函數(shù) ? ? ? ?2f t L R? 看 成是某一逐級逼近的極限情況。當 3j? 時, 函數(shù)空間的劃分 如圖 24 所示。 jjijVWW W j j? ??? (212) 進一步要求 函數(shù)空間 剖分還 應 具有以下兩項特性: 1.位移不變性 。 ? ?11,22 jjtf V f t V?????????? (214) 16 子帶平均能量方差 子帶平均能量方差的語音端點檢測算法 針對主要由高斯白噪聲 [13]組成的 背景 噪聲 提出 的 一種算法。由此看來 ,分析與研究語音信號的處理,總離不開對信號與噪聲的分析。 某些類型的噪聲是確知的,例如電源哼聲、自激振蕩、各種內(nèi)部的諧波干擾等。 隨機信號與隨機噪聲均可歸納為依賴于時間參數(shù) t 的隨機過程,這種過程的基本特征是,它是時間 t 的函數(shù),但在任一時刻上觀察到的值卻是不確定的,是一個隨機變量。 ? ? ? ?? ?,i i i i iF x t P t x??? (215) 如果存在 式 (216), 則稱 ? ?,i i if xt 為 ??t? 的一維概率密度函數(shù)。 , , , , ,n n n n nF x x x t t t P t x t x t x? ? ???? ??? ? ? ? ??? ? (217) 如果存在 ? ? ? ?1 2 1 21 2 1 212, , , 。 在信號處理中占重要地位的一種類型的隨機過程是平穩(wěn)隨機過程,所謂平穩(wěn)隨機過程,即指它的任何 n 維分布函數(shù)或概率密度函數(shù)與時間起點無關。 , , , , , 。所以它被近似的表述為高斯白噪聲。 jkb 歸一化協(xié)方差函數(shù) ,如式 (222)所示。一般來說,信號所含的噪聲都可看作是平穩(wěn)的高斯白噪聲。 與之相反語音信號的能量主要分布于低頻部分,在整個頻率區(qū)間內(nèi)能量分布起伏較大。在噪聲段,由于高斯白噪聲能量變化平緩,分布相對平均,所以各個頻段的能量方差較小。 Daubechies 小波是由世界著名的小波分析學者 Inrid Daubechies 構造的小波函數(shù),我們一般簡寫成 dbN , N 是小波的階數(shù)。 20 ? ? 2 220 c os si nNmP??? ? ? ? ?? ? ? ? ?? ? ? ? (223) 式中 ? ? 210 012N jkkkm h e ??? ??? ?。 根據(jù)上一節(jié)的分析可以確定語音信號在各個子帶內(nèi)的平均能量分布不均,信號的能量主要集中在低頻子帶 [19]內(nèi)。 計算各級小波系數(shù)平均能量 miE 的均值 iE ,如式 (225)所示 。 圖 28 語音信號波形圖 The plot of the speech signal 首先給該段語音加入 15db的高斯白噪聲,形成待測信號 ??xt? ,如圖 29所示 。 圖 29與圖 210進行比較可明顯看出檢測效果比較明顯,在采用一定閾值判定后可以精確的檢測出語音的端點。 22 圖 29 帶噪語音信號 ??xt? Speech signal ??xt? containing noise 圖 210 信號 ??xt? 平均能量方差 The average power variance of signal ??xt? 具體實驗步驟如下: 1. 對系統(tǒng)用到的所有語音信號進行數(shù)據(jù)采樣,由于語音信號主要集中在 5kHz以下,所以我們采用 。在本論文中進行小波處理后得到的包含低頻率信息的小波系數(shù)記為第 6層小波系數(shù)。為了增加算法的精度,對閾值進行自適應處理。持續(xù)幀長的確定是由具體的實驗結果來決定的,本方法根據(jù)實驗取的經(jīng)驗值,規(guī)定最小語音持續(xù)幀長為 8幀,最小噪聲持續(xù)幀長為 4幀,一些界限如小于被定義的最小持續(xù)時間時就被舍棄。 圖 211 對帶噪信號 ??xt? 的處理結果 Detection oute of speech signal ??xt? containing noise 實驗結果比較 表 22為在各種信噪比的情況下,采用 db4小波分別對不同數(shù)量的語音信號進行子帶平均能量方差端點檢測所得到的實驗結果,以及與基于能量與過零率算法的比較。 表 22 語音端點檢測識別率 (%) Table 22 Recognition Rate of Speech Endpoint Detection (%) 子帶平均能量方差算法 clean SNR=15db SNR=10db SNR=0db 10 句語音 50 句語音 100 句語音 平均檢測結果 小波系數(shù)方差 語音信號是統(tǒng)計自相似的隨機過程,它的統(tǒng)計特性在時域內(nèi)不隨波形的擴充或壓縮而變化,因此它具有 f/1 過程的特性 [20,21]。自相似過程是在統(tǒng)計。因此,使用這一特點可以把經(jīng)小波變換后獲得的小波系數(shù)的方差作為統(tǒng)計特性,進行端點檢測。 在各種數(shù)量語音 ( 如 10句, 50句, 100句 ) 的情況下,識別率很高,對于無噪音下識別率可達 98%以上。標準結果為在不加入噪聲的基礎上對語音進行手工標記所得。 4. 如果 iD? 則算法結束,否則返回到第 2步。 3. 通過式 (224)、 (225)、 (226)分別進行計算,得到方差參數(shù) ? ?2i? ,取 23 前三幀語音的參數(shù) ??2i? ,的平均值的 2倍作為閾值。記為? ?0iR i D?? , D為 幀的總數(shù)。實驗所用的語音數(shù)據(jù)為 4秒到 7秒不等的 160句英文語音,把它們隨機的分為三組,分別包含 10句、 50句和 100句語音。然后經(jīng)過式 (224)、 (225)和 (226)的計算得到所求的方差參數(shù)。然后選取方差作為特征參數(shù)來表示各個小波子帶平均能量的差異,計算各個子帶平均能量的方差 ? ?2i? ,如式 (226)所示 。計算各層小波系數(shù)的平均能量 miE ,如式 (224)所示 。 根據(jù)第 二節(jié) 所介紹的小波變換原理可知,小波變換相當于信號通過的一系列低通和高通濾波器,所得的小波子帶系數(shù)分別代表了不同頻率段信號的能量分布 , 如圖 27 所 示 。 dbN 沒有明確的表達式 ( 除 1N? 外 ) ,但轉換函數(shù)的平方模 [18]是很明確的。 比較圖 25與 圖 26可明確的看出語音與噪聲在頻域存在很大的差異,而以小波分析為工具,利用這一特點進行端點檢測,也正是本 節(jié) 所介紹的一種基于子 帶平均能量的端點檢測方法 。即利用語音與噪聲在各個頻段內(nèi)的平均能量的方差可以判別出語音段與噪聲段。因此信號在各個頻段內(nèi)的信號能量分布均勻。所以如果過程是寬平穩(wěn)的,即其均值與時間無關,協(xié)方差函數(shù)只與時間間
點擊復制文檔內(nèi)容
研究報告相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1