freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語音信號的端點檢測畢業(yè)論文-wenkub

2023-03-09 09:55:10 本頁面
 

【正文】 處理之前,必須對其進行預(yù)處理。但是,從另一方面來看,由于語音的形成過程與發(fā)音器官的運動密切相關(guān),這種物理運動比起聲音振動速度來講要緩慢得多,因此,語音信號常??杉俣槎虝r平穩(wěn)的。 2 語音信號處理 語音信號特點 語音信號是隨時間變化的一維信號,由一連串的音組成,各個音的排列有一定的規(guī)則。而音節(jié)的起點 — 聲母大多都是清聲母,還有送氣與不送氣的塞音和塞差音,當背景噪聲較大時,清音電平與噪聲電平相差無幾,將它們與環(huán)境噪聲分辨是比較困難的 ,這也是雙門限法的不足之處 。在所有這些特征中,魯棒性是最難達到的。 ( 3) 對于爆破音的寂靜段,應(yīng)將其納入語音的范圍而不是無聲段。各有不同的延時、敏感度和運算量,這在實驗室環(huán)境下己經(jīng)得到了很好的效果。當時是在一個實時語音翻譯系統(tǒng)中,為了解決語音段和無語音段的檢測問題而提出來的。如果在發(fā)送端設(shè)立一個語音端點檢測器來區(qū)分語音和靜默以及背景噪聲,在接收端用舒適噪聲發(fā)生器來重構(gòu)背景噪聲,這樣就可以極大的提高信道的利用率,而且也能保證重構(gòu)語音的可懂度和自然度,因此準確的語音端點檢測是非常重要的。因此,從混有不同噪聲的信號中準確提取純凈的語音信號就成了語音識別系統(tǒng)中的一個重要的環(huán)節(jié)。然后逐幀 (幀長為 15ms)加大端點檢測的誤差,在每次加大誤差的同時得到它們的識別率。 有效的端點檢測技術(shù)不僅能減少系統(tǒng)的處理時間、提高系統(tǒng)的處理實時性,而且能排除無聲段的噪聲干擾,從而使后續(xù)工作的性能得以較大提高。 經(jīng)過幾十年的努力,語音信號處理在語音識別、語音增強、語音編碼、說話人識別、說話人情感識別、語音合成等方面取得了巨大的進步,然而,一旦這些技術(shù)應(yīng)用在實際環(huán)境中,由于環(huán)境噪聲、信道、說話人自身因素等方面的影響,性能急劇下降,因為在實際環(huán)境中沒有完全純凈的語音信號,一般都會伴有噪聲或其它干擾。多媒體技術(shù)的發(fā)展,使語音技術(shù)逐漸在越來越多的場合中推廣使用,語音信號處理技術(shù)發(fā)展迅速,其研究成果具有重要的學(xué)術(shù)及應(yīng)用價值,涉及一系列前沿課題。在電子計算機和人工智能機器的廣泛應(yīng)用中,人們發(fā)現(xiàn),人和機器之間最好的通訊方式是直接進行語言通訊,實現(xiàn)人機自由對話,賦予機 器以聽覺,辨別話音的內(nèi)容或者辨別說話人的身份,使機器能夠按照人的意志進行各種操作,把人類從繁重或危險的勞動中解脫出來。 研究背景及意義 3 語音 [4]是語言的聲學(xué)表現(xiàn)形式 , 語言是人類特有的功能,聲音是人類常用的 信息交 語言學(xué)、聲學(xué)、生理學(xué)、心 理學(xué)和數(shù)學(xué)等諸多領(lǐng)域的內(nèi)容。本文借助 MATLAB[3]采用短時能量和短時過零率結(jié)合的雙門限法 語來進行語音端點檢測, 此 算法在純語音和高信噪比的情況下都檢測得比較好,但在低信噪比下檢測結(jié)果就不盡人意。因此,端點檢測的效率、質(zhì)量在語音處理系統(tǒng)中顯得至關(guān)重要,廣泛開展端點檢測實現(xiàn)手段方面的研究,有一定的現(xiàn)實意義 [2]。 所謂語音端點檢測,就是從一段給定的語音信號中找出語音的起始點和結(jié)束點。語音信號處理包括語音通信、語 音增強、語音合成、語音識別和說話人識別等方面。 Shorttime energy 。本文首先對語音信號進行簡單的時域和頻域 分析 及預(yù)處理 ,其次利用 基于短時能量和短時過零率的 雙門限算法進行語音端點檢測,并對這幾種用這種算法進行端點檢測,進行實驗分析,分析此方法的優(yōu)缺點。 1 基于 MATLAB 的語音信號的端點檢測 摘要: 語音端點檢測是指從一段語音信號中準確的找出語音信號的起始點和結(jié)束點,它的目的是為了使有效的語音信號和無用的噪聲信號得以分離,因此在語音識別、語音增強、語音編碼、回聲抵消等系統(tǒng)中得到廣泛應(yīng)用。 關(guān)鍵詞: 語音信號處理;語音端點檢測;雙門限;短時能量;短時過零率 Voice signal endpoint detection based on MATLAB Abstract: Endpoint detection is a voice signal from the accurate speech signal to the identify start and the end points, the purpose is to enable to separated the effective voice signals and unuseful noise. So, in the speech recognition system, speech enhancement, speech coding, echo cancellation and other systems are widely used. In Current the endpoint detection can be roughly divided into two categories, one is based on the threshold method, another method is based on the method of pattern recognition , the main in this paper is based on the method of threshold method. The Endpoint detection is take a very important position in the speech recognition, it directly affects the performance of the system. In this article first domain analysis in simple speech signal time, than dual threshold algorithm, cepstrum algorithm, spectral entropy algorithm for endpoint detection, and these types of endpoint detection algorithms, and experimental analysis points and analysis the advantages and disadvantages of this method. Key word: Signal processing。The rate of shorttime zeropassing 語音,即語言的聲音,是語言符號系統(tǒng)的載體。語音信號的好壞、語音識別率的高低,都取決于語音信號處理的好壞。在語音識別系統(tǒng)中,正確、有效的進行端點檢測不僅可以減少計算量和縮短處理時間,而且能排除無聲段的噪聲干 擾、提高語音識別的正確率。 有效的端點檢測不僅可以減少數(shù)據(jù)的存和處理時間,而且能排除無聲段的噪聲干擾。 盡管語音端點檢測技術(shù)在安靜的環(huán)境中已經(jīng)達到了令人鼓舞的準確率 , 但是在實際應(yīng)用 時由于聲的引入和環(huán)境的改變通常會使系統(tǒng)性能顯著下降。 隨著現(xiàn)代科學(xué)的蓬勃發(fā)展,人類社會越來越顯示出信息社會的特點,猶如衣、食、住、行對于人類是必要的一樣,通信和信息交換也成為了人類社會存在的必要條件,不但在人與人之間,而且在人與機器之間每時每刻都需要進行大量的信息交換。用現(xiàn)代手段研究語音處理技術(shù),使人們能更加有效地產(chǎn)生、傳輸、存儲、獲取和應(yīng)用語音信息,這對于促進社會的發(fā)展十分重要。語音信號處理與信息科學(xué)中最活躍的前沿科學(xué)密切聯(lián)系,并且共同發(fā)展。例如,辦公室環(huán)境下,電腦風(fēng)扇轉(zhuǎn)動的聲音,鍵盤敲打的聲音等都是 噪聲,而語音信號處理 4 系統(tǒng)的處理對象是有效語音信號,即排除了純噪聲段的語音信號段。 語音端點檢測的準確性對于語音識別系統(tǒng)的性能有著較大的影響。結(jié)果表明在端點檢測準確時識別率為 93%的系統(tǒng),當端點檢測的誤差在士 60ms(4 幀 )時,識別率降低了 3%; 在士 90ms(6 幀 )時,降低了 10%; 而當誤差在進一步加大時,識別率急劇下降。 另外在通信系統(tǒng)中,典型的會話信道大約有 40%的時間真正用于傳輸語音,其余60%的時間傳輸?shù)亩际庆o默和背景噪聲。 語音端點檢測研究現(xiàn)狀及存在的問題 語音端點檢測和語音增強不同,它的任務(wù)是判斷待處理信號是語音還是非語音。那時的算法名稱叫VAD(Voice Aotivity Detection),指的是將語音段和無語音段分開的處理過程。但是當環(huán)境背景噪聲存在的情況下,傳統(tǒng)的檢測算法都會因為受到污染而造成嚴重的誤判和漏判。 ( 4) 應(yīng)該盡可能避免在檢測中丟失鼻韻和弱摩擦音等與噪聲特性相似、短時參數(shù)較少的語音。因此,如何在噪聲環(huán)境下設(shè)計一種魯棒的端點檢測算法是一個非常棘手的問題。 現(xiàn)有的算法存在的主要問題有兩點 : 6 一、在具有較強噪聲的環(huán)境下,語音端點檢測往往存在著大量的誤判,不利于后續(xù)的處理過程 ; 二、在高噪聲的環(huán)境下不能有效的檢測出語音信號段,造成了有效信息的丟失。語音具有聲學(xué)特征的物理性質(zhì),聲音質(zhì)量與它的頻率范圍有關(guān),語音信號的頻率一般是在 200Hz~3500Hz 范圍內(nèi),隨著帶寬的增加,信號的自然度將逐步得到改善。研究表明,在5ms40ms 的范圍內(nèi),語音信號的頻譜特性和一些物理特征參數(shù)基本保持不變。語音信號的預(yù)處理應(yīng)盡可能地保證處理后得到的信號更均勻、平滑,且能提高語音的質(zhì)量。目的是提升高頻部分,使信號變得平坦,保持在低頻到高頻的整個頻帶中,能用同樣的信噪比求頻譜,而且預(yù)加重零點與輻射零點將抵消聲門波的影響,使語音信號中只包含聲道部分,以便于頻譜分析或聲道參數(shù)分析。在端點檢測時如果采用較大的窗長 , 則幀長長,幀數(shù)少 , 這樣計算量會小些 , 而且進行端點檢測時速度也會快些,但是這樣端點檢測 的誤差容易增加。將語音信號劃分為許多短時的語音段,每個短時的語音段稱為一個分析幀。前一幀和后一幀的交疊部分稱為幀移,幀移與幀長的比值一般取 為0~ 之間。 表 21 1s長的各種窗的主瓣寬度和旁瓣高度 矩形 漢明 漢寧 主瓣寬度 旁瓣寬度 13dB 43dB 32dB 從表中可知:矩形窗的主瓣寬度最小,但其旁瓣高度最高;漢明窗的主瓣最寬,而旁瓣高度最低。只有將語音信號分析成表示其本質(zhì)特性的參數(shù),才有可能利用這些參數(shù)進行高效的語音通信,以及建立用于識別的模板或知識庫。語音信 號的時域參數(shù)有短時能量、短時平均幅度、短時過零率、短時自相關(guān)函數(shù)等,這些是語音信號中一組最基本的短時參數(shù),在各種語音信號數(shù)字處理技術(shù)中都有重要應(yīng)用。取樣之后要對信號進行量化,而量化過程不可避免地會產(chǎn)生量化誤差,即量化后的信號 值與原信號之間的差值。 ( 1) 短時頻譜和短時功率譜 設(shè)信號 )(mxn 經(jīng)過傅里葉變換后在頻域記為 )( jwn eX ,則 )( jwn eX 與 )(mxn 的關(guān)系見公式 26。 將線性預(yù)測應(yīng)用與語音信號處理,不僅是因為它的預(yù)測功能,而且更重要的是因為它能提供一個非常好的聲道模型及模型參數(shù)估計方法。通常不同的系統(tǒng)需要不同的算法以滿足在精度、復(fù)雜度、魯棒性、敏感性和響應(yīng)時間等方面的需求。 ( 2)特征提?。涸跁r域或者頻域提取能反映語音本質(zhì)特征的聲學(xué)參數(shù),如短時能量,短時過零率等。 ( 4)端點檢測:確定門限后就可以進行端點檢測,根據(jù)門限值來區(qū)分有語音段和噪聲段,得出檢測結(jié)果。 如圖 就是在比較純凈的內(nèi)容為“端點檢測” 的原始語音信號用傳統(tǒng)的短時能量和過零率的語音端點檢測,圖中可以很直觀的觀察到語音的短時能量的大小和其過零率的高低,如圖 所示: 圖 語音信號原始波形圖和其短時能量和過零率波形圖 短時能量函數(shù)可用來區(qū)分清音段和濁音段, nE 值大的對應(yīng)于濁音段,而 nE 值小的對應(yīng)于清音段。 短時平均能量 語音和噪聲的主要區(qū)別在它們的能量上,所以能量是經(jīng)常使用的音頻特征參數(shù),是對語音信號最直觀的表示。短時能量是隨機參數(shù),在無聲段,清音段和濁音段,它們分別具有不同的概率密度函數(shù),圖 給出了短時能量在清音、無聲和濁音三種情況下的條件概率密度函數(shù)。上式表明,經(jīng)過窗口加權(quán)的短時能量相當于將“語音平方”信號通過一個線性濾波器的輸出,這個濾波器的取樣響應(yīng)為 )(nh 。 語音信號的短時平均幅度 [11]定義為 : ????? ??? mn mnmxM )()( ? ( 33) nE 和 nM 都反映語音信號的強度,但是其特性有所不同。 語音信號的短時能量可用以下幾種算法得到: 1 ()NnniE x i??? ( 34) 21 ()NniiE x i??? ( 35) 21 log ( )NniiE x i??? ( 36) 它們分別為絕對值的累加、平方累加和平方的對數(shù)的累加 [12] [13],本文采用的是絕對值的累加進行計算的, 本文在 MATLAB 軟件 中實現(xiàn)求語音短時 能量 的關(guān)鍵代碼為 %計算短時能量 amp = sum(abs(enframe(filter([1 ], 1, x), FrameLen, FrameInc)), 2)。 對于高信噪比的語音信號,無語音信號的噪聲能量很小,而有語音信號的能量 nE 顯著增大到某一數(shù)值,由此可以區(qū)分語音信號的起始點和結(jié)束點。而對于離散信號,如果相鄰的取樣值改變符號則稱為過零。 第三,區(qū)分清音和濁音,對語音信號進行分析,發(fā)現(xiàn)發(fā)濁音時,盡管聲道有若干個共振峰,但由于聲門波引起譜的高頻跌落,所以其語音能量約集中在 3kHz 以下。 本文在 MATLAB 軟件 中實現(xiàn)求語音短時過零率的
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1