freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

通信工程專業(yè)語音信號增強技術的研究與仿真畢業(yè)論文(編輯修改稿)

2025-07-19 17:57 本頁面
 

【文章內(nèi)容簡介】 的十大重要科技發(fā)展技術之一。它是一門交叉學科,正逐步成為信息技術中人與機接口的關鍵技術。與機器進行語音交流,讓機器明白你在說什么,這是人們長期來夢寐以求的事情。語音識別技術就是讓機器通過識別和理解的過程把語音信號轉變?yōu)橄鄳奈谋净蛎畹母呒夹g。讓機器識別語音的困難在某種程度上就像一個外語不好的人聽外國人講話一樣,它和不同的說話人、不同的說話速度、不同的說話內(nèi)容、以及不同的環(huán)境條件有關。近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來 10 年內(nèi),語音識別技術將進入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務、消費電子產(chǎn)品等各個領域。語音信號本身的特點造成了語音識別的困難。這些特點包括多變性,動態(tài)性,瞬時性和連續(xù)性等。在電話與通信系統(tǒng)中,智能語音接口正在把電話機從一個單純的服務工具變成為一個服務的“提供者”和生活“伙伴” ;使用電話與通信網(wǎng)絡,人們可以通過語音命令方便地從遠端的數(shù)據(jù)庫系統(tǒng)中查詢與提取有關的信息;隨著計算機的小型化,鍵盤已經(jīng)成為移動平臺的一個很大障礙,想象一下如果手機僅僅只有一個手表那么大,再用鍵盤進行撥號操作已經(jīng)是不可能的。語音識別正逐步成為信息技術中人機接口的關鍵技術,語音識別技術與語音合成技術結合使人們能夠甩掉鍵盤,通過語音命令進行操作。語音技術的應用已經(jīng)成為一個具有競爭性的新興高技術產(chǎn)業(yè)。 第 5 頁 一個完整的語音識別系統(tǒng)可大致分為三部分:語音特征提取、聲學模型與模式匹配(識別算法)和語言模型與語言處理。當前在語音識別中,如何去充分借鑒和利用人在完成語音識別和理解時所利用的方法和原理是一大課題,因而將人工神經(jīng)網(wǎng)絡引入語音識別中引起了人們極大的興趣。對于漢語語音識別來說,本質(zhì)上與其他的語言沒有區(qū)別,但也有其本身特點,主要是他易于用音節(jié)作為基本研究的對象,從而使特征的提取,字節(jié)的分割,動態(tài)時間匹配方法的選取等等,也具有特點。目前漢語語音識別的研究重點是以詞為單位的孤立詞的識別以及連續(xù)語音識別等 [5]。 語音增強技術 在之前所述的理論中,大部分的語音數(shù)據(jù)都是在接近理想的情況下采集的。大多數(shù)的語音識別和語音編碼在開始研究時都要在高保真設備上錄制語音,尤其要在無噪環(huán)境下錄音。在實際應用中,由于噪聲的存在會產(chǎn)生很多問題,比如,環(huán)境噪聲的污染會使許多語音處理系統(tǒng)的性能急劇惡化。例如,語音識別正在步入實用階段,但識別系統(tǒng)大都是在安靜的環(huán)境中工作的,在噪聲環(huán)境中,尤其是在強噪聲的環(huán)境中,語音識別系統(tǒng)的識別器將嚴重受到影響,低速率的編碼也會遇到類似的問題。由于語音生成模型是低速率的參數(shù)編碼的基礎,在語音通信中不可避免的會受到來自周圍環(huán)境、傳輸媒介引入噪聲、通信設備內(nèi)部的電噪聲,甚至其他人的說話聲的干擾。這些干擾將致使接收到的參數(shù)已非純凈的原始的語音參數(shù),而是受到噪聲污染的參數(shù),當噪聲污染嚴重時,重建的語音質(zhì)量將急劇惡化,甚至變得完全聽不懂。而且特別遺憾的是,線性預測的技術作為語音處理中最有效的方法,恰恰是最容易受噪聲污染的。如果將線性預測技術看作頻譜的匹配過程,則在大量的噪聲使頻譜畸變時預測器就設法與畸變頻譜匹配,而不是與基本的語音匹配。當在聲碼器的接收端使用和發(fā)送端相同的預測器時,則合成語音的可懂度就大大的降低了。語音增強是解決噪聲污染的一種最為有效地方法,它的主要目標是從帶噪聲的語音信號中提取盡可能純凈的原始的語音,它不但與信號處理的技術有關,還涉及到人 第 6 頁 的聽覺感知和語音學,此外,噪聲來源眾多,隨著應用場合的不同,它的特性也各不相同,因而很難找出一種通用的語音增強算法來適用于各種噪聲環(huán)境。必須針對不同的噪聲采取不同的語音增強對策。 課題研究背景及意義語音信號處理是信息高速公路、多媒體技術、辦公自動化、現(xiàn)代通信及智能系統(tǒng)等新興領域應用的核心技術之一,它主要包括語音編碼、合成、識別和語音增強等方面。然而人們在獲得語音信號的同時,不可避免地會受到來自傳輸媒介引入的噪聲、通信設備內(nèi)部電噪聲、房間混響乃至其他說話人的話音干擾。這些干擾不僅會使接收者得到的語音被噪聲污染,同時也會導致許多語音處理系統(tǒng)的性能急劇惡化。語音增強作為前置處理方案是抑制干擾的一種有效途徑,是語音信號其它應用的基礎。隨著語音增強研究的深入,人們越來越認識到由于噪聲通常是隨機的,要想從帶噪語音信號中提取完全純凈的原始語音信號幾乎是不可能的。在這種情況下,語音增強的目的主要有兩個::改進語音質(zhì)量,消除背景噪聲,使聽者樂于接受,不感覺疲勞。:提高語音可懂度。在實際情況下,往往這兩個目的不能兼得。由此可見,語音增強是一項很復雜的技術,不僅僅是數(shù)字信號處理的問題,還涉及到人的聽覺感知特性和語音學。同時,噪聲的多樣性,即噪聲來源眾多,隨著應用場合不同而特性各不相同,也增加了語音增強的難度。因此,要想一勞永逸的設計出一種算法是不可能的,只能是針對不同的噪聲情況,采取不同的語音增強算法。因此,對于語音增強算法的研究對我們的生活起著十分重要的作用,它也扮演著十分重要的角色。 本文主要研究內(nèi)容基于語音短時譜估計的增強方法和基于語音生成模型的增強方法,是語音增強方法中的兩大類?;谡Z音短時譜估計的增強方法種類繁多,如譜相減法、維納濾波法、最小均方誤差法等。該類方法具有適應信噪比范圍大、方法簡單、易于實時處理等優(yōu)點。盡管該方法研究比較早,但仍具有很強的生命力,成為應用最廣泛的語音增強方法。 第 7 頁 本文重點是研究現(xiàn)有的語音增強方法,設計一種實用的語音增強系統(tǒng)。增強過程不以單純提高信噪比為目標。在第二章中,介紹語音增強的基礎,介紹了目前流行的幾種語音增強算法,給人們一個語音增強算法的整體印象。在第三章中,針對語音增強技術,設計出合適的語音信號濾波器;在MATLAB 上用濾波器實現(xiàn)對含噪聲語音信號的濾波。在第四章中,從整體對論文做出了總結,并描述了一下對今后工作的展望。 第 8 頁 2 語 音 及 語 音 增 強 研 究 的 基 礎 語音增強概述語音處理技術的發(fā)展可以從 1876 年的貝爾發(fā)明電話算起,貝爾第一次采用電訊號將語音傳輸?shù)竭h方。1939 年 H.Dudley 首次成功設計出了聲碼器,它是將語音提取參數(shù)后,傳輸語音的參數(shù),然后在接收端重新生成語音。它的發(fā)明中所孕育的偉大思想是對語音信號的建模。數(shù)字計算機是語音處理研究的重要工具。此后時期語音識別的主要研究方向和方法都是利用硬件提取語音的頻譜信息,使用計算機進行匹配計算和判決。對語音處理技術產(chǎn)生決定性的影響的是在上個世紀 70 年的三項研究成果:70 年代初期的將動態(tài)規(guī)劃法用于語音識別及隱馬爾可夫模型,為語音識別在匹配算法上提供了新的方法;中期的線性預測法,在語音識別、語音編碼等方面獲得了極大成功,成為現(xiàn)代語音處理的主要方法,隨后在七十年代末期的矢量編碼量化技術,更推進了語音處理技術的發(fā)展。目前常用的語音信號增強算法一般可分為基于語音生成模型參數(shù)和非基于語音生成模型參數(shù)兩大類?;谡Z音生成模型參數(shù)方法的特點是對語音生成模型的參數(shù)進行估計和恢復。然而在低信噪比下,很難對模型參數(shù)進行準確估計,并且此類算法往往因需要迭代而增加算法的復雜度。非基于語音生成模型參數(shù)的語音增強方法主要有自適應噪聲濾波法和基于語音短時譜估計的增強方法等。語音信號增強的典型方法有:譜減法、自適應噪聲對消法以及基于語音信號模型的語音增強法。近些年來,語音增強的研究工作有了一定的進展。適用于在帶噪語音信號采集過程中同時能獲得參考噪聲源的自適應噪聲對消技術,已日趨成熟。近四十年以來,人們對不同的語音增強算法進行了大量的研究。1978 年 Lim 和Oppenheim 提出了維納濾波語音增強方法;1979 年 S.Boll 提出了譜減法語音增強, 1980 年 Macaulay 和 MalpaSs 提出了軟判決語音增強方法; 1984Ephraim 和 Malall 提出了基于最小均方誤差短時譜幅度估計的(MMSE.STSA)方法,并且在 1985 年提出了基于人耳聽覺特性的最小均方誤差對數(shù)短時譜幅度估計 (MMsE.LoG.sTsA);1987 年Paliwal 提出了卡爾曼濾波語音增強方法方;1994 年 Rainer M 眥 in 提出了基于最小統(tǒng) 第 9 頁 計的語音增強方法;1995 年 Ephraim 提出了基于子空間的語音增強方法;2022 年Rajner Manin 提出了基于最優(yōu)平滑和最小統(tǒng)計的噪聲功率譜密度估計。近年,隨著對語音增強技術的不斷研究,一些新的語音增強方法如小波變換語音增強方法、卡亨南.洛維變換方法、離散余弦變換方法、人工神經(jīng)網(wǎng)絡方法、隱含馬爾可夫模型方法等被相繼提出。國內(nèi)的研究較之國外起步較晚,主要的研究單位有清華大學、中科院聲學所和西安電子科技大學等單位。無限詞匯漢語聽寫機首先由清華大學于 1988 年研制成功,四達公司等單位在 90 年代初使之產(chǎn)品化、商品化。但從目前的市場應用范圍來看,語音產(chǎn)品的實際應用還很狹窄,這說明語音技術產(chǎn)品還存在缺陷,達不到市場化、商品化的要求,在技術上許多工作要做。近幾年,漢語言識別成為研究的重點,國外公司投入巨資進行研究,國家“863計劃也在這方面加大了投資 [6]。 語音增強技術的基本理論語音增強不僅涉及信號檢測、波形估計等傳統(tǒng)信號處理理論,而且與語音特性、人耳感知特性密切相關,從語音信號產(chǎn)生的信號模型和語音信號增強系統(tǒng)出發(fā),介紹了幾種常用的語音增強算法,并總結歸納了各種算法的思想、適用條件和存在的問題。為了充分了解語音信號的特性,首先給出一個語音信號的模型,如 2.1 所示。這個模型比較簡單,但可以表現(xiàn)出語音信號的主要特性,能夠滿足大多數(shù)情況下對語音信號的研究和應用。濁 音 /清
點擊復制文檔內(nèi)容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1