freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

基于dsp的網(wǎng)絡電話終端的語音傳輸?shù)难芯慨厴I(yè)論文(編輯修改稿)

2025-07-22 01:23 本頁面
 

【文章內容簡介】 按MOS分的高低對編碼器質量進行分類:MOS=,恢復信號和原信號幾乎不可區(qū)分。MOS=~,可用于普通電話通信,但有明顯可感失真。MOS,但已缺乏自然性,難以識別發(fā)話者。語音編碼根據(jù)編碼原理主要分為波形編碼和參數(shù)編碼兩種。(l)波形編碼波形編碼就是根據(jù)語音信號波形導出相應的數(shù)字編碼形式,使其在接收端忠實地再現(xiàn)原始話音。最早的也是最著名的波形編碼是PCM編碼,它包括三個過程:抽樣、量化和編碼。根據(jù)奈奎斯特原理,為了保證信息不丟失,抽樣頻率至少應為模擬信號所含最高頻率的2倍,由于人發(fā)音的主要頻率在4kHz以內,所以語音抽樣頻率取在skHz,這就是所有語音編碼方法的基本假設。量化就是將連續(xù)的模擬波形劃分為若干離散的區(qū)域,以便用數(shù)字形式表示每個抽樣值。由于用量化值表示連續(xù)抽樣值是近似的,由此必然帶來所謂“量化噪聲”。如果按均勻分段的方式劃分量化區(qū)間,就稱之為均勻量化或線性量化,其主要問題是小信號處量化噪聲大,信號過大超過量化范圍時又會產(chǎn)生顯著的過載量化噪聲。因此,實際采用的都是非均勻量化。 PCM編碼雖然能夠提供相當好的長途通信級語音質量,但由于其速率過高,尤其在多媒體應用以及在共享信道的數(shù)據(jù)網(wǎng)中應用時,采用PCM傳送話音占用的網(wǎng)絡帶寬資源過高,所以人們提出了許多改進技術,以降低話音編碼的速率,或者說在同樣的碼率下可以進一步提高話音的質量。降低編碼比特率的基本思路是利用話音抽樣信號之間的相關性。分析表明,話音波形中有很多的冗余信息,作為信息冗余的度量,。由此可知,相鄰抽樣值之差一般很小,其包含的信息量遠小于抽樣值本身。因此一個自然的想法就是設計一種編碼方法,對此差值進行編碼,而不是對抽樣值本身進行編碼,這樣所需的比特率必然可以下降,這就是差分脈沖編碼(DPCM)。為了獲得盡可能小的量化信噪比,應該對小信號采用較小的量化步長,對大信號可采用較大的量化步長。由于對不同講話者和在不同環(huán)境下,話音能量的差別可高達40dB,即使在同一話音中,不同時刻的信號幅度也會有相當大的變化,因此有必要根據(jù)輸入信號的幅度變化動態(tài)地調整量化步長。這樣可使量化器范圍和輸入信號的動態(tài)范圍相匹配,減小量化噪聲,從而進一步降低編碼比特率,這就是自適應量化技術。它可用于PCM、DPCM和DM。對于線性量化來說,只需控制一個量化步長即可。對于非線性量化來說,則要根據(jù)給定的非線性特性控制多個量化步長。自適應線性預測的基本原理:根據(jù)話音波形的時間相關性確定預測系數(shù),使差分信號的方差為最小,時間相關性則是以自相關函數(shù)來度量的。由于話音信號的自相關函數(shù)大體是隨音節(jié)而變化的,也就是在一個音節(jié)時間內自相關函數(shù)基本不變,只是從一個音節(jié)至另一音節(jié)時才有較明顯的變化,因此,自適應預測都采用音節(jié)適應算法。在此,一個音節(jié)的時間常稱為一幀。為了計算預測系數(shù),需要設定一個數(shù)據(jù)取樣窗口。設窗口寬度為N,則每幀需用到N個抽樣值,利用這些樣值估算自相關函數(shù)值,并進而計算預測系數(shù)。和差分編碼類似,這N個抽樣值可以直接取自于輸入信號,由緩沖寄存器暫存,也可以由量化后的差分信號反饋后重構生成。前者稱為前饋(feedforward)自適應預測,又稱開環(huán)自適應預測,是根據(jù)原始信號調整預測系數(shù)的。后者知稱為反饋(feedback)自適應預測,又稱閉環(huán)自適應預測,是根據(jù)重構信號調整系數(shù)的。(2)參數(shù)編碼參數(shù)編碼器又稱為聲碼器(Vocoder),它的原理和設計思想和波形編碼完全不同。波形編碼的基本思路是忠實地再現(xiàn)話音的時域波形,為了降低比特率,可以充分利用相鄰抽樣點之間的信息冗余性,對差分信號進行編碼,在不影響話音質量的前提下,比特率可降至32kbit/s。在話務過載的情況下,還可降質使用24或16kbit/s編碼,但要進一步降低比特率就有困難了。參數(shù)編碼根據(jù)對聲音形成機理的分析、著眼于構造話音生成模型,該模型以一定精度模擬發(fā)話者的發(fā)聲聲道,接收端根據(jù)該模型還原生成發(fā)話者的音素,在頻域上該模型就對應為具有一定零極點分布的數(shù)字濾波器。編碼器發(fā)送的主要信息就是該模型的參數(shù),相當于話音的主要特征,而并非具體的話音波形幅值。而且由于話音信號變化是緩慢的,一個音素要持續(xù)相當長一段時間(相對于抽樣周期而言),因此模型參數(shù)的更新頻度較低,不但可以利用抽樣值間的相關性,還可以充分利用幀與幀之間的信息冗余性以及更長時間段中的音源信息冗余性,有效地降低編碼比特率。因此,目前小于16kbit/s的低比特率話音編碼都采用參數(shù)編碼。雖然參數(shù)編碼和波形編碼的原理完全不同,但是歸根到底信息都取自于對抽樣值的分析計算,為了去除冗余信息都需對差分信號(或稱殘差信號)進行處理,因此在技術上兩者并無明顯的界線,許多技術,如線性預測、自適應預測、矢量量化等既可用于參數(shù)編碼,也可用于波形編碼。兩種編碼技術的比較:波形編碼的基本出發(fā)點是最小化原信號和重構信號之間的差值信號,最小化判據(jù)一般為以“塊”為基礎的差分信號的均方差,塊可以小到單個話音抽樣。波形編碼的設計要求是獲得盡可能高的信噪比(SNR)。改進的編碼器還考慮人類聽覺系統(tǒng)的主觀感覺效果,為此可設置屏蔽濾波器,修正原信號和重構信號。這樣SNR有可能下降,但主觀感覺質量反而會提高。波形編碼器主要利用話音波形的短時相關性,特別是相鄰抽樣點之間的相關性來降低比特率,改進算法還考慮了長時相關性。參數(shù)編碼的基本出發(fā)點是根據(jù)確定的成音模型確定模型參數(shù),雖然LPC聲碼器也是通過殘差信號的最小化進行計算的,但是其著眼點是要求模型參數(shù)的最佳值,而并非SNR的最大化。 ,碼率為64kbit/s,主要包括A律和u律兩種,都是采用壓擴方法。它將13位或14位的PCM編碼轉換成8位A律或u律的壓擴編碼,質量相當于12位比特的線性量化,同時還規(guī)定了A律和u律之間的轉換關系。設歸一化輸入信號為x,則采用A律的壓縮函數(shù)為:當x=0時,y趨于負的無窮,這樣不滿足壓縮特性的要求,所以當x很小時,應對它加以修正,過零點做切線,這就是公式的上式,他是一個線性方程,A=1時無壓縮,A值越大壓縮效果越明顯。 折線逼近的壓縮方程曲線x為壓縮器歸一化輸入電壓;y為壓縮器歸一化輸出電壓;A為常數(shù),決定壓縮程度;4 IP電話原理及技術 lP電話基本原理IP電話是通過Internet/Intranet等互聯(lián)網(wǎng)絡來傳遞語音信息的,該系統(tǒng)包括終端設備、網(wǎng)關、多點接入控制單元(MCU)和網(wǎng)絡管理者等部分。其基本原理是:通過語音壓縮算法對語音數(shù)據(jù)進行壓縮編碼處理,然后把這些語音數(shù)據(jù)按TCP/IP標準進行打包,經(jīng)過IP網(wǎng)絡把數(shù)據(jù)包送至接收地,再把這些語音數(shù)據(jù)包串起來,經(jīng)過解碼解壓處理后,恢復成原來的語音信號,從而達到由互聯(lián)網(wǎng)傳送語音的目的。由于IP電話使用了分組交換和統(tǒng)計復用技術,實現(xiàn)了語音、數(shù)據(jù)的綜合傳輸,從而克服了傳統(tǒng)電話對緊缺通信帶寬的高額消耗(一路電話話音占用了64Kbps的帶寬),而它只需要6一8Kbps(),大大地節(jié)省了通信帶寬,使得整個網(wǎng)絡的運營成本大幅度降低。這對于渴望減少巨額國際傳統(tǒng)電話通話費用的公司來說,用IP電話帶來的好處是顯而易見的。接收器A/D轉換壓縮編碼器IP封裝/發(fā)送器Internet播放器D/A轉換壓縮解碼器IP解包/接收器 IP電話的關鍵技術IP電話的關鍵技術包括分組語音技術、語音編碼和壓縮技術、靜音檢測、分組丟失補償和回波抵消等。傳統(tǒng)的電話網(wǎng)是以電路交換的方式傳輸語音,它需要的基本帶寬為64kbit/s。而要在基于IP的分組網(wǎng)絡上傳輸語音,就必須對模擬的語音信號進行特殊的處理,使處理后的信號可以適合在面向無連接的分組網(wǎng)絡上傳輸,這就是分組語音技術。語音編碼就是將語音信息轉換為分組信息以及將分組信息轉換為語音,其中包括優(yōu)化編碼方案、尋找最佳算法、對語音進行高效、優(yōu)質的編解碼以及語音恢復等。 無論對實時的應用(如IP電話)還是非實時的應用(如語音郵件),發(fā)送端語音都要經(jīng)過模擬信號—數(shù)字信號—語音包的處理過程,并在接收端對語音包進行相反處理,從而得到與輸入端相同的語音信號。所以可將分組語音的處理流程分為發(fā)送端處理流程和接收端處理流程。(l)發(fā)送端處理流程:首先,把模擬信號轉換為數(shù)字信號,并對其進行進入緩沖器前的量化數(shù)據(jù)處理。先對模擬信號進行8位或16位量化,然后再送入緩沖區(qū),再由編碼器對語音塊(也被稱為幀)進行編碼,典型幀為10一30ms,考慮到傳輸過程中的代價,語音包通常由60、120或者240ms長的語音數(shù)據(jù)組成。其次,把語音包按照特定的幀長進行編碼。大部分的編碼器都有特定的幀尺寸,若一個編碼器使用15ms的幀,則把第一級來的包分成8幀,并按順序進行編碼。每個幀合120個語音樣點(抽樣頻率為skHz)。編碼后,將8個壓縮的幀合成一個壓縮的語音包送入網(wǎng)絡處理器。最后網(wǎng)絡處理器為語音包添加包頭、時標和其它信息后通過網(wǎng)絡傳送出去。(2) 接收端處理流程:首先,網(wǎng)絡提供一個可變長度的緩沖區(qū),用來調節(jié)網(wǎng)絡產(chǎn)生的抖動。緩沖區(qū)可容納許多語音包,用戶可選擇緩沖區(qū)的大小,大的緩沖區(qū)能調節(jié)大的抖動,但產(chǎn)生延遲較大,小的緩沖區(qū)產(chǎn)生延遲較小,但不能調節(jié)大的抖動。其次,解碼器將接收到的語音包進行解壓縮產(chǎn)生新的語音包。這里也可按幀進行操作,完全和編碼器的長度相同。若幀長為15ms,則120ms的語音包被分成8幀,然后被解碼還原成120ms的語音數(shù)據(jù)流送入解碼緩沖區(qū)。最后,緩沖區(qū)中的語音樣點被播放驅動器取出送入聲卡,通過揚聲器按預定的頻率(如8kHz)播出。 模擬語音信號必須經(jīng)過處理,轉換成適合在護網(wǎng)絡上傳輸?shù)腎P數(shù)據(jù)包。這個過程需要先進行數(shù)字編碼,轉換為PCM碼,然后經(jīng)過專門的DSP芯片進行數(shù)據(jù)壓縮,最后再打上IP包的標記,形成IP數(shù)據(jù)包的形式,以適合IP網(wǎng)絡上的傳輸帶寬,其中涉及到PCM、DSP、編碼、壓縮等內容。(l)PCM技術:脈沖編碼調制(Pusle Code Modulation簡稱PCM),是指把模擬信號轉化為數(shù)字信號的過程,為目前世界各國主要采用的方式。PCM包括抽樣、量化和編碼三個過程。編碼形式有多種,如:低速編碼和高速編碼。線性編碼和非線性編碼。逐次反饋型、級聯(lián)型和混合性等。(2) DSP技術:DSP是數(shù)字信號處理器(digital signal Proeessor)的縮寫,屬于MPU(微處理器)的一種,它主要應用于聲音壓縮、圖像壓縮等數(shù)字壓縮技術領域,能將聲音、圖像等模擬信號高速轉變成數(shù)字信號。DSP是一種特殊的單片機,同時也是一個嵌入式系統(tǒng)。網(wǎng)絡設備中引入了DSP技術,使得交換以太網(wǎng)和快速交換以太網(wǎng)變得更快、更便宜、也更容易升級?,F(xiàn)在數(shù)字信號處理器廣泛用于調制解調器和移動電話,發(fā)展非常迅速。DSP優(yōu)于RISC處理器,其原因在于DSP有嵌入的協(xié)處理器和用于快速數(shù)據(jù)處理的并行數(shù)據(jù)通道。另外,基礎系統(tǒng)和擴展模塊中的DSP也能分擔一些數(shù)據(jù)處理的任務。進入九十年代后,DSP技術發(fā)展十分驚人,目前已成為不少新興科技的主要推動力,其中包括電信和多媒體技術,以DSP作為主要元件,再加上外圍設備和特定的功能單元綜合成的單一芯片,加速了DSP方案的發(fā)展。也揭開了通信及消費電子市場合一的新紀元。通過Intemet傳輸實時的語音或圖像與傳輸普通數(shù)據(jù)是不一樣的,應用網(wǎng)絡的組成必須符合這種實時傳輸?shù)男枰?能支持高品質的VoIP(Voice over IP)應用是走向成功的一個關鍵因素。語音的分組傳送通常要求網(wǎng)絡提供充足的帶寬,所以對現(xiàn)有的多數(shù)IP網(wǎng)絡而言,話音壓縮技術是實施IP語音通信的關鍵所在。語音壓縮協(xié)議有上面提到的協(xié)議中帶G打頭的幾種。編碼壓縮方法由ITU統(tǒng)一制定,并標準化。它的壓縮能力由DSP
點擊復制文檔內容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1