freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于dsp語音信號線性與非線性量化相互轉(zhuǎn)化的新方法(編輯修改稿)

2025-07-22 01:17 本頁面
 

【文章內(nèi)容簡介】 門脈沖的頻譜,乘系數(shù) Av 的作用是調(diào)節(jié)濁音信號的幅度。清音時,激勵信號由一個隨機噪聲發(fā)生器產(chǎn)生??稍O(shè)定其平均值為 0,其自相關(guān)函數(shù)是一個單位沖激函數(shù)。這表明它的任何兩個不同樣點都不相關(guān)且其均方差值為 1。此外,還假定它的幅度具有正態(tài)概率分布。乘系數(shù) Au 的作用是調(diào)節(jié)清音信號的幅度[10]。聲道模型 V(z)給出了離散時域的聲道傳輸函數(shù),把實際聲道作為一個變截面聲管加以研究,采用流體力學的方法可以導出,在大多數(shù)情況下 V(z)是一個全極點函數(shù)。因此,V(z)可以表示為: ()式中,a0=1,ai為實數(shù)。這里,把截面積連續(xù)變化的聲管近似為 p 段短聲管的串聯(lián),每段短聲管的截面積是不變的,p 稱為這個全極點濾波器的階。顯然,p值取得越大,模型的傳輸函數(shù)與聲道實際傳輸函數(shù)的吻合程度就越高。一般地,對大多數(shù)實際應(yīng)用而言,p 值取 8~12。若 p 取偶數(shù),一般有 p/2 對共軛極點,極點的頻率分別與語音的各個共振峰相對應(yīng)。輻射模型 R(z)與嘴型有關(guān),一般可以表示為: ()在這個模型中,除了 G(z)和 R(z)保持不變以外,基音頻率、Av、Au、清/濁音開關(guān)的位置以及聲道模型中的參數(shù)都是隨時間而變化的。對于聲道參數(shù)而言,在 10~30ms 的時間間隔內(nèi)可以認為它們保持不變,因此語音的短時分析幀長一般取為 10~30ms 左右。對激勵源參數(shù),大部分情況下這一結(jié)論是正確的。在現(xiàn)代通信中,作為組成通信系統(tǒng)的最基本單元之一的信源,如果不經(jīng)過任何處理,會存在大量的冗余成分,直接經(jīng)信道進行傳輸將會造成帶寬的極大浪費。所以,信源需要先經(jīng)過壓縮處理,即信源編碼,然后再經(jīng)信道傳輸。語音信號是通信系統(tǒng)中使用最多的信源之一,它是模擬信號,而現(xiàn)代通信系統(tǒng)基本上都是數(shù)字通信系統(tǒng),所以必須先對該模擬信號進行模數(shù)轉(zhuǎn)換,將其數(shù)字化;數(shù)字化后的語音信號,再經(jīng)過壓縮處理后方可進行傳輸和存儲。在接收端,對信號進行解壓縮處理和D/A轉(zhuǎn)換,還原成原始的模擬語音信號。這就是語音編解碼技術(shù)。模擬語音信號數(shù)字化后再進行壓縮編碼處理,可減小存儲空間或降低傳輸比特率,從而節(jié)省傳輸帶寬。語音編解碼技術(shù)的方法歸納起來,主要分為三大類,即波形編碼、參數(shù)編碼和混合編碼。波形編碼是最簡單且應(yīng)用最早的語音編碼方法,它實施簡單、性能優(yōu)良,但是其編碼比特率最高,在16kbps到64kbps之間,且一般很難再進一步下降,;參數(shù)編碼的語音編碼速率較低,語音的可懂度較好,但音質(zhì)較差,只能達到合成語音質(zhì)量,且其聲碼器對環(huán)境噪聲比較敏感,其次是算法復(fù)雜度較高,、(CELP)等均為參數(shù)編碼;混合編碼吸收了波形編碼和參數(shù)編碼各自的優(yōu)點并克服它們的缺點,在較低的比特率上獲得較高的語音質(zhì)量,其比特率一般在4kbps16kbps之間,多脈沖激勵線性預(yù)測編碼(MPLPC),規(guī)則脈沖激勵線性預(yù)測編碼(RPELPC)和碼本激勵線性預(yù)測編碼(CELP)等都屬于混合編碼[3,4,5]。,即64kbps的脈沖編碼調(diào)制(PCM)。到目前為止,標準PCM系統(tǒng)仍然占據(jù)著統(tǒng)治地位,被廣泛應(yīng)用在數(shù)字通信、數(shù)字交換機等領(lǐng)域,El標準接口中采用的即是歐洲的30路脈沖編碼調(diào)制PCM。隨后,即32kbps的自適應(yīng)脈沖差分編碼ADPCM,在達到和PCM相同語音質(zhì)量的基礎(chǔ)上,它具有更優(yōu)良的抗誤碼性能,并且速率降低一半。接著,ITU又提出了子帶.,8kbps的共軛結(jié)構(gòu).。l標準(,高速率采用多脈沖最大似然量化MP.MLQ技術(shù),低速率采用代數(shù)碼本激勵線性預(yù)測ACELP技術(shù))等[5,6,7]。2語音壓縮的理論依據(jù)與算法語音通信經(jīng)歷了從模擬信號到數(shù)字信號的發(fā)展過程,最初電話通信傳輸?shù)氖钦Z音模擬信號,傳輸?shù)男什桓?,而且傳輸不是特別可靠、高效。因為模擬信號在傳輸一段距離后會減弱,當信號變?nèi)鯐r,必須對它們定期放大。這種信號放大既加強了語音信號,也加強了背景線路噪聲,要將復(fù)雜的模擬語音信號和傳輸噪聲區(qū)分開來是很困難的。為了進一步提高語音的傳輸質(zhì)量和存儲效率,克服模擬傳輸?shù)娜秉c,人們又引入了語音信號數(shù)字處理技術(shù),對語音信號進行數(shù)字化處理。數(shù)字信號只有“1”和“0”兩種狀態(tài),易于同噪聲區(qū)分開,不易發(fā)生畸變,而且易于存儲和遠距離傳輸。但是語音信號在數(shù)字化之后,比特率卻大幅上升,也就是每秒需要更多的比特數(shù)去存儲或傳輸,這樣就使成本提高。隨著信息技術(shù)的發(fā)展,信道資源顯得更加寶貴,為了在有限的信道內(nèi)進行更多的信息傳輸,必須對語音信號進行壓縮。對語音信號進行壓縮編碼的基本依據(jù)是語音信號的冗余度和人的聽覺感知機理。語音信號存在多種多樣的冗余,可分別從時間域和頻率域描述。從時間域分析:幅度的非均勻分布,即語音中的小幅度樣本出現(xiàn)的概率高,且通話中會有間隙信息,主要集中在低功率上;語音信號采樣數(shù)據(jù)間存在相關(guān)性,相鄰的樣本間有很強的相關(guān)性,如果采樣率提高,相關(guān)性將更強;濁音語音段具有準周期性,波形顯示出周期間的信息冗余,對語音濁音部分編碼最有效的方法之一是對一個音調(diào)間隔波形來編碼,并以其作為同樣聲音中其他基音段的參照;語音間隙,實際語音通信中,存在通話間隙,通話分析表明,全雙工話路的典型效率約為通話時間的 40%,即靜止系數(shù)為 ;長時自相關(guān),除了樣本間、同期間的相關(guān)外,在較長的時間間隔上,語音信號也存在相關(guān)。從頻率域分析:非均勻的長時功率譜密度,從相當長的時間內(nèi)統(tǒng)計平均,語音信號的功率譜呈現(xiàn)強烈的非平坦性,這說明語音信號對給定的頻段利用不充分,存在固定的冗余度;語音特有的短時功率譜密度,語音信號的短時功率譜在某些頻率上出現(xiàn)峰值,而在另一些頻率上出現(xiàn)谷值,這些峰值頻率是能量較大的頻率,稱為共振峰,共振峰頻率由低到高依次排列為第一共振峰、第二共振峰等,語音特征主要由前三個共振峰頻率決定,隨著頻率的增高,對整個功率譜的影響會快速遞減。語音壓縮的第二個依據(jù)是利用人類聽覺的感知機理,其影響主要表現(xiàn)在三個方面: “掩蔽”效應(yīng),即一個強音能夠抑制另一個同時存在的弱音的聽覺,利用這一性質(zhì)可以抑制與信號同時存在的量化噪聲。人的聽覺對低頻語音比較敏感,而對高頻語音不太敏感,這主要是因為濁音的周期和共振峰。通過對人耳做短時的頻率分析,表明人耳對信號的音調(diào)很敏感,但對信號相位感知不敏感。人耳聽不到或感知極不靈敏的語音信號都可以認為是冗余,可以利用這些特性進行語音數(shù)據(jù)壓縮。對語音信號進行數(shù)字化和壓縮,既可以提高語音傳輸?shù)馁|(zhì)量,又能提高傳輸?shù)男剩詫φZ音壓縮編碼技術(shù)的研究一直是一個熱點,特別是近十多年來,語音編碼技術(shù)取得了突飛猛進的發(fā)展,出現(xiàn)了多個國際標準和區(qū)域標準,己具備比較完善的理論和技術(shù)體系,隨著高速信號處理器的誕生,使多種算法復(fù)雜、計算量很大的編碼技術(shù)的實時化變得容易起來,語音壓縮編碼進入實用階段。建立語音信號的數(shù)字模型對于語音處理具有重要的意義。人們對語音信號進行大量的分析、模擬和實驗以后,得出了語音信號產(chǎn)生的數(shù)字模型[8]。它是指利用數(shù)字技術(shù)來模擬語音信號的產(chǎn)生,也就是利用數(shù)字信號處理技術(shù)來實現(xiàn)發(fā)音器官的模擬。為了使?jié)嵋舻臎_激信號具有聲門脈沖的實際波形,還需要使上述的沖激序列通過一個聲門脈沖模型濾波器 G(z)。其傳輸函數(shù)表示為: ()基音頻率聲門脈沖模型脈沖周期發(fā)生器聲道模型 Av 聲道參數(shù) 輻射模型 隨機噪聲發(fā)生器 Au 語音信號的數(shù)字模型該模型包括三個部分:激勵源、聲道模型和輻射模型[9]。激勵源分為濁音和清音兩種,按照濁音/清音開關(guān)所處的位置來決定產(chǎn)生的語音是濁音還是清音。濁音時,激勵信號由一個周期脈沖發(fā)生器產(chǎn)生,產(chǎn)生的序列是一個頻率等于基音頻率的沖激序列。對聲門波形的頻譜分析表明,其幅度頻譜按每倍頻程 12dB 的速度遞減,如果 G(z)中 g1和 g2都很接近于 1,那么由之形成的濁音激勵信號頻譜很接近于聲門脈沖的頻譜,乘系數(shù) Av 的作用是調(diào)節(jié)濁音信號的幅度。清音時,激勵信號由一個隨機噪聲發(fā)生器產(chǎn)生??稍O(shè)定其平均值為 0,其自相關(guān)函數(shù)是一個單位沖激函數(shù)。這表明它的任何兩個不同樣點都不相關(guān)且其均方差值為 1。此外,還假定它的幅度具有正態(tài)概率分布。乘系數(shù) Au 的作用是調(diào)節(jié)清音信號的幅度[10]。聲道模型 V(z)給出了離散時域的聲道傳輸函數(shù),把實際聲道作為一個變截面聲管加以研究,采用流體力學的方法可以導出,在大多數(shù)情況下 V(z)是一個全極點函數(shù)。因此,V(z)可以表示為: ()式中,a0=1,ai為實數(shù)。這里,把截面積連續(xù)變化的聲管近似為 p 段短聲管的串聯(lián),每段短聲管的截面積是不變的,p 稱為這個全極點濾波器的階。顯然,p值取得越大,模型的傳輸函數(shù)與聲道實際傳輸函數(shù)的吻合程度就越高。一般地,對大多數(shù)實際應(yīng)用而言,p 值取 8~12。若 p 取偶數(shù),一般有 p/2 對共軛極點,極點的頻率分別與語音的各個共振峰相對應(yīng)。輻射模型 R(z)與嘴型有關(guān),一般可以表示為: ()在這個模型中,除了 G(z)和 R(z)保持不變以外,基音頻率、Av、Au、清/濁音開關(guān)的位置以及聲道模型中的參數(shù)都是隨時間而變化的。對于聲道參數(shù)而言,在 10~30ms 的時間間隔內(nèi)可以認為它們保持不變,因此語音的短時分析幀長一般取為 10~30ms 左右。對激勵源參數(shù),大部分情況下這一結(jié)論是正確的。在現(xiàn)代通信中,作為組成通信系統(tǒng)的最基本單元之一的信源,如果不經(jīng)過任何處理,會存在大量的冗余成分,直接經(jīng)信道進行傳輸將會造成帶寬的極大浪費。所以,信源需要先經(jīng)過壓縮處理,即信源編碼,然后再經(jīng)信道傳輸。語音信號是通信系統(tǒng)中使用最多的信源之一,它是模擬信號,而現(xiàn)代通信系統(tǒng)基本上都是數(shù)字通信系統(tǒng),所以必須先對該模擬信號進行模數(shù)轉(zhuǎn)換,將其數(shù)字化;數(shù)字化后的語音信號,再經(jīng)過壓縮處理后方可進行傳輸和存儲。在接收端,對信號進行解壓縮處理和D/A轉(zhuǎn)換,還原成原始的模擬語音信號。這就是語音編解碼技術(shù)。模擬語音信號數(shù)字化后再進行壓縮編碼處理,可減小存儲空間或降低傳輸比特率,從而節(jié)省傳輸帶寬。語音編解碼技術(shù)的方法歸納起來,主要分為三大類,即波形編碼、參數(shù)編碼和混合編碼。波形編碼是最簡單且應(yīng)用最早的語音編碼方法,它實施簡單、性能優(yōu)良,但是其編碼比特率最高,在16kbps到64kbps之間,且一般很難再進一步下降,;參數(shù)編碼的語音編碼速率較低,語音的可懂度較好,但音質(zhì)較差,只能達到合成語音質(zhì)量,且其聲碼器對環(huán)境噪聲比較敏感,其次是算法復(fù)雜度較高,、(CELP)等均為參數(shù)編碼;混合編碼吸收了波形編碼和參數(shù)編碼各自的優(yōu)點并克服它們的缺點,在較低的比特率上獲得較高的語音質(zhì)量,其比特率一般在4kbps16kbps之間,多脈沖激勵線性預(yù)測編碼(MPLPC),規(guī)則脈沖激勵線性預(yù)測編碼(RPELPC)和碼本激勵線性預(yù)測編碼(CELP)等都屬于混合編碼[3,4,5]。,即64kbps的脈沖編碼調(diào)制(PCM)。到目前為止,標準PCM系統(tǒng)仍然占據(jù)著統(tǒng)治地位,被廣泛應(yīng)用在數(shù)字通信、數(shù)字交換機等領(lǐng)域,El標準接口中采用的即是歐洲的30路脈沖編碼調(diào)制PCM。隨后,即32kbps的自適應(yīng)脈沖差分編碼ADPCM,在達到和PCM相同語音質(zhì)量的基礎(chǔ)上,它具有更優(yōu)良的抗誤碼性能,并且速率降低一半。接著,ITU又提出了子帶.,8kbps的共軛結(jié)構(gòu).。l標準(,高速率采用多脈沖最大似然量化MP.MLQ技術(shù),低速率采用代數(shù)碼本激勵線性預(yù)測ACELP技術(shù))等[5,6,7]。2語音壓縮的理論依據(jù)與算法語音通信經(jīng)歷了從模擬信號到數(shù)字信號的發(fā)展過程,最初電話通信傳輸?shù)氖钦Z音模擬信號,傳輸?shù)男什桓?,而且傳輸不是特別可靠、高效。因為模擬信號在傳輸一段距離后會減弱,當信號變?nèi)鯐r,必須對它們定期放大。這種信號放大既加強了語音信號,也加強了背景線路噪聲,要將復(fù)雜的模擬語音信號和傳輸噪聲區(qū)分開來是很困難的。為了進一步提高語音的傳輸質(zhì)量和存儲效率,克服模擬傳輸?shù)娜秉c,人們又引入了語音信號數(shù)字處理技術(shù),對語音信號進行數(shù)字化處理。數(shù)字信號只有“1”和“0”兩種狀態(tài),易于同噪聲區(qū)分開,不易發(fā)生畸變,而且易于存儲和遠距離傳輸。但是語音信號在數(shù)字化之后,比特率卻大幅上升,也就是每秒需要更多的比特數(shù)去存儲或傳輸,這樣就使成本提高。隨著信息技術(shù)的發(fā)展,信道資源顯得更加寶貴,為了在有限的信道內(nèi)進行更多的信息傳輸,必須對語音信號進行壓縮。對語音信號進行壓縮編碼的基本依據(jù)是語音信號的冗余度和人的聽覺感知機理。語音信號存在多種多樣的冗余,可分別從時間域和頻率域描述。從時間域分析:幅度的非均勻分布,即語音中的小幅度樣本出現(xiàn)的概率高,且通話中會有間隙信息,主要集中在低功率上;語音信號采樣數(shù)據(jù)間存在相關(guān)性,相鄰的樣本間有很強的相關(guān)性,如果采樣率提高,相關(guān)性將更強;濁音語音段具有準周期性,波形顯示出周期間的信息冗余,對語音濁音部分編碼最有效的方法之一是對一個音調(diào)間隔波形來編碼,并以其作為同樣聲音中其他基音段的參照;語音間隙,實際語音通信中,存在通話間隙,通話分析表明,全雙工話路的典型效率約為通話時間的 40%,即靜止系數(shù)為 ;長時自相關(guān),除了樣本間、同期間的相關(guān)外,在較長的時間間隔上,語音信號也存在相關(guān)。從頻率域分析:非均勻的長時功率譜密度,從相當長的時間內(nèi)統(tǒng)計平均,語音信號的功率譜呈現(xiàn)強烈的非平坦性,這說明語音信號對給定的頻段利用不充分,存在固定的冗余度;語音特有的短時功率譜密度,語音信號的短時功率譜在某些頻率上出現(xiàn)峰值,而在另一些頻率上出現(xiàn)谷值,這些峰值頻率是能量較大的頻率,稱為共振峰,共振峰頻率由低到高依次排列為第一共振峰、第二共振峰等,語音特征主要由前三個共振峰頻率決定,隨著頻率的增高,對整個功率譜的影響會快速遞減。語音壓縮的第二個依據(jù)是利用人類聽覺的感知機理,其影響主要表現(xiàn)在三個方面: “掩蔽”效應(yīng),即一個強音能夠抑制另一個同時存在的弱
點擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1