freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

多媒體計算機(jī)技術(shù)之?dāng)?shù)字語音處理技術(shù)-在線瀏覽

2025-02-23 06:10本頁面
  

【正文】 送時,將每個子帶的代碼復(fù)合起來。? 采用對每個子帶分別編碼的好處有二個。具有較高能量電平的子帶用大的量化階去量化,以減少總的量化噪聲。例如,在低頻子帶中,為了保護(hù)音調(diào)和共振峰的結(jié)構(gòu),就要求用較小的量化階、較多的量化級數(shù),即分配較多的比特數(shù)來表示樣本值。 子帶編碼方塊圖子帶編碼? 對每個子帶分別編碼的好處是: n 可以利用人耳(或人眼)對不同頻率信號的感知靈敏度不同的特性,在人的聽覺(或視覺)不敏感的頻段采用較粗糙的量化,從而達(dá)到數(shù)據(jù)壓縮的目的。 數(shù)字音頻壓縮技術(shù)? ?音頻壓縮算法的分類? ?時域壓縮算法? ?子帶編碼? MP3音頻壓縮編碼MP3音頻壓縮編碼 ? MP3是一種音頻壓縮的國際技術(shù)標(biāo)準(zhǔn)。? 1989年,夫朗和費(fèi)研究所在德國被獲準(zhǔn)取得了MP3的專利權(quán),幾年后這項技術(shù)被提交到國際標(biāo)準(zhǔn)組織 (ISO),整合進(jìn)入了 MPEG1標(biāo)準(zhǔn)。 MP3的全稱是 MovingExpertsAudio3,它所使用的技術(shù)是在 VCD( MPEG1)的音頻壓縮技術(shù)上發(fā)展出的第三代,而不是 MPEG3。 MPEG音頻文件根據(jù)壓縮質(zhì)量和編碼復(fù)雜程度的不同可分為三層( MPEGLAYER? MPEG音頻編碼具有很高的壓縮率, MP1和 MP2的壓縮率分別為 4:1和 6:18:1,而 MP3的壓縮率則高達(dá) 10:1~ 12:1,也就是說一分鐘 CD音質(zhì)的音樂未經(jīng)壓縮需要 10MB存儲空間,而經(jīng)過 MP3壓縮編碼后只有 1MB左右,同時其音質(zhì)基本保持不失真。 MP3為降低聲音失真采取了名為 “ 感官編碼技術(shù) ” 的編碼算法:編碼時先對音頻文件進(jìn)行頻譜分析,然后用過濾器濾掉噪音,接著通過量化的方式將剩下的每一位打散排列,最后形成具有較高壓縮比的 MP3文件,并使壓縮后的文件在回放時能夠達(dá)到比較接近原音源的聲音效果。 音頻編碼標(biāo)準(zhǔn) ? ? ? ? ? ? 音頻編碼標(biāo)準(zhǔn)比較 1972年 CCITT為電話質(zhì)量和語音壓縮制定了 PCM標(biāo)準(zhǔn) 。 ? 1988年 CCITT為調(diào)幅廣播質(zhì)量的音頻信號壓縮制定了 ,它使用子帶編碼 (SBC)方案,其濾波器組將輸入信號分成高低兩個子帶信號,然后分別使用 ADPCM進(jìn)行編碼。 ? 64kb/s的數(shù)據(jù)率,而音頻信號的質(zhì)量要明顯高于 。它采用多脈沖激勵最大似然量化 (MPMLQ)算法,此標(biāo)準(zhǔn)可應(yīng)用于可視電話及 IP電話等系統(tǒng)中。 ITUT于 1996年 3月通過了 ,它使用 8kb/s的共軛結(jié)構(gòu)代數(shù)碼激勵線性預(yù)測(CSACELP)算法,此標(biāo)準(zhǔn)將在無線移動網(wǎng)、數(shù)字多路復(fù)用系統(tǒng)和計算機(jī)通信系統(tǒng)中應(yīng)用。IntensityTime? IID指距離音源較近的哪一邊耳朵,所收到的聲音強(qiáng)度比另一側(cè)高,感到聲音更大一些。 人類的聽覺? 耳廓(外耳)的作用是濾波器,根據(jù)聲音的不同角度,加強(qiáng) /減弱音波能量,過濾之后傳給大腦,讓我們更準(zhǔn)確地聲源的位置。換言之,低于此范圍是次聲波,高于此范圍是超聲波。頻率低的聲音波長大,因此我們很難判斷出低音的位置,卻能輕易分辨高音的方位。 人類的聽覺? 人類依靠一種稱為 HRTF( HeadTransfer每個人的 HRTF都不盡相同,還可以進(jìn)行交換。比較源信號和麥克風(fēng)的脈沖特性曲線就可以得到其中一個濾波效果。 三維音效? ?人類的聽覺? 3D音效的分類? 杜比 AC3? DTS 3D音效的分類? 3D音效的兩個最重要因素是定位和交互。? 實時的定位就是交互,聲音并非預(yù)選錄制好的,而是按照你的控制來決定聲音的位置。 3D音效的分類? 擴(kuò)展式立體聲n 它使用聲音延遲技術(shù)對傳統(tǒng)的立體聲進(jìn)行額外處理,擴(kuò)寬了音場的位置,使聲音延展到音箱以外的空間,讓我們感覺的 3D世界更廣闊 ? 環(huán)繞立體聲n 它采用音頻壓縮技術(shù) (如:杜比 AC3)把多通道音源編碼成一段程序,再以一組多揚(yáng)聲器系統(tǒng)來進(jìn)行解碼,實現(xiàn)多區(qū)域環(huán)繞效果。 三維音效? ?人類的聽覺? ?杜比 AC3可以把五個獨(dú)立的全頻帶和一個超低音通道的信號實行統(tǒng)一編碼,成為單一的復(fù)合數(shù)據(jù)流。177。177。數(shù)碼率可低至單聲道的 32kb/s,高到多聲道 640kb/s,以適應(yīng)不同需要。 ATC算法的一個重要考慮是基于人耳聽覺掩蔽效應(yīng)的臨界頻帶理論,即在臨界頻帶內(nèi)一個聲音對另一個聲音信號的掩蔽效應(yīng)最明顯。 三維音效? ?人類的聽覺? ?Theatre? 從技術(shù)上講, DTS與包括 Dolby Dolby? DTS公司用一種簡單的辦法解決了這個問題,即把音效數(shù)據(jù)存儲到另外的 CDROM中,使其與影像數(shù)據(jù)同步。 DTS? DTSAC3 DTS1536kbps,壓縮傳輸比為 AC3448kbps,壓縮比為 正是由于 DTS? DTSDTSDVD, CD聲道信息。和杜比數(shù)字在音質(zhì)上有著明顯的不同,前者聲音力度強(qiáng)勁,聲音的上升和切入都很尖銳,音場的透明感清晰可聞,尤其是豐富的低音效果表現(xiàn)得更加激烈火爆。 ? 60年代,計算機(jī)的應(yīng)用推動了語音識別的發(fā)展。 ? 80年代,語音識別研究進(jìn)一步走向深入,其顯著特征是HMM模型和人工神經(jīng)元網(wǎng)絡(luò)( ANN)在語音識別中的成功應(yīng)用。 語音識別技術(shù)的發(fā)展歷史 如圖表示了從 80年代初以來語音識別技術(shù)經(jīng)歷的從孤立詞、小詞匯量、特定人到大詞匯量、非特定人、自然口語識別的發(fā)展歷程。 ? 語音識別技術(shù)主要包括 特征提取技術(shù) 、 模式匹配準(zhǔn)則 及 模型訓(xùn)練 技術(shù)三個方面。 特征參數(shù)提取技術(shù) ? 語音信號中含有豐富的信息,這些信息稱為語音信號的聲學(xué)特征 ? 特征提取是對語音信號進(jìn)行分析處理,去除對語音識別無關(guān)緊要的冗余信息,獲得影響語音識別的重要信息 ? 由于語音信號的時變特性,特征提取必須在一小段語音信號上進(jìn)行,也即進(jìn)行短時分析 常用的一些聲學(xué)特征 ? 線性預(yù)測系數(shù) LPC ? 倒譜系數(shù) CEP ? Mel倒譜系數(shù) MFCC和感知線性預(yù)測 PLP 模式匹配及模型訓(xùn)練技術(shù) ? 模型訓(xùn)練是指按照一定的準(zhǔn)則,從大量已知模式中獲取表征該模式本質(zhì)特征的模型參數(shù),而模式匹配則是根據(jù)一定準(zhǔn)則,使未知模式與模型庫中的某一個模型獲得最佳匹配。 典型語音識別系統(tǒng)的實現(xiàn)過程 語音識別單元的選取 ? 選擇識別單元是語音識別研究的第一步 ? 語音識別單元有 單詞 (句)、 音節(jié) 和 音素 三種 ? 單詞單元廣泛應(yīng)用于中小詞匯語音識別系統(tǒng) ? 音節(jié)單元多見于漢語語音識別 ? 音素單元以前多見于英語語音識別的研究中,但目前中、大詞匯量漢語語音識別系統(tǒng)也在越
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1