正文內容

多媒體計算機技術-4(編輯修改稿)

2025-02-09 06:05 本頁面

　

【文章內容簡介】。音頻編碼標準比較第四講數(shù)字語音處理技術 ?數(shù)字音頻壓縮技術三維音效語音識別自然語言理解語音合成三維音效人類的聽覺 3D音效的分類杜比 AC3 DTS 人類的聽覺人耳的基本聲音定位原理是 IID（ Interaural Intensity Difference，兩側聲音強度差別）和 ITD（ Interaural Time Difference，兩側聲音時間延遲差別）。 IID指距離音源較近的哪一邊耳朵，所收到的聲音強度比另一側高，感到聲音更大一些。 ITD指方位的不同，使聲音到達兩耳的時間有差別，人們會覺得聲音位于到達時間早些的那一邊，IID+ITD的結果是把音源定位到以聽者兩耳這間連線為軸線的錐體范圍之內。人類的聽覺耳廓（外耳）的作用是濾波器，根據(jù)聲音的不同角度，加強 /減弱音波能量，過濾之后傳給大腦，讓我們更準確地聲源的位置。耳廓的大小有限，因此能夠收到的音波范圍也有限，通常是 20Hz到20KHz，即波長 16米到。換言之，低于此范圍是次聲波，高于此范圍是超聲波。由于兩耳機的距離約為 15厘米，當波長大于 15厘米時 IIT和 ITD將會減弱。頻率低的聲音波長大，因此我們很難判斷出低音的位置，卻能輕易分辨高音的方位。實際上，耳廓對于聲音的定位，是至關重要的一環(huán)，沒有外耳的人難以判斷聲音發(fā)出的位置。人類的聽覺人類依靠一種稱為 HRTF（ Head Related Transfer Function，頭部關聯(lián)傳輸功能）的系統(tǒng)來判斷聲音發(fā)出的位置。每個人的 HRTF都不盡相同，還可以進行交換。 HRTF的檢測非常簡單，先在人的耳道內放置兩個微型麥克風，再在聽者附近放一個音箱，播放確定的信號，同時記錄麥克風收到的信號。比較源信號和麥克風的脈沖特性曲線就可以得到其中一個濾波效果。最后于聽者附近的所有位置重復上述過程，即可獲取完整的 HRTF系統(tǒng)。三維音效 ?人類的聽覺 3D音效的分類杜比 AC3 DTS 3D音效的分類 3D音效的兩個最重要因素是定位和交互。定位即讓人們準確地判斷出聲音的來源，可以通過預選錄制聲音，再進行特定的解碼來實現(xiàn)。實時的定位就是交互，聲音并非預選錄制好的，而是按照你的控制來決定聲音的位置。即時生成的交互式聲音對輸入設備的要求，比預選錄制音軌的放音設備（如：電影）要更強一些。 3D音效的分類擴展式立體聲 ? 它使用聲音延遲技術對傳統(tǒng)的立體聲進行額外處理，擴寬了音場的位置，使聲音延展到音箱以外的空間，讓我們感覺的 3D世界更廣闊環(huán)繞立體聲 ? 它采用音頻壓縮技術 (如：杜比 AC3)把多通道音源編碼成一段程序，再以一組多揚聲器系統(tǒng)來進行解碼，實現(xiàn)多區(qū)域環(huán)繞效果。交互式 3D音效 ? 交互式 3D盡量地復制了人耳在真實世界中聽到的聲音，并使用一定的算法來播放出來，讓我們感到整個三維空間的所有地方都可能產生聲音，并隨聽者的移動而做出相應改變。三維音效 ?人類的聽覺 ? 3D音效的分類杜比 AC3 DTS 杜比 AC3 為了提高 HDTV聲音的質量，避免模擬矩陣編碼的局限性，提出了雙通道的碼率提供多通道的編碼性能的設想，杜比 AC3就是為了實現(xiàn)這一設想而開發(fā)的。杜比 AC3可以把五個獨立的全頻帶和一個超低音通道的信號實行統(tǒng)一編碼，成為單一的復合數(shù)據(jù)流。 AC3的頻響為 20Hz～ 20kHz 177。(3dB時為3Hz～ )，超低聲道頻率范圍是 20Hz～120Hz 177?？芍С?32kHz、、 48kHz三種取樣頻率。數(shù)碼率可低至單聲道的 32kb/s,高到多聲道 640kb/s，以適應不同需要。杜比 AC3 AC3采用基于改良離散余弦變換（ MDCT）的自適應變換編碼（ ATC）算法。 ATC算法的一個重要考慮是基于人耳聽覺掩蔽效應的臨界頻帶理論，即在臨界頻帶內一個聲音對另一個聲音信號的掩蔽效應最明顯。因此 ,劃分頻帶的濾波器組要有足夠銳利的頻率響應，以保證臨界頻帶外的噪聲衰減足夠大，使時域和頻域內的噪聲限定在掩蔽門限以下。三維音效 ?人類的聽覺 ? 3D音效的分類 ?杜比 AC3 DTS DTS DTS是“ Digital Theatre System”的縮寫，是“數(shù)字化影院系統(tǒng)”的意思。從技術上講， DTS與包括 Dolby Digital在內的其它聲音處理系統(tǒng)是完全不同的。 Dolby Digital是將音效數(shù)據(jù)存儲在電影膠片的齒孔之間，因為空間的限制而必須采用大量的壓縮的模式，這樣就不得不犧牲部分音質。 DTS公司用一種簡單的辦法解決了這個問題，即把音效數(shù)據(jù)存儲到另外的 CDROM中，使其與影像數(shù)據(jù)同步。這樣不但空間得到增加，而且數(shù)據(jù)流量也可以相對變大，更可以將存儲音效數(shù)據(jù)的CD更換，來播放不同的語言版本。 DTS DTS 系統(tǒng)不僅具有 AC3 相似功能，更加強了其縱深定位交叉效果。 DTS 芯片容量為 1536kbps，壓縮傳輸比為 4:1；而 AC3 芯片容量為 448kbps，壓縮比為 10:1。正是由于DTS 信息容量的增加，音色更加優(yōu)美。 DTS 家庭影院的核心是 DTS 解碼器，它可對 DVD， CD 的杜比數(shù)字解碼，輸出聲道信息，也可以選擇 DTS方式，輸出 6 聲道信息。 DTS 和杜比數(shù)字在音質上有著明顯的不同，前者聲音力度強勁，聲音的上升和切入都很尖銳，音場的透明感清晰可聞，尤其是豐富的低音效果表現(xiàn)得更加激烈火爆。后者在低音方面缺少豐富的力度第四講數(shù)字語音處理技術 ?數(shù)字音頻壓縮技術 ?三維音效語音識別自然語言理解語音合成語音識別技術及應用語音識別的發(fā)展歷史語音識別技術語音識別系統(tǒng)的類型語音識別的應用語音識別的發(fā)展歷史語音識別技術的研究工作始于 20世紀 50年代，當時 ATT Bell實驗室實現(xiàn)了第一個可識別十個英文數(shù)字的語音識別系統(tǒng) —— Audry系統(tǒng)。 60年代，計算機的應用推動了語音識別的發(fā)展。 70年代，語音識別領域取得了突破。 80年代，語音識別研究進一步走向深入，其顯著特征是HMM模型和人工神經元網(wǎng)絡（ ANN）在語音識別中的成功應用。 90年代，隨著多媒體時代的來臨，迫切要求語音識別系統(tǒng)從實驗室走向實用。語音識別技術的發(fā)展歷史如圖表示了從 80年代初以來語音識別技術經歷的從孤立詞、小詞匯量、特定人到大詞

點擊復制文檔內容

環(huán)評公示相關推薦

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

多媒體計算機技術-4(編輯修改稿)

[精選]多媒體計算機硬件故障與-資料下載頁

多媒體計算機問答題-資料下載頁

[精選]多媒體計算機的組裝與調試-資料下載頁

[精選]多媒體計算機輔助教學-資料下載頁

[精選]多媒體計算機系統(tǒng)的組成-資料下載頁

多媒體計算機硬件系統(tǒng)構成-資料下載頁

[精選]第九章多媒體計算機-資料下載頁

[精選]第2章多媒體計算機系統(tǒng)-資料下載頁

[精選]第7章多媒體計算機系統(tǒng)-資料下載頁

多媒體計算機教室建設方案報告-資料下載頁

6多媒體計算機系統(tǒng)-資料下載頁

[精選]多媒體計算機系統(tǒng)常用硬件設備-資料下載頁

多媒體計算機組裝與維護教程第1章多媒體計算機硬件選購和配置-資料下載頁

[計算機]計算機多媒體技術題庫-資料下載頁

[精選]現(xiàn)代教育技術之多媒體計算機輔助教學-資料下載頁

多媒體計算機技術-4(更新版)

多媒體計算機技術-4(專業(yè)版)

多媒體計算機技術-4(留存版)

多媒體計算機技術-4-文庫吧