freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

多媒體計算機技術-4(編輯修改稿)

2025-02-09 06:05 本頁面
 

【文章內(nèi)容簡介】 。 音頻編碼標準比較 第四講 數(shù)字語音處理技術 ?數(shù)字音頻壓縮技術 三維音效 語音識別 自然語言理解 語音合成 三維音效 人類的聽覺 3D音效的分類 杜比 AC3 DTS 人類的聽覺 人耳的基本聲音定位原理是 IID( Interaural Intensity Difference,兩側聲音強度差別)和 ITD( Interaural Time Difference,兩側聲音時間延遲差別)。 IID指距離音源較近的哪一邊耳朵,所收到的聲音強度比另一側高,感到聲音更大一些。 ITD指方位的不同,使聲音到達兩耳的時間有差別,人們會覺得聲音位于到達時間早些的那一邊,IID+ITD的結果是把音源定位到以聽者兩耳這間連線為軸線的錐體范圍之內(nèi)。 人類的聽覺 耳廓(外耳)的作用是濾波器,根據(jù)聲音的不同角度,加強 /減弱音波能量,過濾之后傳給大腦,讓我們更準確地聲源的位置。耳廓的大小有限,因此能夠收到的音波范圍也有限,通常是 20Hz到20KHz,即波長 16米到 。換言之,低于此范圍是次聲波,高于此范圍是超聲波。 由于兩耳機的距離約為 15厘米,當波長大于 15厘米時 IIT和 ITD將會減弱。頻率低的聲音波長大,因此我們很難判斷出低音的位置,卻能輕易分辨高音的方位。實際上,耳廓對于聲音的定位,是至關重要的一環(huán),沒有外耳的人難以判斷聲音發(fā)出的位置。 人類的聽覺 人類依靠一種稱為 HRTF( Head Related Transfer Function,頭部關聯(lián)傳輸功能)的系統(tǒng)來判斷聲音發(fā)出的位置。每個人的 HRTF都不盡相同,還可以進行交換。 HRTF的檢測非常簡單,先在人的耳道內(nèi)放置兩個微型麥克風,再在聽者附近放一個音箱,播放確定的信號,同時記錄麥克風收到的信號。比較源信號和麥克風的脈沖特性曲線就可以得到其中一個濾波效果。最后于聽者附近的所有位置重復上述過程,即可獲取完整的 HRTF系統(tǒng)。 三維音效 ?人類的聽覺 3D音效的分類 杜比 AC3 DTS 3D音效的分類 3D音效的兩個最重要因素是定位和交互。 定位即讓人們準確地判斷出聲音的來源,可以通過預選錄制聲音,再進行特定的解碼來實現(xiàn)。 實時的定位就是交互,聲音并非預選錄制好的,而是按照你的控制來決定聲音的位置。即時生成的交互式聲音對輸入設備的要求,比預選錄制音軌的放音設備(如:電影)要更強一些。 3D音效的分類 擴展式立體聲 ? 它使用聲音延遲技術對傳統(tǒng)的立體聲進行額外處理,擴寬了音場的位置,使聲音延展到音箱以外的空間,讓我們感覺的 3D世界更廣闊 環(huán)繞立體聲 ? 它采用音頻壓縮技術 (如:杜比 AC3)把多通道音源編碼成一段程序,再以一組多揚聲器系統(tǒng)來進行解碼,實現(xiàn)多區(qū)域環(huán)繞效果。 交互式 3D音效 ? 交互式 3D盡量地復制了人耳在真實世界中聽到的聲音,并使用一定的算法來播放出來,讓我們感到整個三維空間的所有地方都可能產(chǎn)生聲音,并隨聽者的移動而做出相應改變。 三維音效 ?人類的聽覺 ? 3D音效的分類 杜比 AC3 DTS 杜比 AC3 為了提高 HDTV聲音的質(zhì)量,避免模擬矩陣編碼的局限性,提出了雙通道的碼率提供多通道的編碼性能的設想,杜比 AC3就是為了實現(xiàn)這一設想而開發(fā)的。杜比 AC3可以把五個獨立的全頻帶和一個超低音通道的信號實行統(tǒng)一編碼,成為單一的復合數(shù)據(jù)流。 AC3的頻響為 20Hz~ 20kHz 177。(3dB時為3Hz~ ),超低聲道頻率范圍是 20Hz~120Hz 177。可支持 32kHz、 、 48kHz三種取樣頻率。數(shù)碼率可低至單聲道的 32kb/s,高到多聲道 640kb/s,以適應不同需要。 杜比 AC3 AC3采用基于改良離散余弦變換( MDCT)的自適應變換編碼( ATC)算法。 ATC算法的一個重要考慮是基于人耳聽覺掩蔽效應的臨界頻帶理論,即在臨界頻帶內(nèi)一個聲音對另一個聲音信號的掩蔽效應最明顯。因此 ,劃分頻帶的濾波器組要有足夠銳利的頻率響應,以保證臨界頻帶外的噪聲衰減足夠大,使時域和頻域內(nèi)的噪聲限定在掩蔽門限以下。 三維音效 ?人類的聽覺 ? 3D音效的分類 ?杜比 AC3 DTS DTS DTS是“ Digital Theatre System”的縮寫,是“數(shù)字化影院系統(tǒng)”的意思。 從技術上講, DTS與包括 Dolby Digital在內(nèi)的其它聲音處理系統(tǒng)是完全不同的。 Dolby Digital是將音效數(shù)據(jù)存儲在電影膠片的齒孔之間,因為空間的限制而必須采用大量的壓縮的模式,這樣就不得不犧牲部分音質(zhì)。 DTS公司用一種簡單的辦法解決了這個問題,即把音效數(shù)據(jù)存儲到另外的 CDROM中,使其與影像數(shù)據(jù)同步。這樣不但空間得到增加,而且數(shù)據(jù)流量也可以相對變大,更可以將存儲音效數(shù)據(jù)的CD更換,來播放不同的語言版本。 DTS DTS 系統(tǒng)不僅具有 AC3 相似功能,更加強了其縱深定位交叉效果。 DTS 芯片容量為 1536kbps,壓縮傳輸比為 4:1;而 AC3 芯片容量為 448kbps,壓縮比為 10:1。正是由于DTS 信息容量的增加,音色更加優(yōu)美。 DTS 家庭影院的核心是 DTS 解碼器,它可對 DVD, CD 的杜比數(shù)字解碼,輸出 聲道信息,也可以選擇 DTS方式,輸出 6 聲道信息。 DTS 和杜比數(shù)字在音質(zhì)上有著明顯的不同,前者聲音力度強勁,聲音的上升和切入都很尖銳,音場的透明感清晰可聞,尤其是豐富的低音效果表現(xiàn)得更加激烈火爆。后者在低音方面缺少豐富的力度 第四講 數(shù)字語音處理技術 ?數(shù)字音頻壓縮技術 ?三維音效 語音識別 自然語言理解 語音合成 語音識別技術及應用 語音識別的發(fā)展歷史 語音識別技術 語音識別系統(tǒng)的類型 語音識別的應用 語音識別的發(fā)展歷史 語音識別技術的研究工作始于 20世紀 50年代,當時 ATT Bell實驗室實現(xiàn)了第一個可識別十個英文數(shù)字的語音識別系統(tǒng) —— Audry系統(tǒng)。 60年代,計算機的應用推動了語音識別的發(fā)展。 70年代,語音識別領域取得了突破。 80年代,語音識別研究進一步走向深入,其顯著特征是HMM模型和人工神經(jīng)元網(wǎng)絡( ANN)在語音識別中的成功應用。 90年代,隨著多媒體時代的來臨,迫切要求語音識別系統(tǒng)從實驗室走向?qū)嵱谩? 語音識別技術的發(fā)展歷史 如圖表示了從 80年代初以來語音識別技術經(jīng)歷的從孤立詞 、 小詞匯量 、 特定人到大詞
點擊復制文檔內(nèi)容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1