freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

中山大學(xué)信息科學(xué)與技術(shù)學(xué)院(編輯修改稿)

2025-03-18 15:41 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 ltimediadirectoryservices),– 例如黃頁(yè) (yellowpages);? 廣播媒體的選擇,– 例如無(wú)線電頻道, TV頻道等;? 多媒體編輯,– 例如個(gè)人電子新聞服務(wù),多媒體創(chuàng)作等等。? 潛在應(yīng)用的應(yīng)用領(lǐng)域包括:– 教育、娛樂(lè)、新聞、旅游、醫(yī)療、購(gòu)物等等。 中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEG聲音 ? 與前面章節(jié)介紹的波形聲音壓縮編碼 (如ADPCM)和參數(shù)編碼 (如 LPC)不同, MPEG1和MPEG2的聲音數(shù)據(jù)壓縮編碼不是依據(jù)波形本身的相關(guān)性和模擬人的發(fā)音器官的特性,而是利用人的聽(tīng)覺(jué)系統(tǒng)的特性來(lái)達(dá)到壓縮聲音數(shù)據(jù)的目的,這種壓縮編碼稱為感知聲音編碼(perceptualaudiocoding)。? 進(jìn)入 20世紀(jì) 80年代之后,尤其最近幾年,人類在利用自身的聽(tīng)覺(jué)系統(tǒng)的特性來(lái)壓縮聲音數(shù)據(jù)方面取得了很大的進(jìn)展,先后制定了 MPEG1Audio,MPEG2Audio和 MPEG2AAC等標(biāo)準(zhǔn)。 中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEG聲音? MPEGAudio壓縮編碼算法中的三個(gè)特性:– 響度、– 音高– 掩蔽效應(yīng)。中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEG聲音對(duì)響度的感知 ? 聲音的響度就是聲音的強(qiáng)弱。– 在物理上,聲音的響度使用客觀測(cè)量單位來(lái)度量,即 dyn/cm2(達(dá)因 /平方厘米 )(聲壓 )或 W/cm2(瓦特 /平方厘米 )(聲強(qiáng) )。– 在心理上,主觀感覺(jué)的聲音強(qiáng)弱使用響度級(jí) “方(phon)”或者 “宋 (sone)”來(lái)度量。? 這兩種感知聲音強(qiáng)弱的計(jì)量單位是完全不同的兩種概念,但是它們之間又有一定的聯(lián)系。中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEG聲音? 當(dāng)聲音弱到人的耳朵剛剛可以聽(tīng)見(jiàn)時(shí),我們稱此時(shí)的聲音強(qiáng)度為 “聽(tīng)閾 ”。– 例如, 1kHz純音的聲強(qiáng)達(dá)到 1016w/cm2(定義成零 dB聲強(qiáng)級(jí) )時(shí),人耳剛能聽(tīng)到,此時(shí)的主觀響度級(jí)定為零方。實(shí)驗(yàn)表明,聽(tīng)閾是隨頻率變化的。測(cè)出的 “聽(tīng)閾 — 頻率 ”曲線如圖 901所示。圖中最靠下面的一根曲線叫做 “零方等響度級(jí) ”曲線,也稱“絕對(duì)聽(tīng)閾 ”曲線,即在安靜環(huán)境中,能被人耳聽(tīng)到的純音的最小值。? 另一種極端的情況是聲音強(qiáng)到使人耳感到疼痛。– 實(shí)驗(yàn)表明,如果頻率為 1kHz的純音的聲強(qiáng)級(jí)達(dá)到 120dB左右時(shí) , 人的耳朵就感到疼痛,這個(gè)閾值稱為 “痛閾 ”。對(duì)不同的頻率進(jìn)行測(cè)量,可以得到 “痛閾 — 頻率 ”曲線,如圖 901中最靠上面所示的一根曲線。這條曲線也就是 120方等響度級(jí)曲線。中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEG聲音? 在 “聽(tīng)閾 — 頻率 ”曲線和 “痛閾 — 頻率 ”曲線之間的區(qū)域就是人耳的聽(tīng)覺(jué)范圍。這個(gè)范圍內(nèi)的等響度級(jí)曲線也是用同樣的方法測(cè)量出來(lái)的。由圖 901可以看出, 1kHz的 10dB的聲音和 200Hz的 30dB的聲音,在人耳聽(tīng)起來(lái)具有相同的響度。? 圖 901說(shuō)明人耳對(duì)不同頻率的敏感程度差別很大,其中對(duì) 2kHz~ 4kHz范圍的信號(hào)最為敏感,幅度很低的信號(hào)都能被人耳聽(tīng)到。而在低頻區(qū)和高頻區(qū),能被人耳聽(tīng)到的信號(hào)幅度要高得多。 圖 901 “聽(tīng)閾 —頻率 ”曲線 中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEG聲音對(duì)音高的感知 ? 客觀上用頻率來(lái)表示聲音的音高,其單位是 Hz。而主觀感覺(jué)的音高單位則是 “美 (Mel)”,主觀音高與客觀音高的關(guān)系是 :Mel=log2(1+f),其中 的單位為 Hz,這也是兩個(gè)既不相同又有聯(lián)系的單位。 ? 人耳對(duì)響度的感覺(jué)有一個(gè)范圍,即從聽(tīng)閾到痛閾。同樣,人耳對(duì)頻率的感覺(jué)也有一個(gè)范圍。人耳可以聽(tīng)到的最低頻率約 20Hz,最高頻率約 18000Hz。正如測(cè)量響度時(shí)是以 1kHz純音為基準(zhǔn)一樣,在測(cè)量音高時(shí)則以40dB聲強(qiáng)為基準(zhǔn),并且同樣由主觀感覺(jué)來(lái)確定。中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEG聲音? 測(cè)量主觀音高時(shí),讓實(shí)驗(yàn)者聽(tīng)兩個(gè)聲強(qiáng)級(jí)為 40dB的純音,固定其中一個(gè)純音的頻率,調(diào)節(jié)另一個(gè)純音的頻率,直到他感到后者的音高為前者的兩倍,就標(biāo)定這兩個(gè)聲音的音高差為兩倍。實(shí)驗(yàn)表明,音高與頻率之間也不是線性關(guān)系。測(cè)出的 “音高 — 頻率 ”曲線如圖所示。 “音高 —頻率 ”曲線 中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEG聲音? 掩蔽效應(yīng) ? 一種頻率的聲音阻礙聽(tīng)覺(jué)系統(tǒng)感受另一種頻率的聲音的現(xiàn)象稱為掩蔽效應(yīng)。– 前者稱為掩蔽聲音 (maskingtone),– 后者稱為被掩蔽聲音 (maskedtone)。? 掩蔽可分成頻域掩蔽和時(shí)域掩蔽。中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年? 一個(gè)強(qiáng)純音會(huì)掩蔽在其附近同時(shí)發(fā)聲的弱純音,這種特性稱為頻域掩蔽,也稱同時(shí)掩蔽 (simultaneousmasking)。 – 如圖 903所示,一個(gè)聲強(qiáng)為 60dB、頻率為 1000Hz的純音,另外還有一個(gè) 1100Hz的純音,前者比后者高 18dB,在這種情況下我們的耳朵就只能聽(tīng)到那個(gè) 1000Hz的強(qiáng)音。如果有一個(gè) 1000Hz的純音和一個(gè)聲強(qiáng)比它低 18dB的 2023Hz的純音,那么我們的耳朵將會(huì)同時(shí)聽(tīng)到這兩個(gè)聲音。要想讓 2023Hz的純音也聽(tīng)不到,則需要把它降到比1000Hz的純音低 45dB。一般來(lái)說(shuō),弱純音離強(qiáng)純音越近就越容易被掩蔽。聲強(qiáng)為 60 dB、頻率為 1000 Hz純音的掩蔽效應(yīng) 中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年? 在圖 904中的一組曲線分別表示頻率為 250Hz、 1kHz、 4kHz和 8kHz純音的掩蔽效應(yīng),它們的聲強(qiáng)均為 60dB。從圖中可以看到:– 在 250Hz、 1kHz、 4kHz和 8kHz純音附近,對(duì)其他純音的掩蔽效果最明顯,– 低頻純音可以有效地掩蔽高頻純音,但高頻純音對(duì)低頻純音的掩蔽作用則不明顯。不同純音的掩蔽效應(yīng)曲線 中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年由于聲音頻率與掩蔽曲線不是線性關(guān)系,為從感知上來(lái)統(tǒng)一度量聲音頻率,引入了 “臨界頻帶 (critical band)”的概念。通常認(rèn)為,在 20 Hz到 16 kHz范圍內(nèi)有24個(gè)臨界頻帶,如下表所示。臨界頻帶的單位叫 Bark(巴克 )中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEG聲音? 時(shí)域掩蔽 ? 除了同時(shí)發(fā)出的聲音之間有掩蔽現(xiàn)象之外,在時(shí)間上相鄰的聲音之間也有掩蔽現(xiàn)象,并且稱為時(shí)域掩蔽。? 時(shí)域掩蔽又分為超前掩蔽 (premasking)和滯后掩蔽 (postmasking),如圖所示。產(chǎn)生時(shí)域掩蔽的主要原因是人的大腦處理信息需要花費(fèi)一定的時(shí)間。一般來(lái)說(shuō),超前掩蔽很短,只有大約 5~ 20ms,而滯后掩蔽可以持續(xù) 50~ 200ms。這個(gè)區(qū)別也是很容易理解的。中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEGAudio與感知特性 ? MPEGAudio標(biāo)準(zhǔn)在本書(shū)中是指 MPEG1Audio、 MPEG2Audio和 MPEG2AAC,它們處理 10Hz~ 20230Hz范圍里的聲音數(shù)據(jù)。? 數(shù)據(jù)壓縮的的主要依據(jù)是人耳朵的聽(tīng)覺(jué)特性,使用 “心理聲學(xué)模型(psychoacousticmodel)”來(lái)達(dá)到壓縮聲音數(shù)據(jù)的目的。中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEGAudio與感知特性 ? 心理聲學(xué)模型中一個(gè)基本的概念就是聽(tīng)覺(jué)系統(tǒng)中存在一個(gè)聽(tīng)覺(jué)閾值電平,低于這個(gè)電平的聲音信號(hào)就聽(tīng)不到,因此就可以把這部分信號(hào)去掉。– 聽(tīng)覺(jué)閾值的大小隨聲音頻率的改變而改變,各個(gè)人的聽(tīng)覺(jué)閾值也不同。大多數(shù)人的聽(tīng)覺(jué)系統(tǒng)對(duì) 2kHz~ 5kHz之間的聲音最敏感。– 一個(gè)人是否能聽(tīng)到聲音取決于聲音的頻率,以及聲音的幅度是否高于這種頻率下的聽(tīng)覺(jué)閾值。? 心理聲學(xué)模型中的另一個(gè)概念是聽(tīng)覺(jué)掩飾特性,意思是聽(tīng)覺(jué)閾值電平是自適應(yīng)的,即聽(tīng)覺(jué)閾值電平會(huì)隨聽(tīng)到的不同頻率的聲音而發(fā)生變化。– 例如,同時(shí)有兩種頻率的聲音存在,一種是 1000Hz的聲音,另一種是 1100Hz的聲音,但它的強(qiáng)度比前者低 18分貝,在這種情況下,1100Hz的聲音就聽(tīng)不到。– 也許你有這樣的體驗(yàn),在一安靜房間里的普通談話可以聽(tīng)得很清楚,但在播放搖滾樂(lè)的環(huán)境下同樣的普通談話就聽(tīng)不清楚了。聲音壓縮算法也同樣可以確立這種特性的模型來(lái)取消更多的冗余數(shù)據(jù)。中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEG1Audio? 聲音的數(shù)據(jù)量由兩方面決定:– 采樣頻率和樣本精度。– 對(duì)單聲道信號(hào)而言,每秒鐘的數(shù)據(jù)量 (位數(shù) )=采樣頻率 x樣本精度。要減小數(shù)據(jù)量,就需要降低采樣頻率或者降低樣本精度。– 但是人耳可聽(tīng)到的頻率范圍大約是 20Hz~ 20kHz。根據(jù)奈奎斯特理論,要想不失真地重構(gòu)信號(hào),采樣頻率不能低于 40kHz。– 再考慮到實(shí)際中使用的濾波器都不可能是理想濾波器,以及考慮各國(guó)所用的交流電源的頻率,為保證聲音頻帶的寬度,所以采樣頻率一般不能低于 kHz。– 這樣,壓縮就必須從降低樣本精度這個(gè)角度出發(fā),即減少每位樣本所需要的位數(shù)。中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEG1Audio? 前面介紹了線性預(yù)測(cè)編碼 (linearpredictivecoding,LPC)的方法,這種方法主要是針對(duì)話音的編碼,這種編碼方法稱為音源特定編碼法 (sourcespecificmethods)。? MPEG1和 MPEG2的聲音壓縮采用了另一種方法,稱為子帶編碼 (subbandcoding, SBC)方法,這也是一種功能很強(qiáng)而且很有效的聲音信號(hào)編碼方法。– 與音源特定編碼法不同, SBC不局限于只對(duì)話音進(jìn)行編碼,也不局限于哪一種聲源。– 這種方法的具體思想是首先把時(shí)域中的聲音數(shù)據(jù)變換到頻域,對(duì)頻域內(nèi)的子帶分量分別進(jìn)行量化和編碼,然后根據(jù)心理聲學(xué)模型確定樣本的精度,從而達(dá)到壓縮數(shù)據(jù)量的目的。中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEG1Audio? MPEG聲音數(shù)據(jù)壓縮的基礎(chǔ)是量化。– 雖然量化會(huì)帶來(lái)失真,但 MPEG標(biāo)準(zhǔn)要求量化失真對(duì)于人耳來(lái)說(shuō)是感覺(jué)不到的。在 MPEG標(biāo)準(zhǔn)的制定過(guò)程中, MPEGAudio委員會(huì)作了大量的主觀測(cè)試實(shí)驗(yàn)。實(shí)驗(yàn)表明,采樣頻率為 48kHz、樣本精度為 16比特的聲音數(shù)據(jù)壓縮到 256kb/s時(shí),即在 6: 1的壓縮率下,即使是專業(yè)測(cè)試員也很難分辨出是原始聲音還是編碼壓縮后的聲音。? MPEGAudio是一個(gè)子帶編碼系統(tǒng)。– 聲音數(shù)據(jù)壓縮算法的根據(jù)是心理聲學(xué)模型,心理聲學(xué)模型中一個(gè)最基本的概念是聽(tīng)覺(jué)系統(tǒng)中存在一個(gè)聽(tīng)覺(jué)閾值電平,低于這個(gè)電平的聲音信號(hào)就聽(tīng)不到。– 聽(tīng)覺(jué)閾值的大小隨聲音頻率的改變而改變,各個(gè)人的聽(tīng)覺(jué)閾值也不同。大多數(shù)人的聽(tīng)覺(jué)系統(tǒng)對(duì) 2kHz~ 5kHz之間的聲音最敏感。一個(gè)人是否能聽(tīng)到聲音取決于聲音的頻率,以及聲音的幅度是否高于這種頻率下的聽(tīng)覺(jué)閾值。中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年MPEG1Audio? 心理聲學(xué)模型中的另一個(gè)概念是聽(tīng)覺(jué)掩飾特性,意思是聽(tīng)覺(jué)閾值電平是自適應(yīng)的,即聽(tīng)覺(jué)閾值電平會(huì)隨聽(tīng)到的頻率不同的聲音而發(fā)生變化。– 例如,在一般環(huán)境下房間里的普通談話可以聽(tīng)得很清楚,但在搖滾樂(lè)環(huán)境下同樣的普通談話就聽(tīng)不清楚了。聲音壓縮算法也同樣可以確立這種特性的模型,根據(jù)這個(gè)模型可取消冗余的聲音數(shù)據(jù)。 MPEGAudio的壓縮算法框圖如圖所示。中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年? 而 MPEG聲音 (ISO/IEC111723)壓縮算法是世界上第一個(gè)高保真聲音數(shù)據(jù)壓縮國(guó)際標(biāo)準(zhǔn),并且得到了極其廣泛的應(yīng)用。? 雖然 MPEG聲音標(biāo)準(zhǔn)是 MPEG標(biāo)準(zhǔn)的一部分,但它也完全可以獨(dú)立應(yīng)用。? MPEG1聲音標(biāo)準(zhǔn)的主要性能如下: (1)如圖所示, MPEG編碼器的輸入信號(hào)為線性 PCM信號(hào),采樣率為 32, 48kHz,輸出為 32kb/s~ 384kb/s。MPEG編碼器的輸入 /輸出 中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年(2)MPEG聲音標(biāo)準(zhǔn)提供三個(gè)獨(dú)立的壓縮層次:層1(Layer1)、層 2(Layer2)和層 3(Layer3),用戶對(duì)層次的選擇可在復(fù)雜性和聲音質(zhì)量之間進(jìn)行權(quán)衡。 – 層 1的編碼器最為簡(jiǎn)單,編碼器的輸出數(shù)據(jù)率為 384kb/s,主要用于小型數(shù)字盒式磁帶 (digitalpactcassette, DCC)。– 層 2的編碼器的復(fù)雜程度屬中等,編碼器的輸出數(shù)據(jù)率為 256kb/s~ 192kb/s,其應(yīng)用包括數(shù)字廣播聲音 (digitalbroadcastaudio, DBA)、數(shù)字音樂(lè)、 CDI(pactdiscinteractive)和VCD(videopactdisc)等。– 層 3的編碼器最為復(fù)雜,編碼器的輸出數(shù)據(jù)率為 64kb/s,主要應(yīng)用于 ISDN上的聲音傳輸。中山大學(xué)信息科學(xué)與技術(shù)學(xué)院 , 黃劍多媒體技術(shù)基礎(chǔ) ,2023年? 在盡可能保持 CD
點(diǎn)擊復(fù)制文檔內(nèi)容
規(guī)章制度相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1