freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

音頻信息的獲取與處理-wenkub

2022-10-28 16:45:44 本頁面
 

【正文】 ? 量化 采樣只解決了音頻波形信號在時間坐標(biāo) (即橫軸 )上把一個波形切成若干個等分的數(shù)字化問題,但是每一等分的長方形的高是多少呢 ? 即需要用某種數(shù)字化的方法來反映某一瞬間聲波幅度的電壓值的大小。 用公式表示如下: T≤ 1/2fc 或 fc ≤ 1/2T 采樣的著名實例就在我們的日常生活中 , 例如電話和 CD唱片 。采樣頻率是指計算機(jī)每秒鐘采集多少個聲音樣本。采樣定理看來象是一個數(shù)學(xué)問題,而實質(zhì)上它為數(shù)字化技術(shù)奠定了一個基礎(chǔ)。 采樣和量化的過程可由 A/D轉(zhuǎn)換器實現(xiàn)。 在這 4級質(zhì)量中,以 CDDA的聲音質(zhì)量等級最高,其余次之。按照帶寬可將聲音質(zhì)量分為 4級: ?數(shù)字激光唱盤質(zhì)量 , 通常又 CDDA質(zhì)量,這種質(zhì)量也就是我們常說的超高保真,即 Super HiFi(High Fidelity)??梢哉f,人的感覺機(jī)理最具有決定意義。 度量聲音客觀質(zhì)量的一個主要指標(biāo)是信噪比 SNR( Signal to Noise Ration), 信噪比是有用信號與噪聲之比的簡稱。聲級計是一種能對聲音作出類似人耳的反應(yīng)的儀器,同時,它能進(jìn)行客觀而可重復(fù)的聲壓和聲級測量。這些帶計算機(jī)處理系統(tǒng)的高級聲學(xué)測量儀器,能完成下列一些測量工作: ?評價值的測量 響度和響度級,噪音級,清晰度指數(shù),噪音評價數(shù)。聲音質(zhì)量的評價是一個很困難的問題,也是一個值得研究的課題。元音是一種能連續(xù)發(fā)出的樂音,輔音主要是不能連續(xù)發(fā)出的短促的噪音,元音與輔音合成漢語音節(jié)。不同的發(fā)音體所發(fā)出的音波都有自己的特異性。 A/D轉(zhuǎn)換的一個關(guān)鍵步驟是聲音的采樣和量化,得到數(shù)字音頻信號,它在時間上是不連續(xù)的離散信號。對音頻信號,聲音的強(qiáng)度用分貝 (dB)表示,分貝的幅度就是音量。周期和頻率之間的關(guān)系是互為倒數(shù)。 人們在日常說話時的語音信號頻率范圍在 300Hz~ 3000Hz之間。 用聲音錄制軟件記錄的英文單詞“ Hello” 的語音實際波形 ? 模擬音頻信號的物理特征 模擬音頻信號有兩個重要參數(shù):頻率和幅度。在物理上,聲音可用一條連續(xù)的曲線來表示。語音是語言的物質(zhì)載體,是社會交際工具的符號 , 它包含了豐富的語言內(nèi)涵,是人類進(jìn)行信息交流所特有的形式。數(shù)字化處理的核心是對音頻信息的采樣,通過對采集到的樣本進(jìn)行加工,生成各種效果。這里,密紋唱片、盒式磁帶等是記錄儲存這種模擬聲音信號的載體,而能夠播放和(或)記錄這些軟件的信號處理設(shè)備,諸如電唱機(jī)、磁帶錄音機(jī)等,則稱為模擬音響設(shè)備。最終電聲技術(shù)獲得了迅速發(fā)展。所以與其他研究領(lǐng)域相比,聲學(xué)的研究相對滯后。輸入可以是自然語言或語音命令,輸出可以是語音或音樂,這些都會涉及到音頻處理技術(shù)。第 2章 音頻信息的獲取與處理 聲音是多媒體信息的一個重要組成部分 ,也是表達(dá)思想和情感的一種必不可少的媒體。 ? 音頻信號及其概念 ? 聲音處理技術(shù)歷史回顧 語言、音樂和各種自然聲是以聲波為載體傳遞信息的基本形式 。直到 19世紀(jì)愛迪生發(fā)明了留聲機(jī),人們才能用機(jī)械的方法把各種聲音記錄在唱片上。 電聲技術(shù)是研究可聽聲頻率范圍內(nèi)聲音的產(chǎn)生、傳播、存儲、重放和接收的技術(shù)。 電聲技術(shù)把聲信號轉(zhuǎn)換成電信號,經(jīng)擴(kuò)聲系統(tǒng)直接進(jìn)行擴(kuò)聲;或者將其信號利用磁帶、 CD或其他存儲形式,使聲音可超越時間和空間,通過重放系統(tǒng)將其信號(數(shù)字的或模擬的)經(jīng)過放大,由揚(yáng)聲器或耳機(jī)轉(zhuǎn)換成聲信號,進(jìn)入最后的終端 人耳,以實現(xiàn)任何時間和地點的聲音重現(xiàn)。音頻信息在多媒體中的應(yīng)用是極為廣泛的,當(dāng)計算機(jī)配有聲卡和音箱后,就能夠發(fā)出各種悅耳的聲音,尤其是視頻圖像配以娓娓動聽的音樂和語音,使計算機(jī)的操作得以藉由視覺以外的聽覺加以輔助而成為一種愉快的過程。非語音信號主要包括音樂和自然界存在的其他聲音形式。這條連續(xù)的曲線無論多復(fù)雜,都可分解成一系列正弦波的線性疊加。聲音的頻率體現(xiàn)音調(diào)的高低,聲波幅度的大小體現(xiàn)聲音的強(qiáng)弱。頻率小于 20 Hz的信號稱為亞音 (Subsonic); 頻率范圍為 20Hz~ 20kHz的信號稱為音頻 (Audio), 高于 20kHz的信號稱為超音頻(Ultrasonic)。 信號的幅度是從信號的基線到當(dāng)前波峰的距離。 幅度限 周期 基線 ? 聲音的 A/D與 D/A轉(zhuǎn)換 模擬信號很容易受到電子干擾,因此隨著技術(shù)的發(fā)展,聲音信號就逐漸過渡到了數(shù)字存儲階段,A/D轉(zhuǎn)換和 D/A轉(zhuǎn)換技術(shù)便應(yīng)運而生。 借助于 A/D或 D/A轉(zhuǎn)換器,模擬信號和數(shù)字信號可以互相轉(zhuǎn)換 8 位可編程 A/D 轉(zhuǎn)換芯片 ? 與聲音有關(guān)的幾個術(shù)語 音高是人對聲波頻率的主觀屬性,它首先與聲波的頻率有關(guān)。聲波的類型是多種多樣的,一般可分為純音和復(fù)合音兩大類。 響度是聲波振幅的主觀屬性,它是由聲波的振幅引起的。目前來看,聲音質(zhì)量的度量有兩種基本方法,一種是客觀質(zhì)量度量,另一種是主觀質(zhì)量的度量。 ?聲源的測量 頻譜的時間變化,聲功率,指向性,效率,頻譜特征,幅值分布等。聲壓測量的好處很多:它能幫助音樂廳提高音響效果;能對煩擾聲音進(jìn)行精密的、科學(xué)的分析。其單位是分貝 (dB)。當(dāng)然,可靠的主觀度量值是較難獲得的。 ?調(diào)頻無線電廣播,簡稱 FM(Frequency Modulation)質(zhì)量。 4級聲音質(zhì)量的頻率范圍 音頻測試儀 ( A U D I O T E ST ) ? 模擬音頻的數(shù)字化過程 如果要用計算機(jī)對音頻信息進(jìn)行處理,則首先要將模擬音頻信號(如語音、音樂等)轉(zhuǎn)變成數(shù)字信號。 A/D轉(zhuǎn)換器以固定的頻率去采樣,即每個周期測量和量化信號一次。 為實現(xiàn) A/D轉(zhuǎn)換,需要把模擬音頻信號波形進(jìn)行分割,以轉(zhuǎn)變成數(shù)字信號,這種方法稱為采樣 (Sampling)。采樣頻率越高,即采樣的間隔時間越短,則在單位時間內(nèi)計算機(jī)得到的聲音樣本數(shù)據(jù)就越多,對聲音波形的表示也越精確。 在數(shù)字電話系統(tǒng)中 , 為將人的聲音變?yōu)閿?shù)字信號 , 采用脈沖編碼調(diào)制 PCM方法 , 每秒鐘可進(jìn)行 8000次的采樣 。該值的大小影響音量的高低。也就是說在一個以 8位為記錄模式的音效中,其縱軸將會被劃分為個量化等級(quantization levels), 用以記錄其幅度大小。這就好比是量一個人的身高,若是以毫米為單位來測量,會比用厘米為單位量更加準(zhǔn)確。圖中每個正方形表示一次采樣。 失真在采樣過程中是不可避免的,如何減少失真呢?可以直觀地看出,我們可以把圖 22中的波形劃分成更為細(xì)小的區(qū)間,即采用更高的采樣頻率。從圖中可以看出,當(dāng)用 D/A轉(zhuǎn)換器重構(gòu)原來信號時(圖中的輪廓線),信號的失真明顯減少,信號質(zhì)量得到了提高。在數(shù)據(jù)回放時,可以根據(jù)所記錄的糾錯數(shù)據(jù)判別讀出的聲音數(shù)據(jù)是否有錯,如在一定范圍內(nèi)有錯,可加以糾正。 模擬信號經(jīng)過采樣再經(jīng)量化 , 然后用有限個二進(jìn)制碼去代表量化后的幅度 , 在編碼器中引入的量化誤差在解碼時無法消除 , 這一誤差等效于引入了噪聲 、 降低了信噪比 。 在 ISO的紅皮書 ( Red Book) 標(biāo)準(zhǔn)中 , 規(guī)定 CDDA每24字節(jié)雙聲道音頻數(shù)據(jù)為一幀 , 對每一幀數(shù)據(jù)編碼后要形成幀同步碼 、 子碼 ( 用于控制和顯示 ) 及糾錯碼 , 采用差錯校驗碼 CIRC, 用來檢測和糾正因 CD表面的劃傷或灰塵產(chǎn)生的差錯 。因此每個扇區(qū)所含音頻數(shù)據(jù)量為 98 24 = 2352( Byte), 它使得一張 CD唱盤上可容納約 74分鐘的立體聲音樂信號。在播放這些聲音時,需要經(jīng)解碼器將二進(jìn)制編碼恢復(fù)成原來的聲音信號播放。利用該性質(zhì),可以抑制與信號同時存在的量化噪音。音頻數(shù)據(jù)表達(dá)的是一維隨時間變化的函數(shù),因而聲音數(shù)據(jù)的壓縮比圖像數(shù)據(jù)壓縮要容易得多。波形編碼技術(shù)有 PCM( 脈沖編碼調(diào)制)、 ADPCM( 自適應(yīng)差分脈沖編碼調(diào)制)和 ATC( 自適應(yīng)變換編碼)等 。 得到語音參數(shù)后 , 就可以對其進(jìn)行線性預(yù)測編碼 ( LPCLinear Predictive Coding) 。下面我們介紹波形編碼方案中常用的PCM編碼。 PCM 編碼是對連續(xù)語音信號進(jìn)行空間采樣、幅度值量化及用適當(dāng)碼字將其編碼的總稱。均勻量化 PCM就是直接對聲音信號作 A/D轉(zhuǎn)換,在處理過程中沒有利用聲音信號的任何特性,也沒有進(jìn)行壓縮。這樣所記錄和產(chǎn)生的音樂,可以達(dá)到最接近原聲的效果。這樣就可以在滿足精度要求的情況下用較少的位數(shù)實現(xiàn)編碼 。 ? 律的計算公式如下: )]([)1l n (]x ( n )u1l n [)( m a xm a x nxs ig nuXXny??? 其中是信號 x(n)的最大幅度 , u是控制壓縮程序的參數(shù) , u越大壓縮就越厲害 圖 27給出了按 ?律壓擴(kuò)算法的輸入輸出特性曲線 , ?為確定壓縮量的參數(shù) , 它反映最大量化間隔和最小量化間隔之比 。 無論是 A律還是 ?律算法 , 它們的特性在輸入信號振幅小時都呈線性 , 在輸入信號振幅大時呈對數(shù)壓縮特性 。為了提高信號傳輸和存儲的效率,人們多方致力于信源編碼的研究,力圖在保證聲音質(zhì)量的前提下,降低信源編碼的數(shù)據(jù)速率,并由此產(chǎn)生了一系列的國際的區(qū)域的標(biāo)準(zhǔn)。以上兩個標(biāo)準(zhǔn)均適用于 300?3400Hz窄帶語音信號,也可用于公用電話網(wǎng)。 在 ATamp。 它采用長時延自適應(yīng) CELP方案 , 適應(yīng)于更低速率的語音壓縮 , 主要應(yīng)用在保密話音通信 。 MPEG音頻根據(jù)不同的算法分為三個層次。 MPEG音頻的層次 3進(jìn)一步引入了輔助子帶、非均勻量化和熵編碼等技術(shù),可以進(jìn)一步壓縮率。 ASPEC (Adaptive Spectral Perceptual Entropy Coding of high quality musical signal) 表示高質(zhì)量音樂信號自適應(yīng)譜感知熵編碼。用于保存 Windows平臺的音頻信息資源,被 Windows平臺及其應(yīng)用程序所廣泛支持。 WAV數(shù)據(jù)塊是由數(shù)據(jù)子塊標(biāo)記 、 數(shù)據(jù)子塊長度和波形音頻數(shù)據(jù) 3個數(shù)據(jù)子塊組成 。 與 WAV格式類似, VOC文件由文件頭塊和音頻數(shù)據(jù)塊組成。 MPEG音頻文件的壓縮是一種有損壓縮,根據(jù)壓縮質(zhì)量和編碼復(fù)雜程度的不同可分為三層 (MPEG Audio Layer 1/2/3), 分別對應(yīng) MPMP2和 MP3這三種聲音文件; MPEG音頻編碼具有很高的壓縮率 , MP1和 MP2的壓縮率分別為 4∶ 1和 6∶ 1~ 8∶ 1, 而 MP3的壓縮率則高達(dá)10∶ 1~ 12∶ 1, 也就是說一分鐘 CD音質(zhì)的音樂 , 未經(jīng)壓縮需要 10MB存儲空間 , 而經(jīng)過 MP3壓縮編碼后只有 1MB左右 , 同時其音質(zhì)基本保持不失真 。 ? 音頻卡(聲卡)發(fā)展的歷史 ?ADLIB最早的聲卡 雖然 PC聲卡是在 90年代才得以普及,但它的問世卻早在 1984年。創(chuàng)新科技有限公司是世界上規(guī)模最大的多媒體硬件生產(chǎn)商和制造商之一,其 “ 聲霸卡 ” 和“ 視霸卡 ” 系列產(chǎn)品在全球占有很高的市場份額。此后推出的 Sound Blaster Pro加入了對立體聲信號的支持。在 20世紀(jì) 90年代中期,16bit、 44KHz、 立體聲 D/A轉(zhuǎn)換代表了聲卡的最高技術(shù)水平。這里的 32和 64不再表示數(shù)字音頻的位數(shù),而是表示 32和 64種復(fù)音的波表合成技術(shù),它們?nèi)允?16位聲卡。高級的音色庫定制和編輯,使用戶可以在計算機(jī)上制作音樂,進(jìn)行作曲。 波形表音樂合成 (詳見后續(xù)章節(jié)) 文語轉(zhuǎn)換和語音識別 文語轉(zhuǎn)換就是把計算機(jī)內(nèi)的文本轉(zhuǎn)換成聲音 語音識別將語音識別為計算機(jī)能理解的文字或命令 (二)音頻卡的分類 (1) 音頻卡的分類主要是根據(jù)采樣量化的位數(shù)來分類的。 計算聲音文件公式如下: S=D x R x( r/8) x聲道數(shù) D代表采樣頻率, R代表采樣時間以秒計算, r代表量化位 (二)、音頻卡的分類 (2) 一、獨立音頻卡,插在主板的 ISA或 PCI槽中?,F(xiàn)在已經(jīng)出現(xiàn)了 6聲道的板載聲卡,板載 。 PC 總線 數(shù)據(jù)總線驅(qū)動器 總線接口和控制器 游戲接口 MIDI 接口 混合信號處理器 數(shù)字聲音處理器 MIC放大器 功率放大器 音樂合成器 音樂合成器 地址總線 控制總線 MIC 揚(yáng)聲器 CD line 音頻卡的工作原理圖 音頻卡的工作原理 ?音頻卡簡稱聲卡,它將模擬音頻進(jìn)行模數(shù)轉(zhuǎn)換送入計算機(jī),進(jìn)行處理后再經(jīng)過數(shù)模轉(zhuǎn)換,輸出加工后的合成音頻。 第三、人而對語音信號的相位變化不敏感。 ( 3)基于人的聽覺特性進(jìn)行編碼,利用掩蔽效應(yīng),設(shè)計心理學(xué)模型,從而實現(xiàn)高效率的數(shù)字音頻的壓縮。 ( 2) DPCM:即只傳輸語音預(yù)測值和樣本值的差值,以此降低音頻數(shù)據(jù)的
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1