freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

音頻信息的獲取與處理(參考版)

2025-05-15 22:33本頁(yè)面
  

【正文】 例如在美國(guó)英語(yǔ)中,字母 t在 two, true, 和 butter中的發(fā)。雖然日常生活中常用的詞匯最多不超過一兩萬(wàn)個(gè),但每個(gè)專業(yè)的術(shù)語(yǔ)不少于幾萬(wàn)條。詞匯量小的識(shí)別系統(tǒng)需要用戶發(fā)出簡(jiǎn)單的命令,而朗讀文件時(shí),這一系統(tǒng)就必需有大的詞匯量。顯然,連續(xù)語(yǔ)音識(shí)別( Continuous Speech Recognition) 比不連續(xù)的識(shí)別更受歡迎,但它卻需要更多的處理能力。 隨著科學(xué)技術(shù)突飛猛進(jìn)的發(fā)展,尤其是網(wǎng)絡(luò)技術(shù)的迅速崛起、飛速發(fā)展,文語(yǔ)轉(zhuǎn)換技術(shù)將在人類社會(huì)生活中有著越來(lái)越廣泛的應(yīng)用。 ?信息服務(wù) 利用 TTS系統(tǒng)通過電話查詢信息。 ?計(jì)算機(jī)訓(xùn)練 利用 TTS系統(tǒng)對(duì)學(xué)生進(jìn)行某些特殊的言語(yǔ)訓(xùn)練。目前,已經(jīng)逐步實(shí)用化的有: ?殘障人士康復(fù) 發(fā)聲障礙者通過 TTS系統(tǒng)與其他人交談。隨著這兩方面技術(shù)的不斷發(fā)展,將會(huì)從根本上改善人機(jī)接口,從而使計(jì)算機(jī)以嶄新的面貌進(jìn)入人類生活,使計(jì)算機(jī)發(fā)揮出更大的作用。因此,構(gòu)造一個(gè)以語(yǔ)音為媒介與計(jì)算機(jī)進(jìn)行交互的系統(tǒng),即智能計(jì)算機(jī)界面,是人們長(zhǎng)久以來(lái)的夢(mèng)想,也是科技人員孜孜以求的目標(biāo)。當(dāng)今,人與計(jì)算機(jī)之間進(jìn)行交互的最常規(guī)手段是通過鍵盤輸入信息,通過屏幕或打印機(jī)以視覺形式輸出信息。 因此 , 研究更好的文語(yǔ)轉(zhuǎn)換方法 , 提高合成語(yǔ)音的自然度就成為當(dāng)務(wù)之急 。 總之 , TTS系統(tǒng)最根本的問題便在于它的自然度 , 自然度是衡量一個(gè) TTS系統(tǒng)好壞的最重要的指標(biāo) 。 因?yàn)檫B貫 TTS只播放一個(gè) WAV文件 ,所以它只用很少的處理能力 。 連貫 TTS可以被看成是一種聲音壓縮形式 , 因?yàn)閱卧~和常用的短語(yǔ)只能錄一次 。 數(shù)字化錄音是連貫的 , 因?yàn)槁曇羰鞘孪蠕浿频恼Z(yǔ)音 , 聽起來(lái)很舒服 。 通過這種方式 , TTS就能讀出任何單詞 , 甚至自造的詞 , 但是它發(fā)出的聲音不帶任何感情 , 帶有明顯的機(jī)器語(yǔ)音味道 。 %100???? N DISE TTS分為綜合的和連貫的兩種類型 。也就是說(shuō),要使計(jì)算機(jī)具有象人一樣、甚至比人更強(qiáng)的說(shuō)話能力。 語(yǔ)音識(shí)別系統(tǒng)的性能通常用單詞錯(cuò)誤率 E來(lái)度量: 其中, N是測(cè)試集的單詞總數(shù), S, I 和 D分別是替代、插入和刪除的總數(shù)。 目前語(yǔ)音識(shí)別的主要應(yīng)用是通過 TTS( TexttoSpeech, 文本 ——語(yǔ)音轉(zhuǎn)換器)和 SR( Speech Recognition, 語(yǔ)音識(shí)別器)實(shí)現(xiàn)的。隨著計(jì)算機(jī)科學(xué)和應(yīng)用的飛速發(fā)展,語(yǔ)音技術(shù)已日益廣泛地應(yīng)用于實(shí)際中。早在 70年代,國(guó)外就開始致力于語(yǔ)音識(shí)別技術(shù)的研究。 ? 語(yǔ)音識(shí)別技術(shù)及應(yīng)用 ? 語(yǔ)音識(shí)別技術(shù)概述 人的表達(dá)方式有多種,其中語(yǔ)音是最迅速、最常用和最自然的一種。 只是硬波表的音色庫(kù)是存放在聲卡的 ROM或 RAM中 , 而軟波表的音色庫(kù)則以文件的形式存放在硬盤里 , 需要時(shí)再通過 CPU進(jìn)行調(diào)用 。 而且音色庫(kù)越大 , 所需的存儲(chǔ)器就越多 , 相應(yīng)地成本也就越高 。 該卡采用了 EMU8000波表處理芯片 , 提供 16位 MIDI通道和 32位的復(fù)音效果 。 聲音樣本記錄了各種真實(shí)樂器的波形采樣 , 并保存在聲卡上的 ROM中 。樂音樣本的采集相對(duì)比較直觀,音樂家在真實(shí)樂器上演奏不同的音符,選擇 的采樣頻率、 16比特的量化位數(shù),這相當(dāng)于 CDDA的質(zhì)量,把不同音符的真實(shí)聲音記錄下來(lái),這就完成了樂音樣本的采集。為子能真實(shí)地再現(xiàn)樂音,目前的聲卡一般采用樂音樣本合成法,即波表合成法。 FM合成法生成樂音的基本原理是,用數(shù)字信號(hào)來(lái)表示不同樂音的波形,然后把它們組合起來(lái),再通過數(shù)模轉(zhuǎn)換器(DAC)生成樂音播放。利用合成器產(chǎn)生 MIDI樂音的主要方法是 FM合成法和波表合成法。信息的后一部分描述哪一個(gè)鍵被按下了。這個(gè)信息就包含了狀態(tài)信息及數(shù)據(jù)信息兩部分。狀態(tài)信息用于描述音符被演奏還是聲音被加強(qiáng)這樣的信息,而數(shù)據(jù)信息則重點(diǎn)描述哪個(gè)音符被演奏了,或被加強(qiáng)的聲音的強(qiáng)度如何等可以用量來(lái)表示的信息。它包括音符、節(jié)拍、樂器種類等。 MIDI的工作過程 理解 MIDI工作方式的最直接的方法就是看看 MIDI消息是什么。最后,將 MIDI消息送往音樂合成器,由合成器將 MIDI消息進(jìn)行解釋并產(chǎn)生波形,然后通過聲音發(fā)生器送往揚(yáng)聲器播放出來(lái)。這一系列消息可記錄以 .MID 為擴(kuò)展名的MIDI文件中。 ? MIDI的工作過程 MIDI電子樂器通過 MIDI接口與計(jì)算機(jī)相連, MIDI靠這個(gè)接口來(lái)傳遞消息而進(jìn)行彼此通信。到目前為止,使用采樣器仍然是滿足其對(duì)新增音色的最佳手段。而采樣器則是一種開放式的音源,它可以對(duì)任何聲音進(jìn)行取樣,并把它們編輯成音色來(lái)供電腦音樂系統(tǒng)使用。 YAMAHA QY700 音序器 硬件音源 ROLAND JV1080 ?采樣器 音樂的表現(xiàn)力是無(wú)限的,因此人們對(duì)于音色的要求也是無(wú)限的。軟件音序器因?yàn)槠滹@示界面擴(kuò)大 ( 使用電腦顯示器 ) ,功能增強(qiáng) , 特別是操作方便獲得了絕大多數(shù)音樂制作者的認(rèn)可 , 大有淘汰硬件音序器之勢(shì) 。 常見的型號(hào)有 Yamaha QY700等 。它可以是一個(gè)獨(dú)立的設(shè)備 , 也可以內(nèi)置于合成器里 。音序器分硬件和軟件的兩種。 軟音源的產(chǎn)生為 MIDI的大眾化作出了很大的貢獻(xiàn) , 它使人們不需購(gòu)買專門設(shè)備就可以進(jìn)行 MIDI的創(chuàng)作和演奏 。 軟件音源也是隨著電腦的高速發(fā)展而產(chǎn)生的 , 它們也必須安裝在電腦上才能使用 。 但有些聲卡 (如 Sound Blaster Live)的 音 源 質(zhì) 量 較 好 , 可 達(dá) 到 準(zhǔn) 專 業(yè) 級(jí) 。硬件音源是現(xiàn)在專業(yè)MIDI制作不可缺少的設(shè)備,因?yàn)樗鼈兛梢蕴峁┍热魏我粔K聲卡上的波表都要好很多的音色,這些獨(dú)立音源基本上是專業(yè)人士使用的,常見的型號(hào)有Roland JV1080和 Yamaha MU100R等。至于何時(shí)調(diào)用資源 (使用哪種音色 )不是音源的工作,這項(xiàng)任務(wù)是由音序器來(lái)完成的。音源內(nèi)部有很多不同音色的樣本波形,譬如鋼琴就有鋼琴的音色的真實(shí)樣本,吉它就有吉它的音色真實(shí)樣本 (即波表 )。又由于獨(dú)立的硬件音源和采樣技術(shù)的普及,人們覺得合成器的音色也是多余的,因?yàn)楠?dú)立音源可以提供更好的音色,于是不帶音序器和音色的 MIDI控制鍵盤也隨即產(chǎn)生,這類鍵盤有較強(qiáng)的控制功能,音色用音源的,音序器用軟件的,可謂是專物專用,而且只要添加音源或采樣器就可以得到更多的音色,更換音序軟件就可以使用更強(qiáng)的功能。 隨著軟件音序器的普及,合成器的硬件音序器由于它的繁瑣而魅力大減,音源,音序器,鍵盤三位一體的方式受到挑戰(zhàn)。它擁有大量真實(shí)的采樣音色可供演奏使用,它擁有自己的音序器可以錄制編輯音樂,它擁有 MIDI接口可以與其他設(shè)備交換信息。這些數(shù)字控制信號(hào)還可以同時(shí)被記錄在合成器內(nèi)部被稱作 “ 音序器 ” 的裝置中 。 合成器是通過控制面板上的按鈕產(chǎn)生數(shù)字信號(hào)來(lái)控制的 。 合成器自誕生以來(lái) , 其概念已發(fā)生了很多變化 。 利用 MIDI技術(shù)將電子合成器 、 電子音源與音序器連接在一起即可演奏模擬出音色變化萬(wàn)千的音響效果 , 又可將演奏中的多種按鍵數(shù)據(jù)存儲(chǔ)起來(lái) , 極大的改善了音樂演奏的能力和條件 。這些設(shè)備可以是獨(dú)立的,也可以是集成的。 ? MIDI系統(tǒng)的組成 MIDI系統(tǒng)實(shí)際就是一個(gè)作曲、配器、電子模擬的演奏系統(tǒng)。 從一個(gè) MIDI設(shè)備轉(zhuǎn)送到另一個(gè) MIDI設(shè)備上去的數(shù)據(jù)就是 MIDI信息 。 按照這種思路 ,MIDI使電腦能夠利用 “ 記譜 ” 的方法進(jìn)行音樂的數(shù)字化錄音及放音 。 打個(gè)比方 ,如果數(shù)字音響是一盤錄了某個(gè)人小提琴獨(dú)奏的磁帶 ,則 MIDI就是該獨(dú)奏的樂譜 ,盡管樂譜本身并不產(chǎn)生任何實(shí)際聲音 ,但它確實(shí)定義了演奏的速度 、 音符及演奏聲音的大小 。這樣,任何電子樂器,只要有處理 MIDI信息的處理器和適當(dāng)?shù)挠布涌诙寄茏兂?MIDI裝置。 MIDI是由軟件部分和硬件部分共同組成的系統(tǒng)規(guī)范 , 這個(gè)規(guī)范定義了 MIDI設(shè)備間數(shù)字傳送時(shí)電纜硬件接口和協(xié)議?;蛘哒f(shuō), MIDI是用來(lái)將電子樂器相互連接,或?qū)?MIDI設(shè)備與電腦連接成系統(tǒng)的一種通信協(xié)議。 ? 響度:對(duì)聲音強(qiáng)度的衡量 YM3812音樂系統(tǒng)框圖 微機(jī)或微處理器 地址數(shù)據(jù)總線 總線控制 YM3812 DAC 音頻放大 系統(tǒng)時(shí)鐘 MIDI規(guī)范(術(shù)語(yǔ)) 1. MIDI文件 2. 通道( channels) 3. 音序器( sequencer) 4. 合成器( synthesizer) 5. 樂器( instrument) 6. 復(fù)音( puyphone) 7. 音色( tmbre) 8. 音軌( tack) 9. 合成音色映射器( patch apper) ( channel mapping) ? 樂器數(shù)字接口 ——MIDI 在音樂創(chuàng)作領(lǐng)域,由于 MIDI、 電子樂器和多媒體計(jì)算機(jī)的結(jié)合,給人們提供了一種快捷、獨(dú)特的制作方式,它更加強(qiáng)調(diào)音色的非常規(guī)化、電子化、空間感和對(duì)比等,并且日益形成一種嶄新的音樂風(fēng)格。 ? 波形表合成( wavetable) 樂音必備的三要素: ? 音高:指聲波的基頻,基頻越低給人感覺越低沉。也被稱為 。 AC3 提供了 5個(gè)聲道從 20HZ 到 20KHZ的全通帶頻,即正前方的左( L)中( C)右( R),后邊兩個(gè)獨(dú)立的環(huán)繞立體聲通道左后( LS)和右后( RS)。(見結(jié)構(gòu)圖) ( 2)編碼層次 層 I包括將數(shù)字音頻變成 32個(gè)子帶的基本映射; 層 II 提供了位分配,縮放因子和抽樣的附加編碼; 層 III采用混合帶通濾波器來(lái)提高頻率分辨率。編碼器的輸入和解碼器的輸出與現(xiàn)存的 PCM 標(biāo)準(zhǔn)兼容。MPEG標(biāo)準(zhǔn)有 MPEGI , MPEGII, MPEGIV,MPEGVII等, MPEGI中一部分對(duì)應(yīng)于ISO/IEC111723及 MPE音頻。律PCM Sl(k) d(k) I(k) Se(k) dq(k) St(k) 32kb/s輸出 ADPCM解碼器結(jié)構(gòu)圖 轉(zhuǎn)化為PCM 同步編碼調(diào)節(jié) 逆自適應(yīng)預(yù)測(cè)器 32kb/s輸入 64kb/s輸出 A律或 181。(A) 181。 音頻編碼標(biāo)準(zhǔn) 國(guó)際電報(bào)電話咨詢委員會(huì)( CCITT)和國(guó)際標(biāo)準(zhǔn)化組織( ISO)先后提出了一系列有關(guān)音頻編碼的標(biāo)準(zhǔn)。 ( 2) DPCM:即只傳輸語(yǔ)音預(yù)測(cè)值和樣本值的差值,以此降低音頻數(shù)據(jù)的編碼率。 常用三種波形編碼的方法 : ( 1) PCM:直接對(duì)語(yǔ)音信號(hào)進(jìn)行模數(shù)轉(zhuǎn)換。 ( 3)基于人的聽覺特性進(jìn)行編碼,利用掩蔽效應(yīng),設(shè)計(jì)心理學(xué)模型,從而實(shí)現(xiàn)高效率的數(shù)字音頻的壓縮。如 PCM , DPCM, ADPCM。 第三、人而對(duì)語(yǔ)音信號(hào)的相位變化不敏感。 ?總線接口負(fù)責(zé)為總線和聲卡各部分提供握手信號(hào)和數(shù)據(jù)傳輸。 PC 總線 數(shù)據(jù)總線驅(qū)動(dòng)器 總線接口和控制器 游戲接口 MIDI 接口 混合信號(hào)處理器 數(shù)字聲音處理器 MIC放大器 功率放大器 音樂合成器 音樂合成器 地址總線 控制總線 MIC 揚(yáng)聲器 CD line 音頻卡的工作原理圖 音頻卡的工作原理 ?音頻卡簡(jiǎn)稱聲卡,它將模擬音頻進(jìn)行模數(shù)轉(zhuǎn)換送入計(jì)算機(jī),進(jìn)行處理后再經(jīng)過數(shù)模轉(zhuǎn)換,輸出加工后的合成音頻。普通的性能,過 大的體型,還有居高不下的價(jià)格, 但也有一些產(chǎn)品的價(jià)格較低。現(xiàn)在已經(jīng)出現(xiàn)了 6聲道的板載聲卡,板載 。目前市場(chǎng)上 90%以上的主板都集成 AC‘97聲卡。 計(jì)算聲音文件公式如下: S=D x R x( r/8) x聲道數(shù) D代表采樣頻率, R代表采樣時(shí)間以秒計(jì)算, r代表量化位 (二)、音頻卡的分類 (2) 一、獨(dú)立音頻卡,插在主板的 ISA或 PCI槽中。位數(shù)越高,量化精度越高,音質(zhì)越好。 波形表音樂合成 (詳見后續(xù)章節(jié)) 文語(yǔ)轉(zhuǎn)換和語(yǔ)音識(shí)別 文語(yǔ)轉(zhuǎn)換就是把計(jì)算機(jī)內(nèi)的文本轉(zhuǎn)換成聲音 語(yǔ)音識(shí)別將語(yǔ)音識(shí)別為計(jì)算機(jī)能理解的文字或命令 (二)音頻卡的分類 (1) 音頻卡的分類主要是根據(jù)采樣量化的位數(shù)來(lái)分類的。 它是對(duì)聲音文件進(jìn)行多種特殊效果處理,包括以下內(nèi)容: 倒播 增加回音 靜噪 淡入和淡出 往返放聲 交換聲道 聲音移位 MIDI和音樂合成 MIDI 是樂器數(shù)字接口的標(biāo)準(zhǔn),它規(guī)定了電子樂器與計(jì)算機(jī)之間相互數(shù)據(jù)通信的協(xié)議。高級(jí)的音色庫(kù)定制和編輯,使用戶可以在計(jì)算機(jī)上制作音樂,進(jìn)行作曲。它提供了高質(zhì)真實(shí)樂器感的 64復(fù)音的 MIDI合成器,使得游戲和多媒體應(yīng)用程序的音響效果比以前更為逼真。這里的 32和 64不再表示數(shù)字音頻的位數(shù),而是表示 32和 64種復(fù)音的波表合成技術(shù),它們?nèi)允?1
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1