正文內(nèi)容

音頻信息的獲取與處理-資料下載頁

2025-09-30 16:45本頁面

　　

【正文】軟件完成，合成器只提供鍵盤和音色，這就降低了合成器的成本。又由于獨立的硬件音源和采樣技術(shù)的普及，人們覺得合成器的音色也是多余的，因為獨立音源可以提供更好的音色，于是不帶音序器和音色的 MIDI控制鍵盤也隨即產(chǎn)生，這類鍵盤有較強的控制功能，音色用音源的，音序器用軟件的，可謂是專物專用，而且只要添加音源或采樣器就可以得到更多的音色，更換音序軟件就可以使用更強的功能。 ?音源由于音樂最終要以聲音的形式表現(xiàn)出來，所以做為電腦音樂系統(tǒng)中產(chǎn)生聲音的設(shè)備，音源音色的數(shù)量、品種和質(zhì)量都將對最終音樂作品的效果產(chǎn)生重要的影響。音源內(nèi)部有很多不同音色的樣本波形，譬如鋼琴就有鋼琴的音色的真實樣本，吉它就有吉它的音色真實樣本 (即波表 )。但是音源只是一個資源庫，因為它不知道在什么時候該用什么音色發(fā)怎樣的聲音。至于何時調(diào)用資源 (使用哪種音色 )不是音源的工作，這項任務(wù)是由音序器來完成的。音源也分硬件和軟件兩種。硬件音源是現(xiàn)在專業(yè)MIDI制作不可缺少的設(shè)備，因為它們可以提供比任何一塊聲卡上的波表都要好很多的音色，這些獨立音源基本上是專業(yè)人士使用的，常見的型號有Roland JV1080和 Yamaha MU100R等。作為一般用戶，可以不需要添置硬件音源設(shè)備，因為現(xiàn)在任何一塊多媒體聲卡上都有一個 128種音色的 GM音色庫，即 MIDI音源，只不過質(zhì)量比專用音源設(shè)備差一些。但有些聲卡 (如 Sound Blaster Live)的音源質(zhì) 量較好，可達到準專業(yè) 級。另外，還可以使用軟件音源來代替。軟件音源也是隨著電腦的高速發(fā)展而產(chǎn)生的，它們也必須安裝在電腦上才能使用。大家熟悉的軟音源有：Yamaha SYXG100, Roland VSC88等，大家平時俗稱它們?yōu)?MIDI播放器，其實它們就是音源，因為它們是提供音色的。軟音源的產(chǎn)生為 MIDI的大眾化作出了很大的貢獻，它使人們不需購買專門設(shè)備就可以進行 MIDI的創(chuàng)作和演奏。 ?音序器 (Sequencer) 音序器是用來記錄、編輯和播放 MIDI文件的設(shè)備。音序器分硬件和軟件的兩種。最早的是硬件音序器，我們也常稱它為 “ 編曲機 ” 。它可以是一個獨立的設(shè)備，也可以內(nèi)置于合成器里。這類音序器的編輯和修改必須在它的面板上進行，使用是很不方便的。常見的型號有 Yamaha QY700等。軟件音序器是安裝在計算機中的多功能音樂創(chuàng)作、編輯軟件，如我們常用的 Cakewalk就是一個軟件音序器。軟件音序器因為其顯示界面擴大（使用電腦顯示器），功能增強，特別是操作方便獲得了絕大多數(shù)音樂制作者的認可，大有淘汰硬件音序器之勢。其實正是由于軟件加入音樂制作的領(lǐng)域才使 MIDI音樂和電腦聯(lián)系起來，不然制作 MIDI音樂完全用不著電腦。 YAMAHA QY700 音序器硬件音源 ROLAND JV1080 ?采樣器音樂的表現(xiàn)力是無限的，因此人們對于音色的要求也是無限的。一般的音源均是一種封閉的結(jié)構(gòu)，它們的音色都是固定的，提供的數(shù)量和品種都有限，不能滿足制作者對新的音色的要求。而采樣器則是一種開放式的音源，它可以對任何聲音進行取樣，并把它們編輯成音色來供電腦音樂系統(tǒng)使用。使用采樣器可以對各種音樂、其他電子樂器和各種自然界聲響進行取樣，或是通過讀取現(xiàn)成磁盤來獲取各種音色。到目前為止，使用采樣器仍然是滿足其對新增音色的最佳手段。 ?其他設(shè)備如錄音設(shè)備、監(jiān)聽設(shè)備、音箱功放等，這里不加贅述。 ? MIDI的工作過程 MIDI電子樂器通過 MIDI接口與計算機相連， MIDI靠這個接口來傳遞消息而進行彼此通信。這樣，計算機可通過音序器軟件來采集 MIDI電子樂器發(fā)出的一系列消息或指令。這一系列消息可記錄以 .MID 為擴展名的MIDI文件中。在計算機上音序器可對 MIDI 文件進行編輯和修改。最后，將 MIDI消息送往音樂合成器，由合成器將 MIDI消息進行解釋并產(chǎn)生波形，然后通過聲音發(fā)生器送往揚聲器播放出來。其過程如圖 411所示。 MIDI的工作過程理解 MIDI工作方式的最直接的方法就是看看 MIDI消息是什么。 MIDI消息實際上是對一段音樂的描述，或理解成是樂譜的數(shù)字描述。它包括音符、節(jié)拍、樂器種類等。 MIDI消息包括兩個大的部分：狀態(tài)信息和數(shù)據(jù)信息。狀態(tài)信息用于描述音符被演奏還是聲音被加強這樣的信息，而數(shù)據(jù)信息則重點描述哪個音符被演奏了，或被加強的聲音的強度如何等可以用量來表示的信息。例如，你在一個具有 MIDI功能的電子琴上按下了一個鍵時，電子琴便產(chǎn)生了一個 MIDI信息，通過 MIDI接口傳送出去。這個信息就包含了狀態(tài)信息及數(shù)據(jù)信息兩部分。信息的前一部分用于描述你做了什么，這里你按了一個鍵，產(chǎn)生了一個音符。信息的后一部分描述哪一個鍵被按下了。 ? FM與波表合成方式合成器是利用數(shù)字信號處理器 DSP或其他芯片來產(chǎn)生音樂或聲音的電子裝置。利用合成器產(chǎn)生 MIDI樂音的主要方法是 FM合成法和波表合成法。 ?FM合成法 FM合成法是 80年代初由美國斯坦福大學(xué)的 John Chowning發(fā)明的，稱為 “ 數(shù)字式頻率調(diào)制合成法 ” ，簡稱 FM合成法。 FM合成法生成樂音的基本原理是，用數(shù)字信號來表示不同樂音的波形，然后把它們組合起來，再通過數(shù)模轉(zhuǎn)換器（ＤＡＣ）生成樂音播放。 ?波表合成法使用 FM合成法來產(chǎn)生各種逼真的樂音是相當困難的，有些樂音幾乎不能產(chǎn)生。為子能真實地再現(xiàn)樂音，目前的聲卡一般采用樂音樣本合成法，即波表合成法。這種方法就是把真實樂器發(fā)出的聲音以數(shù)字的形式記錄下來，播放時根據(jù)命令生成各種音階的音符，產(chǎn)生的聲音質(zhì)量比 FM合成方法產(chǎn)生的聲音質(zhì)量要高很多。樂音樣本的采集相對比較直觀，音樂家在真實樂器上演奏不同的音符，選擇的采樣頻率、 16比特的量化位數(shù)，這相當于 CDDA的質(zhì)量，把不同音符的真實聲音記錄下來，這就完成了樂音樣本的采集。與 FM合成不同，波表合成是采用真實的聲音樣本進行回放。聲音樣本記錄了各種真實樂器的波形采樣，并保存在聲卡上的 ROM中。例如創(chuàng)新的 Sound Blaster AWE32是第一塊廣為流行的波表聲卡。該卡采用了 EMU8000波表處理芯片，提供 16位 MIDI通道和 32位的復(fù)音效果。波表合成的聲音比 FM合成的聲音更為豐富和真實，但由于需要額外的存儲器貯存音色庫，因此成本也較高。而且音色庫越大，所需的存儲器就越多，相應(yīng)地成本也就越高。波表合成可以有軟硬之分，軟波表原理跟硬波表一樣，都是采用了真實的聲音樣本進行回放。只是硬波表的音色庫是存放在聲卡的 ROM或 RAM中，而軟波表的音色庫則以文件的形式存放在硬盤里，需要時再通過 CPU進行調(diào)用。由于軟波表是通過 CPU的實時運算來回放 MIDI音效，因此軟波表對系統(tǒng)要求較高。 ? 語音識別技術(shù)及應(yīng)用 ? 語音識別技術(shù)概述人的表達方式有多種，其中語音是最迅速、最常用和最自然的一種。讓人們與 “ 機器 ” 也通過語言進行信息交流，則是科學(xué)家們多年來探索的領(lǐng)域。早在 70年代，國外就開始致力于語音識別技術(shù)的研究。經(jīng)過近 30年的探索，語音識別技術(shù)經(jīng)歷了從最初的特定人、小詞匯量、非連續(xù)、非獨立揚聲器的語音識別到今天的非特定人、大詞匯量、連續(xù)、獨立揚聲器的語音識別的發(fā)展歷程，而且識別速度和準確率都有極大提高。隨著計算機科學(xué)和應(yīng)用的飛速發(fā)展，語音技術(shù)已日益廣泛地應(yīng)用于實際中。語音識別以語音為研究對象，它是語音信號處理的一個重要研究方向，是模式識別的一個分支，涉及到生理學(xué)、心理學(xué)、語言學(xué)、計算機科學(xué)以及信號處理等諸多領(lǐng)域，甚至還涉及到人的體態(tài)語言（如人在說話時的表情、手勢等行為動作可幫助對方理解），其最終目標是實現(xiàn)人與機器進行自然語言通信。目前語音識別的主要應(yīng)用是通過 TTS（ TexttoSpeech，文本 ——語音轉(zhuǎn)換器）和 SR（ Speech Recognition，語音識別器）實現(xiàn)的。 TTS和 SR是為應(yīng)用開發(fā)者增加的兩個用戶接口設(shè)備，開發(fā)者可將TTS和 SR加入到應(yīng)用程序中。語音識別系統(tǒng)的性能通常用單詞錯誤率 E來度量：其中， N是測試集的單詞總數(shù)， S， I 和 D分別是替代、插入和刪除的總數(shù)。 ? 文本語音轉(zhuǎn)換器 TTS ?TTS的基本概念文語轉(zhuǎn)換（ TexttoSpeech）是將文本形式的信息轉(zhuǎn)換成自然語音的一種技術(shù)，其最終目標是力圖使計算機能夠以清晰自然的聲音，以各種各樣的語言，甚至以各種各樣的情緒來朗讀任意的文本。也就是說，要使計算機具有象人一樣、甚至比人更強的說話能力。因而它是一個十分復(fù)雜的問題，涉及到語言學(xué)、韻律學(xué)、語音學(xué)、自然語言處理、信號處理、人工智能等諸多的學(xué)科。 %1 0 0???? N DISE TTS分為綜合的和連貫的兩種類型。綜合的語音就是通過分析單詞，由計算機確認單詞的發(fā)音，然后這些音素就被輸入到一個復(fù)雜的模仿人聲音并發(fā)聲的算法，這樣就可以讀文本了。通過這種方式， TTS就能讀出任何單詞，甚至自造的詞，但是它發(fā)出的聲音不帶任何感情，帶有明顯的機器語音味道。連貫語音系統(tǒng)分析文本并從預(yù)先錄好的文庫里抽出單詞和詞組的錄音。數(shù)字化錄音是連貫的，因為聲音是事先錄制的語音，聽起來很舒服。遺憾的是，如果文本包含沒有錄的詞和短語， TTS就讀不出來了。連貫 TTS可以被看成是一種聲音壓縮形式，因為單詞和常用的短語只能錄一次。連貫 TTS會節(jié)省開發(fā)時間并減少錯誤，使軟件增加相應(yīng)的功能。因為連貫 TTS只播放一個 WAV文件，所以它只用很少的處理能力。漢語文語轉(zhuǎn)換的研究始于 60年代，最初發(fā)展較為緩慢，到了 70年代后期，隨著計算機科學(xué)的發(fā)展，才有了較快的進步。總之， TTS系統(tǒng)最根本的問題便在于它的自然度，自然度是衡量一個 TTS系統(tǒng)好壞的最重要的指標。人們是無法忍受與自然語音相差甚遠的機器語音的，自然度問題已經(jīng)成為嚴重阻礙 TTS系統(tǒng)的推廣和應(yīng)用的桎梏。因此，研究更好的文語轉(zhuǎn)換方法，提高合成語音的自然度就成為當務(wù)之急。 ?TTS的應(yīng)用領(lǐng)域文語轉(zhuǎn)換在各種計算機相關(guān)領(lǐng)域中有著廣泛的應(yīng)用前景。當今，人與計算機之間進行交互的最常規(guī)手段是通過鍵盤輸入信息，通過屏幕或打印機以視覺形式輸出信息。這種方式不同于人與人之間通過語音來交流信息的自然的交往方式，因而不僅極大地限制了廣大普通用戶使用計算機，而且在某些特定場合使用起來也很不方便。因此，構(gòu)造一個以語音為媒介與計算機進行交互的系統(tǒng)，即智能計算機界面，是人們長久以來的夢想，也是科技人員孜孜以求的目標。顯然，智能計算機界面包括兩個相對獨立的部分： “ 傾聽 ” 部分，即語音識別； “ 訴說 ” 部分，即文語轉(zhuǎn)換。隨著這兩方面技術(shù)的不斷發(fā)展，將會從根本上改善人機接口，從而使計算機以嶄新的面貌進入人類生活，使計算機發(fā)揮出更大的作用。除了人機交互， TTS系統(tǒng)在醫(yī)療、教育、通信、信息、家電等領(lǐng)域也具有相當廣泛的用途。目前，已經(jīng)逐步實用化的有： ?殘障人士康復(fù) 發(fā)聲障礙者通過 TTS系統(tǒng)與其他人交談。盲人通過 TTS系統(tǒng)進行 “ 閱讀 ” 。 ?計算機訓(xùn)練利用 TTS系統(tǒng)對學(xué)生進行某些特殊的言語訓(xùn)練。利用 TTS系統(tǒng)進行教學(xué)。 ?信息服務(wù) 利用 TTS系統(tǒng)通過電話查詢信息。利用 TTS系統(tǒng)通過電話接聽 Email。隨著科學(xué)技術(shù)突飛猛進的發(fā)展，尤其是網(wǎng)絡(luò)技術(shù)的迅速崛起、飛速發(fā)展，文語轉(zhuǎn)換技術(shù)將在人類社會生活中有著越來越廣泛的應(yīng)用。 ? 語音識別器語音識別器比 TTS更復(fù)雜，也較難以劃分，但每個語音識別器都必須解決下列一些問題： ?連續(xù)性與不連續(xù)性如果語音識別系統(tǒng)是連續(xù)的，用戶就能正常地與系統(tǒng)對話；如果是不連續(xù)的，用戶就需要字字停頓。顯然，連續(xù)語音識別（ Continuous Speech Recognition）比不連續(xù)的識別更受歡迎，但它卻需要更多的處理能力。 ?單詞量語音識別系統(tǒng)可以有或大或小的詞匯量。詞匯量小的識別系統(tǒng)需要用戶發(fā)出簡單的命令，而朗讀文件時，這一系統(tǒng)就必需有大的詞匯量。大詞匯量識別系統(tǒng)比小詞匯量識別系統(tǒng)需要更多的處理能力和儲存空間。雖然日常生活中常用的詞匯最多不超過一兩萬個，但每個專業(yè)的術(shù)語不少于幾萬條。影響語音識別的因素： ?口音識別音素作為組成單詞的最小聲音單位，與它們所出現(xiàn)的上下文密切相關(guān)。例如在美國英語中，字母 t在 two, true, 和 butter中的

點擊復(fù)制文檔內(nèi)容

環(huán)評公示相關(guān)推薦

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

音頻信息的獲取與處理-資料下載頁

音頻信號傳輸技術(shù)實驗-資料下載頁

[精選]音響系統(tǒng)與調(diào)音-音頻信號處理設(shè)備-資料下載頁

視頻信息處理ppt課件-資料下載頁

[精選]第4章多媒體音頻信號處理-資料下載頁

音頻信號光纖傳輸技術(shù)實驗-資料下載頁

圖片的獲取與處理-資料下載頁

音頻信號分析儀ppt課件-資料下載頁

信息的來源與獲取-資料下載頁

基于matlab的音頻信號處理畢業(yè)設(shè)計(含源文件)-資料下載頁

多媒體視頻信息處理-資料下載頁

[精選]消費者信息的獲取與處理-資料下載頁

音頻信號及數(shù)字化ppt課件-資料下載頁

信息的獲取-資料下載頁

信息的獲取-資料下載頁

基于basys2的音頻信號采集與波形顯示器-資料下載頁

音頻信息的獲取與處理-閱讀頁

音頻信息的獲取與處理(文件)

音頻信息的獲取與處理-全文預(yù)覽

音頻信息的獲取與處理-預(yù)覽頁

音頻信息的獲取與處理-免費閱讀