freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

音頻信息的獲取與處理-資料下載頁

2025-05-12 22:33本頁面
  

【正文】 序任務(wù)由軟件完成,合成器只提供鍵盤和音色,這就降低了合成器的成本。又由于獨立的硬件音源和采樣技術(shù)的普及,人們覺得合成器的音色也是多余的,因為獨立音源可以提供更好的音色,于是不帶音序器和音色的 MIDI控制鍵盤也隨即產(chǎn)生,這類鍵盤有較強的控制功能,音色用音源的,音序器用軟件的,可謂是專物專用,而且只要添加音源或采樣器就可以得到更多的音色,更換音序軟件就可以使用更強的功能。 ?音源 由于音樂最終要以聲音的形式表現(xiàn)出來,所以做為電腦音樂系統(tǒng)中產(chǎn)生聲音的設(shè)備,音源音色的數(shù)量、品種和質(zhì)量都將對最終音樂作品的效果產(chǎn)生重要的影響。音源內(nèi)部有很多不同音色的樣本波形,譬如鋼琴就有鋼琴的音色的真實樣本,吉它就有吉它的音色真實樣本 (即波表 )。但是音源只是一個資源庫,因為它不知道在什么時候該用什么音色發(fā)怎樣的聲音。至于何時調(diào)用資源 (使用哪種音色 )不是音源的工作,這項任務(wù)是由音序器來完成的。 音源也分硬件和軟件兩種。硬件音源是現(xiàn)在專業(yè)MIDI制作不可缺少的設(shè)備,因為它們可以提供比任何一塊聲卡上的波表都要好很多的音色,這些獨立音源基本上是專業(yè)人士使用的,常見的型號有Roland JV1080和 Yamaha MU100R等。 作為一般用戶 , 可以不需要添置硬件音源設(shè)備 ,因為現(xiàn)在任何一塊多媒體聲卡上都有一個 128種音色的 GM音色庫 , 即 MIDI音源 , 只不過質(zhì)量比專用音源設(shè)備差一些 。 但有些聲卡 (如 Sound Blaster Live)的 音 源 質(zhì) 量 較 好 , 可 達(dá) 到 準(zhǔn) 專 業(yè) 級 。 另外 , 還可以使用軟件音源來代替 。 軟件音源也是隨著電腦的高速發(fā)展而產(chǎn)生的 , 它們也必須安裝在電腦上才能使用 。 大家熟悉的軟音源有:Yamaha SYXG100, Roland VSC88等 , 大家平時俗稱它們?yōu)?MIDI播放器 , 其實它們就是音源 , 因為它們是提供音色的 。 軟音源的產(chǎn)生為 MIDI的大眾化作出了很大的貢獻(xiàn) , 它使人們不需購買專門設(shè)備就可以進(jìn)行 MIDI的創(chuàng)作和演奏 。 ?音序器 (Sequencer) 音序器是用來記錄、編輯和播放 MIDI文件的設(shè)備。音序器分硬件和軟件的兩種。 最早的是硬件音序器 , 我們也常稱它為 “ 編曲機 ” 。它可以是一個獨立的設(shè)備 , 也可以內(nèi)置于合成器里 。 這類音序器的編輯和修改必須在它的面板上進(jìn)行 , 使用是很不方便的 。 常見的型號有 Yamaha QY700等 。 軟件音序器是安裝在計算機中的多功能音樂創(chuàng)作 、編輯軟件 , 如我們常用的 Cakewalk就是一個軟件音序器 。軟件音序器因為其顯示界面擴大 ( 使用電腦顯示器 ) ,功能增強 , 特別是操作方便獲得了絕大多數(shù)音樂制作者的認(rèn)可 , 大有淘汰硬件音序器之勢 。 其實正是由于軟件加入音樂制作的領(lǐng)域才使 MIDI音樂和電腦聯(lián)系起來 , 不然制作 MIDI音樂完全用不著電腦 。 YAMAHA QY700 音序器 硬件音源 ROLAND JV1080 ?采樣器 音樂的表現(xiàn)力是無限的,因此人們對于音色的要求也是無限的。一般的音源均是一種封閉的結(jié)構(gòu),它們的音色都是固定的,提供的數(shù)量和品種都有限,不能滿足制作者對新的音色的要求。而采樣器則是一種開放式的音源,它可以對任何聲音進(jìn)行取樣,并把它們編輯成音色來供電腦音樂系統(tǒng)使用。 使用采樣器可以對各種音樂、其他電子樂器和各種自然界聲響進(jìn)行取樣,或是通過讀取現(xiàn)成磁盤來獲取各種音色。到目前為止,使用采樣器仍然是滿足其對新增音色的最佳手段。 ?其他設(shè)備 如錄音設(shè)備、監(jiān)聽設(shè)備、音箱功放等,這里不加贅述。 ? MIDI的工作過程 MIDI電子樂器通過 MIDI接口與計算機相連, MIDI靠這個接口來傳遞消息而進(jìn)行彼此通信。這樣,計算機可通過音序器軟件來采集 MIDI電子樂器發(fā)出的一系列消息或指令。這一系列消息可記錄以 .MID 為擴展名的MIDI文件中。在計算機上音序器可對 MIDI 文件進(jìn)行編輯和修改。最后,將 MIDI消息送往音樂合成器,由合成器將 MIDI消息進(jìn)行解釋并產(chǎn)生波形,然后通過聲音發(fā)生器送往揚聲器播放出來。其過程如圖 411所示。 MIDI的工作過程 理解 MIDI工作方式的最直接的方法就是看看 MIDI消息是什么。 MIDI消息實際上是對一段音樂的描述,或理解成是樂譜的數(shù)字描述。它包括音符、節(jié)拍、樂器種類等。 MIDI消息包括兩個大的部分:狀態(tài)信息和數(shù)據(jù)信息。狀態(tài)信息用于描述音符被演奏還是聲音被加強這樣的信息,而數(shù)據(jù)信息則重點描述哪個音符被演奏了,或被加強的聲音的強度如何等可以用量來表示的信息。例如,你在一個具有 MIDI功能的電子琴上按下了一個鍵時,電子琴便產(chǎn)生了一個 MIDI信息,通過 MIDI接口傳送出去。這個信息就包含了狀態(tài)信息及數(shù)據(jù)信息兩部分。信息的前一部分用于描述你做了什么,這里你按了一個鍵,產(chǎn)生了一個音符。信息的后一部分描述哪一個鍵被按下了。 ? FM與波表合成方式 合成器是利用數(shù)字信號處理器 DSP或其他芯片來產(chǎn)生音樂或聲音的電子裝置。利用合成器產(chǎn)生 MIDI樂音的主要方法是 FM合成法和波表合成法。 ?FM合成法 FM合成法是 80年代初由美國斯坦福大學(xué)的 John Chowning發(fā)明的,稱為 “ 數(shù)字式頻率調(diào)制合成法 ” ,簡稱 FM合成法。 FM合成法生成樂音的基本原理是,用數(shù)字信號來表示不同樂音的波形,然后把它們組合起來,再通過數(shù)模轉(zhuǎn)換器(DAC)生成樂音播放。 ?波表合成法 使用 FM合成法來產(chǎn)生各種逼真的樂音是相當(dāng)困難的,有些樂音幾乎不能產(chǎn)生。為子能真實地再現(xiàn)樂音,目前的聲卡一般采用樂音樣本合成法,即波表合成法。這種方法就是把真實樂器發(fā)出的聲音以數(shù)字的形式記錄下來,播放時根據(jù)命令生成各種音階的音符,產(chǎn)生的聲音質(zhì)量比 FM合成方法產(chǎn)生的聲音質(zhì)量要高很多。樂音樣本的采集相對比較直觀,音樂家在真實樂器上演奏不同的音符,選擇 的采樣頻率、 16比特的量化位數(shù),這相當(dāng)于 CDDA的質(zhì)量,把不同音符的真實聲音記錄下來,這就完成了樂音樣本的采集。 與 FM合成不同 , 波表合成是采用真實的聲音樣本進(jìn)行回放 。 聲音樣本記錄了各種真實樂器的波形采樣 , 并保存在聲卡上的 ROM中 。 例如創(chuàng)新的 Sound Blaster AWE32是第一塊廣為流行的波表聲卡 。 該卡采用了 EMU8000波表處理芯片 , 提供 16位 MIDI通道和 32位的復(fù)音效果 。 波表合成的聲音比 FM合成的聲音更為豐富和真實 , 但由于需要額外的存儲器貯存音色庫 , 因此成本也較高 。 而且音色庫越大 , 所需的存儲器就越多 , 相應(yīng)地成本也就越高 。 波表合成可以有軟硬之分 , 軟波表原理跟硬波表一樣 ,都是采用了真實的聲音樣本進(jìn)行回放 。 只是硬波表的音色庫是存放在聲卡的 ROM或 RAM中 , 而軟波表的音色庫則以文件的形式存放在硬盤里 , 需要時再通過 CPU進(jìn)行調(diào)用 。 由于軟波表是通過 CPU的實時運算來回放 MIDI音效 , 因此軟波表對系統(tǒng)要求較高 。 ? 語音識別技術(shù)及應(yīng)用 ? 語音識別技術(shù)概述 人的表達(dá)方式有多種,其中語音是最迅速、最常用和最自然的一種。讓人們與 “ 機器 ” 也通過語言進(jìn)行信息交流,則是科學(xué)家們多年來探索的領(lǐng)域。早在 70年代,國外就開始致力于語音識別技術(shù)的研究。經(jīng)過近 30年的探索,語音識別技術(shù)經(jīng)歷了從最初的特定人、小詞匯量、非連續(xù)、非獨立揚聲器的語音識別到今天的非特定人、大詞匯量、連續(xù)、獨立揚聲器的語音識別的發(fā)展歷程,而且識別速度和準(zhǔn)確率都有極大提高。隨著計算機科學(xué)和應(yīng)用的飛速發(fā)展,語音技術(shù)已日益廣泛地應(yīng)用于實際中。 語音識別以語音為研究對象,它是語音信號處理的一個重要研究方向,是模式識別的一個分支,涉及到生理學(xué)、心理學(xué)、語言學(xué)、計算機科學(xué)以及信號處理等諸多領(lǐng)域,甚至還涉及到人的體態(tài)語言(如人在說話時的表情、手勢等行為動作可幫助對方理解),其最終目標(biāo)是實現(xiàn)人與機器進(jìn)行自然語言通信。 目前語音識別的主要應(yīng)用是通過 TTS( TexttoSpeech, 文本 ——語音轉(zhuǎn)換器)和 SR( Speech Recognition, 語音識別器)實現(xiàn)的。 TTS和 SR是為應(yīng)用開發(fā)者增加的兩個用戶接口設(shè)備,開發(fā)者可將TTS和 SR加入到應(yīng)用程序中。 語音識別系統(tǒng)的性能通常用單詞錯誤率 E來度量: 其中, N是測試集的單詞總數(shù), S, I 和 D分別是替代、插入和刪除的總數(shù)。 ? 文本 語音轉(zhuǎn)換器 TTS ?TTS的基本概念 文語轉(zhuǎn)換( TexttoSpeech) 是將文本形式的信息轉(zhuǎn)換成自然語音的一種技術(shù),其最終目標(biāo)是力圖使計算機能夠以清晰自然的聲音,以各種各樣的語言,甚至以各種各樣的情緒來朗讀任意的文本。也就是說,要使計算機具有象人一樣、甚至比人更強的說話能力。因而它是一個十分復(fù)雜的問題,涉及到語言學(xué)、韻律學(xué)、語音學(xué)、自然語言處理、信號處理、人工智能等諸多的學(xué)科。 %100???? N DISE TTS分為綜合的和連貫的兩種類型 。 綜合的語音就是通過分析單詞 , 由計算機確認(rèn)單詞的發(fā)音 , 然后這些音素就被輸入到一個復(fù)雜的模仿人聲音并發(fā)聲的算法 ,這樣就可以讀文本了 。 通過這種方式 , TTS就能讀出任何單詞 , 甚至自造的詞 , 但是它發(fā)出的聲音不帶任何感情 , 帶有明顯的機器語音味道 。 連貫語音系統(tǒng)分析文本并從預(yù)先錄好的文庫里抽出單詞和詞組的錄音 。 數(shù)字化錄音是連貫的 , 因為聲音是事先錄制的語音 , 聽起來很舒服 。 遺憾的是 , 如果文本包含沒有錄的詞和短語 , TTS就讀不出來了 。 連貫 TTS可以被看成是一種聲音壓縮形式 , 因為單詞和常用的短語只能錄一次 。 連貫 TTS會節(jié)省開發(fā)時間并減少錯誤 , 使軟件增加相應(yīng)的功能 。 因為連貫 TTS只播放一個 WAV文件 ,所以它只用很少的處理能力 。 漢語文語轉(zhuǎn)換的研究始于 60年代 , 最初發(fā)展較為緩慢 , 到了 70年代后期 , 隨著計算機科學(xué)的發(fā)展 , 才有了較快的進(jìn)步 。 總之 , TTS系統(tǒng)最根本的問題便在于它的自然度 , 自然度是衡量一個 TTS系統(tǒng)好壞的最重要的指標(biāo) 。 人們是無法忍受與自然語音相差甚遠(yuǎn)的機器語音的 , 自然度問題已經(jīng)成為嚴(yán)重阻礙 TTS系統(tǒng)的推廣和應(yīng)用的桎梏 。 因此 , 研究更好的文語轉(zhuǎn)換方法 , 提高合成語音的自然度就成為當(dāng)務(wù)之急 。 ?TTS的應(yīng)用領(lǐng)域 文語轉(zhuǎn)換在各種計算機相關(guān)領(lǐng)域中有著廣泛的應(yīng)用前景。當(dāng)今,人與計算機之間進(jìn)行交互的最常規(guī)手段是通過鍵盤輸入信息,通過屏幕或打印機以視覺形式輸出信息。這種方式不同于人與人之間通過語音來交流信息的自然的交往方式,因而不僅極大地限制了廣大普通用戶使用計算機,而且在某些特定場合使用起來也很不方便。因此,構(gòu)造一個以語音為媒介與計算機進(jìn)行交互的系統(tǒng),即智能計算機界面,是人們長久以來的夢想,也是科技人員孜孜以求的目標(biāo)。顯然,智能計算機界面包括兩個相對獨立的部分: “ 傾聽 ” 部分,即語音識別; “ 訴說 ” 部分,即文語轉(zhuǎn)換。隨著這兩方面技術(shù)的不斷發(fā)展,將會從根本上改善人機接口,從而使計算機以嶄新的面貌進(jìn)入人類生活,使計算機發(fā)揮出更大的作用。 除了人機交互, TTS系統(tǒng)在醫(yī)療、教育、通信、信息、家電等領(lǐng)域也具有相當(dāng)廣泛的用途。目前,已經(jīng)逐步實用化的有: ?殘障人士康復(fù) 發(fā)聲障礙者通過 TTS系統(tǒng)與其他人交談。盲人通過 TTS系統(tǒng)進(jìn)行 “ 閱讀 ” 。 ?計算機訓(xùn)練 利用 TTS系統(tǒng)對學(xué)生進(jìn)行某些特殊的言語訓(xùn)練。利用 TTS系統(tǒng)進(jìn)行教學(xué)。 ?信息服務(wù) 利用 TTS系統(tǒng)通過電話查詢信息。利用 TTS系統(tǒng)通過電話接聽 Email。 隨著科學(xué)技術(shù)突飛猛進(jìn)的發(fā)展,尤其是網(wǎng)絡(luò)技術(shù)的迅速崛起、飛速發(fā)展,文語轉(zhuǎn)換技術(shù)將在人類社會生活中有著越來越廣泛的應(yīng)用。 ? 語音識別器 語音識別器比 TTS更復(fù)雜,也較難以劃分,但每個語音識別器都必須解決下列一些問題: ?連續(xù)性與不連續(xù)性 如果語音識別系統(tǒng)是連續(xù)的,用戶就能正常地與系統(tǒng)對話;如果是不連續(xù)的,用戶就需要字字停頓。顯然,連續(xù)語音識別( Continuous Speech Recognition) 比不連續(xù)的識別更受歡迎,但它卻需要更多的處理能力。 ?單詞量 語音識別系統(tǒng)可以有或大或小的詞匯量。詞匯量小的識別系統(tǒng)需要用戶發(fā)出簡單的命令,而朗讀文件時,這一系統(tǒng)就必需有大的詞匯量。大詞匯量識別系統(tǒng)比小詞匯量識別系統(tǒng)需要更多的處理能力和儲存空間。雖然日常生活中常用的詞匯最多不超過一兩萬個,但每個專業(yè)的術(shù)語不少于幾萬條。 影響語音識別的因素: ?口音識別 音素作為組成單詞的最小聲音單位,與它們所出現(xiàn)的上下文密切相關(guān)。例如在美國英語中,字母 t在 two, true, 和 butte
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1