freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

音頻信息的獲取與處理-資料下載頁(yè)

2024-10-09 16:45本頁(yè)面
  

【正文】 軟件完成,合成器只提供鍵盤(pán)和音色,這就降低了合成器的成本。又由于獨(dú)立的硬件音源和采樣技術(shù)的普及,人們覺(jué)得合成器的音色也是多余的,因?yàn)楠?dú)立音源可以提供更好的音色,于是不帶音序器和音色的 MIDI控制鍵盤(pán)也隨即產(chǎn)生,這類鍵盤(pán)有較強(qiáng)的控制功能,音色用音源的,音序器用軟件的,可謂是專物專用,而且只要添加音源或采樣器就可以得到更多的音色,更換音序軟件就可以使用更強(qiáng)的功能。 ?音源 由于音樂(lè)最終要以聲音的形式表現(xiàn)出來(lái),所以做為電腦音樂(lè)系統(tǒng)中產(chǎn)生聲音的設(shè)備,音源音色的數(shù)量、品種和質(zhì)量都將對(duì)最終音樂(lè)作品的效果產(chǎn)生重要的影響。音源內(nèi)部有很多不同音色的樣本波形,譬如鋼琴就有鋼琴的音色的真實(shí)樣本,吉它就有吉它的音色真實(shí)樣本 (即波表 )。但是音源只是一個(gè)資源庫(kù),因?yàn)樗恢涝谑裁磿r(shí)候該用什么音色發(fā)怎樣的聲音。至于何時(shí)調(diào)用資源 (使用哪種音色 )不是音源的工作,這項(xiàng)任務(wù)是由音序器來(lái)完成的。 音源也分硬件和軟件兩種。硬件音源是現(xiàn)在專業(yè)MIDI制作不可缺少的設(shè)備,因?yàn)樗鼈兛梢蕴峁┍热魏我粔K聲卡上的波表都要好很多的音色,這些獨(dú)立音源基本上是專業(yè)人士使用的,常見(jiàn)的型號(hào)有Roland JV1080和 Yamaha MU100R等。 作為一般用戶 , 可以不需要添置硬件音源設(shè)備 ,因?yàn)楝F(xiàn)在任何一塊多媒體聲卡上都有一個(gè) 128種音色的 GM音色庫(kù) , 即 MIDI音源 , 只不過(guò)質(zhì)量比專用音源設(shè)備差一些 。 但有些聲卡 (如 Sound Blaster Live)的 音 源 質(zhì) 量 較 好 , 可 達(dá) 到 準(zhǔn) 專 業(yè) 級(jí) 。 另外 , 還可以使用軟件音源來(lái)代替 。 軟件音源也是隨著電腦的高速發(fā)展而產(chǎn)生的 , 它們也必須安裝在電腦上才能使用 。 大家熟悉的軟音源有:Yamaha SYXG100, Roland VSC88等 , 大家平時(shí)俗稱它們?yōu)?MIDI播放器 , 其實(shí)它們就是音源 , 因?yàn)樗鼈兪翘峁┮羯?。 軟音源的產(chǎn)生為 MIDI的大眾化作出了很大的貢獻(xiàn) , 它使人們不需購(gòu)買(mǎi)專門(mén)設(shè)備就可以進(jìn)行 MIDI的創(chuàng)作和演奏 。 ?音序器 (Sequencer) 音序器是用來(lái)記錄、編輯和播放 MIDI文件的設(shè)備。音序器分硬件和軟件的兩種。 最早的是硬件音序器 , 我們也常稱它為 “ 編曲機(jī) ” 。它可以是一個(gè)獨(dú)立的設(shè)備 , 也可以內(nèi)置于合成器里 。 這類音序器的編輯和修改必須在它的面板上進(jìn)行 , 使用是很不方便的 。 常見(jiàn)的型號(hào)有 Yamaha QY700等 。 軟件音序器是安裝在計(jì)算機(jī)中的多功能音樂(lè)創(chuàng)作 、編輯軟件 , 如我們常用的 Cakewalk就是一個(gè)軟件音序器 。軟件音序器因?yàn)槠滹@示界面擴(kuò)大 ( 使用電腦顯示器 ) ,功能增強(qiáng) , 特別是操作方便獲得了絕大多數(shù)音樂(lè)制作者的認(rèn)可 , 大有淘汰硬件音序器之勢(shì) 。 其實(shí)正是由于軟件加入音樂(lè)制作的領(lǐng)域才使 MIDI音樂(lè)和電腦聯(lián)系起來(lái) , 不然制作 MIDI音樂(lè)完全用不著電腦 。 YAMAHA QY700 音序器 硬件音源 ROLAND JV1080 ?采樣器 音樂(lè)的表現(xiàn)力是無(wú)限的,因此人們對(duì)于音色的要求也是無(wú)限的。一般的音源均是一種封閉的結(jié)構(gòu),它們的音色都是固定的,提供的數(shù)量和品種都有限,不能滿足制作者對(duì)新的音色的要求。而采樣器則是一種開(kāi)放式的音源,它可以對(duì)任何聲音進(jìn)行取樣,并把它們編輯成音色來(lái)供電腦音樂(lè)系統(tǒng)使用。 使用采樣器可以對(duì)各種音樂(lè)、其他電子樂(lè)器和各種自然界聲響進(jìn)行取樣,或是通過(guò)讀取現(xiàn)成磁盤(pán)來(lái)獲取各種音色。到目前為止,使用采樣器仍然是滿足其對(duì)新增音色的最佳手段。 ?其他設(shè)備 如錄音設(shè)備、監(jiān)聽(tīng)設(shè)備、音箱功放等,這里不加贅述。 ? MIDI的工作過(guò)程 MIDI電子樂(lè)器通過(guò) MIDI接口與計(jì)算機(jī)相連, MIDI靠這個(gè)接口來(lái)傳遞消息而進(jìn)行彼此通信。這樣,計(jì)算機(jī)可通過(guò)音序器軟件來(lái)采集 MIDI電子樂(lè)器發(fā)出的一系列消息或指令。這一系列消息可記錄以 .MID 為擴(kuò)展名的MIDI文件中。在計(jì)算機(jī)上音序器可對(duì) MIDI 文件進(jìn)行編輯和修改。最后,將 MIDI消息送往音樂(lè)合成器,由合成器將 MIDI消息進(jìn)行解釋并產(chǎn)生波形,然后通過(guò)聲音發(fā)生器送往揚(yáng)聲器播放出來(lái)。其過(guò)程如圖 411所示。 MIDI的工作過(guò)程 理解 MIDI工作方式的最直接的方法就是看看 MIDI消息是什么。 MIDI消息實(shí)際上是對(duì)一段音樂(lè)的描述,或理解成是樂(lè)譜的數(shù)字描述。它包括音符、節(jié)拍、樂(lè)器種類等。 MIDI消息包括兩個(gè)大的部分:狀態(tài)信息和數(shù)據(jù)信息。狀態(tài)信息用于描述音符被演奏還是聲音被加強(qiáng)這樣的信息,而數(shù)據(jù)信息則重點(diǎn)描述哪個(gè)音符被演奏了,或被加強(qiáng)的聲音的強(qiáng)度如何等可以用量來(lái)表示的信息。例如,你在一個(gè)具有 MIDI功能的電子琴上按下了一個(gè)鍵時(shí),電子琴便產(chǎn)生了一個(gè) MIDI信息,通過(guò) MIDI接口傳送出去。這個(gè)信息就包含了狀態(tài)信息及數(shù)據(jù)信息兩部分。信息的前一部分用于描述你做了什么,這里你按了一個(gè)鍵,產(chǎn)生了一個(gè)音符。信息的后一部分描述哪一個(gè)鍵被按下了。 ? FM與波表合成方式 合成器是利用數(shù)字信號(hào)處理器 DSP或其他芯片來(lái)產(chǎn)生音樂(lè)或聲音的電子裝置。利用合成器產(chǎn)生 MIDI樂(lè)音的主要方法是 FM合成法和波表合成法。 ?FM合成法 FM合成法是 80年代初由美國(guó)斯坦福大學(xué)的 John Chowning發(fā)明的,稱為 “ 數(shù)字式頻率調(diào)制合成法 ” ,簡(jiǎn)稱 FM合成法。 FM合成法生成樂(lè)音的基本原理是,用數(shù)字信號(hào)來(lái)表示不同樂(lè)音的波形,然后把它們組合起來(lái),再通過(guò)數(shù)模轉(zhuǎn)換器(DAC)生成樂(lè)音播放。 ?波表合成法 使用 FM合成法來(lái)產(chǎn)生各種逼真的樂(lè)音是相當(dāng)困難的,有些樂(lè)音幾乎不能產(chǎn)生。為子能真實(shí)地再現(xiàn)樂(lè)音,目前的聲卡一般采用樂(lè)音樣本合成法,即波表合成法。這種方法就是把真實(shí)樂(lè)器發(fā)出的聲音以數(shù)字的形式記錄下來(lái),播放時(shí)根據(jù)命令生成各種音階的音符,產(chǎn)生的聲音質(zhì)量比 FM合成方法產(chǎn)生的聲音質(zhì)量要高很多。樂(lè)音樣本的采集相對(duì)比較直觀,音樂(lè)家在真實(shí)樂(lè)器上演奏不同的音符,選擇 的采樣頻率、 16比特的量化位數(shù),這相當(dāng)于 CDDA的質(zhì)量,把不同音符的真實(shí)聲音記錄下來(lái),這就完成了樂(lè)音樣本的采集。 與 FM合成不同 , 波表合成是采用真實(shí)的聲音樣本進(jìn)行回放 。 聲音樣本記錄了各種真實(shí)樂(lè)器的波形采樣 , 并保存在聲卡上的 ROM中 。 例如創(chuàng)新的 Sound Blaster AWE32是第一塊廣為流行的波表聲卡 。 該卡采用了 EMU8000波表處理芯片 , 提供 16位 MIDI通道和 32位的復(fù)音效果 。 波表合成的聲音比 FM合成的聲音更為豐富和真實(shí) , 但由于需要額外的存儲(chǔ)器貯存音色庫(kù) , 因此成本也較高 。 而且音色庫(kù)越大 , 所需的存儲(chǔ)器就越多 , 相應(yīng)地成本也就越高 。 波表合成可以有軟硬之分 , 軟波表原理跟硬波表一樣 ,都是采用了真實(shí)的聲音樣本進(jìn)行回放 。 只是硬波表的音色庫(kù)是存放在聲卡的 ROM或 RAM中 , 而軟波表的音色庫(kù)則以文件的形式存放在硬盤(pán)里 , 需要時(shí)再通過(guò) CPU進(jìn)行調(diào)用 。 由于軟波表是通過(guò) CPU的實(shí)時(shí)運(yùn)算來(lái)回放 MIDI音效 , 因此軟波表對(duì)系統(tǒng)要求較高 。 ? 語(yǔ)音識(shí)別技術(shù)及應(yīng)用 ? 語(yǔ)音識(shí)別技術(shù)概述 人的表達(dá)方式有多種,其中語(yǔ)音是最迅速、最常用和最自然的一種。讓人們與 “ 機(jī)器 ” 也通過(guò)語(yǔ)言進(jìn)行信息交流,則是科學(xué)家們多年來(lái)探索的領(lǐng)域。早在 70年代,國(guó)外就開(kāi)始致力于語(yǔ)音識(shí)別技術(shù)的研究。經(jīng)過(guò)近 30年的探索,語(yǔ)音識(shí)別技術(shù)經(jīng)歷了從最初的特定人、小詞匯量、非連續(xù)、非獨(dú)立揚(yáng)聲器的語(yǔ)音識(shí)別到今天的非特定人、大詞匯量、連續(xù)、獨(dú)立揚(yáng)聲器的語(yǔ)音識(shí)別的發(fā)展歷程,而且識(shí)別速度和準(zhǔn)確率都有極大提高。隨著計(jì)算機(jī)科學(xué)和應(yīng)用的飛速發(fā)展,語(yǔ)音技術(shù)已日益廣泛地應(yīng)用于實(shí)際中。 語(yǔ)音識(shí)別以語(yǔ)音為研究對(duì)象,它是語(yǔ)音信號(hào)處理的一個(gè)重要研究方向,是模式識(shí)別的一個(gè)分支,涉及到生理學(xué)、心理學(xué)、語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)以及信號(hào)處理等諸多領(lǐng)域,甚至還涉及到人的體態(tài)語(yǔ)言(如人在說(shuō)話時(shí)的表情、手勢(shì)等行為動(dòng)作可幫助對(duì)方理解),其最終目標(biāo)是實(shí)現(xiàn)人與機(jī)器進(jìn)行自然語(yǔ)言通信。 目前語(yǔ)音識(shí)別的主要應(yīng)用是通過(guò) TTS( TexttoSpeech, 文本 ——語(yǔ)音轉(zhuǎn)換器)和 SR( Speech Recognition, 語(yǔ)音識(shí)別器)實(shí)現(xiàn)的。 TTS和 SR是為應(yīng)用開(kāi)發(fā)者增加的兩個(gè)用戶接口設(shè)備,開(kāi)發(fā)者可將TTS和 SR加入到應(yīng)用程序中。 語(yǔ)音識(shí)別系統(tǒng)的性能通常用單詞錯(cuò)誤率 E來(lái)度量: 其中, N是測(cè)試集的單詞總數(shù), S, I 和 D分別是替代、插入和刪除的總數(shù)。 ? 文本 語(yǔ)音轉(zhuǎn)換器 TTS ?TTS的基本概念 文語(yǔ)轉(zhuǎn)換( TexttoSpeech) 是將文本形式的信息轉(zhuǎn)換成自然語(yǔ)音的一種技術(shù),其最終目標(biāo)是力圖使計(jì)算機(jī)能夠以清晰自然的聲音,以各種各樣的語(yǔ)言,甚至以各種各樣的情緒來(lái)朗讀任意的文本。也就是說(shuō),要使計(jì)算機(jī)具有象人一樣、甚至比人更強(qiáng)的說(shuō)話能力。因而它是一個(gè)十分復(fù)雜的問(wèn)題,涉及到語(yǔ)言學(xué)、韻律學(xué)、語(yǔ)音學(xué)、自然語(yǔ)言處理、信號(hào)處理、人工智能等諸多的學(xué)科。 %1 0 0???? N DISE TTS分為綜合的和連貫的兩種類型 。 綜合的語(yǔ)音就是通過(guò)分析單詞 , 由計(jì)算機(jī)確認(rèn)單詞的發(fā)音 , 然后這些音素就被輸入到一個(gè)復(fù)雜的模仿人聲音并發(fā)聲的算法 ,這樣就可以讀文本了 。 通過(guò)這種方式 , TTS就能讀出任何單詞 , 甚至自造的詞 , 但是它發(fā)出的聲音不帶任何感情 , 帶有明顯的機(jī)器語(yǔ)音味道 。 連貫語(yǔ)音系統(tǒng)分析文本并從預(yù)先錄好的文庫(kù)里抽出單詞和詞組的錄音 。 數(shù)字化錄音是連貫的 , 因?yàn)槁曇羰鞘孪蠕浿频恼Z(yǔ)音 , 聽(tīng)起來(lái)很舒服 。 遺憾的是 , 如果文本包含沒(méi)有錄的詞和短語(yǔ) , TTS就讀不出來(lái)了 。 連貫 TTS可以被看成是一種聲音壓縮形式 , 因?yàn)閱卧~和常用的短語(yǔ)只能錄一次 。 連貫 TTS會(huì)節(jié)省開(kāi)發(fā)時(shí)間并減少錯(cuò)誤 , 使軟件增加相應(yīng)的功能 。 因?yàn)檫B貫 TTS只播放一個(gè) WAV文件 ,所以它只用很少的處理能力 。 漢語(yǔ)文語(yǔ)轉(zhuǎn)換的研究始于 60年代 , 最初發(fā)展較為緩慢 , 到了 70年代后期 , 隨著計(jì)算機(jī)科學(xué)的發(fā)展 , 才有了較快的進(jìn)步 。 總之 , TTS系統(tǒng)最根本的問(wèn)題便在于它的自然度 , 自然度是衡量一個(gè) TTS系統(tǒng)好壞的最重要的指標(biāo) 。 人們是無(wú)法忍受與自然語(yǔ)音相差甚遠(yuǎn)的機(jī)器語(yǔ)音的 , 自然度問(wèn)題已經(jīng)成為嚴(yán)重阻礙 TTS系統(tǒng)的推廣和應(yīng)用的桎梏 。 因此 , 研究更好的文語(yǔ)轉(zhuǎn)換方法 , 提高合成語(yǔ)音的自然度就成為當(dāng)務(wù)之急 。 ?TTS的應(yīng)用領(lǐng)域 文語(yǔ)轉(zhuǎn)換在各種計(jì)算機(jī)相關(guān)領(lǐng)域中有著廣泛的應(yīng)用前景。當(dāng)今,人與計(jì)算機(jī)之間進(jìn)行交互的最常規(guī)手段是通過(guò)鍵盤(pán)輸入信息,通過(guò)屏幕或打印機(jī)以視覺(jué)形式輸出信息。這種方式不同于人與人之間通過(guò)語(yǔ)音來(lái)交流信息的自然的交往方式,因而不僅極大地限制了廣大普通用戶使用計(jì)算機(jī),而且在某些特定場(chǎng)合使用起來(lái)也很不方便。因此,構(gòu)造一個(gè)以語(yǔ)音為媒介與計(jì)算機(jī)進(jìn)行交互的系統(tǒng),即智能計(jì)算機(jī)界面,是人們長(zhǎng)久以來(lái)的夢(mèng)想,也是科技人員孜孜以求的目標(biāo)。顯然,智能計(jì)算機(jī)界面包括兩個(gè)相對(duì)獨(dú)立的部分: “ 傾聽(tīng) ” 部分,即語(yǔ)音識(shí)別; “ 訴說(shuō) ” 部分,即文語(yǔ)轉(zhuǎn)換。隨著這兩方面技術(shù)的不斷發(fā)展,將會(huì)從根本上改善人機(jī)接口,從而使計(jì)算機(jī)以嶄新的面貌進(jìn)入人類生活,使計(jì)算機(jī)發(fā)揮出更大的作用。 除了人機(jī)交互, TTS系統(tǒng)在醫(yī)療、教育、通信、信息、家電等領(lǐng)域也具有相當(dāng)廣泛的用途。目前,已經(jīng)逐步實(shí)用化的有: ?殘障人士康復(fù) 發(fā)聲障礙者通過(guò) TTS系統(tǒng)與其他人交談。盲人通過(guò) TTS系統(tǒng)進(jìn)行 “ 閱讀 ” 。 ?計(jì)算機(jī)訓(xùn)練 利用 TTS系統(tǒng)對(duì)學(xué)生進(jìn)行某些特殊的言語(yǔ)訓(xùn)練。利用 TTS系統(tǒng)進(jìn)行教學(xué)。 ?信息服務(wù) 利用 TTS系統(tǒng)通過(guò)電話查詢信息。利用 TTS系統(tǒng)通過(guò)電話接聽(tīng) Email。 隨著科學(xué)技術(shù)突飛猛進(jìn)的發(fā)展,尤其是網(wǎng)絡(luò)技術(shù)的迅速崛起、飛速發(fā)展,文語(yǔ)轉(zhuǎn)換技術(shù)將在人類社會(huì)生活中有著越來(lái)越廣泛的應(yīng)用。 ? 語(yǔ)音識(shí)別器 語(yǔ)音識(shí)別器比 TTS更復(fù)雜,也較難以劃分,但每個(gè)語(yǔ)音識(shí)別器都必須解決下列一些問(wèn)題: ?連續(xù)性與不連續(xù)性 如果語(yǔ)音識(shí)別系統(tǒng)是連續(xù)的,用戶就能正常地與系統(tǒng)對(duì)話;如果是不連續(xù)的,用戶就需要字字停頓。顯然,連續(xù)語(yǔ)音識(shí)別( Continuous Speech Recognition) 比不連續(xù)的識(shí)別更受歡迎,但它卻需要更多的處理能力。 ?單詞量 語(yǔ)音識(shí)別系統(tǒng)可以有或大或小的詞匯量。詞匯量小的識(shí)別系統(tǒng)需要用戶發(fā)出簡(jiǎn)單的命令,而朗讀文件時(shí),這一系統(tǒng)就必需有大的詞匯量。大詞匯量識(shí)別系統(tǒng)比小詞匯量識(shí)別系統(tǒng)需要更多的處理能力和儲(chǔ)存空間。雖然日常生活中常用的詞匯最多不超過(guò)一兩萬(wàn)個(gè),但每個(gè)專業(yè)的術(shù)語(yǔ)不少于幾萬(wàn)條。 影響語(yǔ)音識(shí)別的因素: ?口音識(shí)別 音素作為組成單詞的最小聲音單位,與它們所出現(xiàn)的上下文密切相關(guān)。例如在美國(guó)英語(yǔ)中,字母 t在 two, true, 和 butter中的
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1