freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)字語音信號處理實驗指導(dǎo)書(學(xué)生用)-資料下載頁

2025-08-03 23:50本頁面
  

【正文】 (根據(jù)定義編寫,去除高頻分量)39。)。實驗四 基于VQ的特定人孤立詞語音識別研究一、實驗?zāi)康氖噶苛炕╒ector Quantization)是一種極其重要的信號壓縮方法,是自70年代末才發(fā)展起來的。它廣泛應(yīng)用于語音編碼、語音識別與合成、圖象壓縮等領(lǐng)域。VQ在語音信號處理中占有十分重要的地位。許多重要的研究課題中,特別是低速語音編碼和語音識別的研究中,VQ都起著非常重要的作用。量化可以分為兩大類:一類是標量量化,另一類是矢量量化。標量量化是將取樣后的信號值逐個地進行量化,而矢量量化是將若干個取樣信號分成一組,即構(gòu)成一個矢量,然后對此矢量一次進行量化。當然,矢量量化壓縮數(shù)據(jù)的同時也有信息的損失,但這僅取決于量化的精度。矢量量化是標量量化的發(fā)展,可以說,凡是要用量化的地方都可以應(yīng)用矢量量化。 本實驗要求掌握矢量量化的原理,會利用已學(xué)的相關(guān)語音特征,構(gòu)建語音特征矢量,然后利用VQ技術(shù),編寫訓(xùn)練VQ碼表的程序,并在此基礎(chǔ)上利用所學(xué)的語音識別技術(shù),編程實現(xiàn)基于矢量量化的特定人孤立詞語音識別,要注意的是識別過程中語音端點如何檢測,從識別的實時性角度出發(fā),建議能利用VC技術(shù)實現(xiàn)。二、實驗原理1 矢量量化1)基本原理矢量量化的過程是:將語音信號波形的K個樣點的每一幀,或者有K個參數(shù)的每一參數(shù)幀,構(gòu)成K維空間中的一個矢量,然后對這個矢量進行量化。通常所說的標量量化,也可以說是K=1的一維矢量量化。矢量量化的過程與標量量化相似。在標量量化時,在一維的零至無大值之間設(shè)置若干個量化階梯,當某輸入信號的幅度值落在某相鄰的兩個量化階梯之間時,就被量化為兩階梯的中心值。而在矢量量化時,將K維無限空間劃為M個區(qū)域邊界,然后將輸入矢量與這些邊界進行比較,并被量化為“距離”最小的區(qū)域邊界的中心矢量值。2)、失真測度設(shè)計矢量量化器的關(guān)鍵是編碼器的設(shè)計,而譯碼器的工作僅是一個簡單的查表過程。在編碼的過程中,需要引入失真測度的概念。失真是將輸入信號矢量用碼書的重構(gòu)矢量來表征時的誤差或所付出的代價。而這種代價的統(tǒng)計平均值(平均失真)描述了矢量量化器的工作特性。在矢量量化器的設(shè)計中,失真測度的選擇是很重要的。失真測度選用的合適與否,直接影響系統(tǒng)的性能。要使所選擇的失真測度有實際意義,必須具備以下幾個條件:在主觀評價上有意義,即最小的失真應(yīng)該對應(yīng)與好的主觀語言質(zhì)量;易于處理,即在數(shù)學(xué)上易于實現(xiàn),這樣可以用于實際的矢量量化器的設(shè)計;平均失真存在并且可以計算。2 LBG算法算法是由Linde,Buzo和Gray在1980年首次提出的,常稱為LBG算法。它是標量量化器中Lioyd算法的多維推廣。整個算法實際上就是反復(fù)迭代的過程,既用初始碼書尋找最佳碼書的迭代過程。它由對初始碼書進行迭代優(yōu)化開始,一直到系統(tǒng)性能滿足要求或者不再有明顯的改進為止。這種算法既可以用于已知信號源概率分布的場合,也可以用于未知信號源概率分布的場合,但此時要知道它的一系列輸出值(稱為訓(xùn)練序列)。由于通常語音信號的概率分布隨著各種應(yīng)用場合的不同,不可能事先統(tǒng)計過,因而無法知道它的概率分布。所以目前多用訓(xùn)練序列來設(shè)計碼書和矢量量化器。3 語音識別語音識別是研究使機器能夠準確地聽出人的語音內(nèi)容的問題,即準確的識別所說的語音。語音識別是近二三十幾年發(fā)展起來的新興學(xué)科,在計算機、信息處理、通信與電子系統(tǒng)、自動控制等領(lǐng)域中有著廣泛的應(yīng)用。運用語音識別技術(shù),人們設(shè)計了各種語音識別系統(tǒng)。有的已經(jīng)應(yīng)用于實際,有的還處在研究階段。其中對孤立詞的識別,研究的最早也最成熟,目前,對孤立詞的識別無論是小詞匯量還是大詞匯量,無論是與講話者有關(guān)還是與講話者無關(guān),在實驗室中的正識率已經(jīng)達到95%以上。這種系統(tǒng)存在的問題最少,因為單詞之間有停頓,可以使識別問題簡單化;且單詞之間的端點檢測比較容易;單詞之間的協(xié)同發(fā)音影響也可以減至最低;對孤立詞的發(fā)音都比較認真。由于此系統(tǒng)本身用途廣泛,且其許多技術(shù)對其他類型系統(tǒng)有通用性并易于推廣,所以稍加補充一些知識就可用于其他類型系統(tǒng)(如在識別部分加用適當語義信息等,則可用于連續(xù)語音識別中)。采用矢量量化技術(shù)主要用于減少計算量,應(yīng)用于特征處理可減少特征的類型從而減少計算量,也可以推廣應(yīng)用到摸板的歸并壓縮。其主要工作就是聚類,即在特征空間中合理的擬定一組點(稱為一組聚類中心或碼本),每個中心稱為碼字。于是特征空間中任一點均可按最小距離準則用碼本之一來代表。不管用何種語音識別方法,主要過程由兩部分組成,一是訓(xùn)練,一是識別。在進行訓(xùn)練時,用觀察的序列訓(xùn)練得到參考模型集,每一個模型對應(yīng)于摸板中的一個單詞。在進行識別時,為每一個參考模型計算出產(chǎn)生測試觀察的概率,且測試信號(即輸入信號)按最大概率被識別為某個單詞。要實現(xiàn)上面的隱馬爾可夫模型,模型的輸入信號必須取自有限字母集中的離散序列,也就是說,必須將連續(xù)的語音信號變?yōu)橛邢揠x散的序列。例如若模型的輸入信號為LPC參數(shù)這樣的矢量信號,那么用矢量量化完成上述的識別過程是非常合適的。下面是VQ/HMM孤立單詞識別的方框圖。圖中矢量量化器作為整個識別系統(tǒng)的一個前處理器。三、實驗結(jié)果就算法模型方面而言,需要有進一步的突破。目前能看出它的一些明顯不足,尤其在中文語音識別方面,語言模型還有待完善,因為語言模型和聲學(xué)模型正是聽寫識別的基礎(chǔ),這方面沒有突破,語音識別的進展就只能是一句空話。目前使用的語言模型只是一種概率模型,還沒有用到以語言學(xué)為基礎(chǔ)的文法模型,而要使計算機確實理解人類的語言,就必須在這一點上取得進展,這是一個相當艱苦的工作。此外,隨著硬件資源的不斷發(fā)展,一些核心算法如特征提取、搜索算法或者自適應(yīng)算法將有可能進一步改進??梢韵嘈?半導(dǎo)體和軟件技術(shù)的共同進步將為語音識別技術(shù)的基礎(chǔ)性工作帶來福音。 就強健性方面而言,語音識別技術(shù)需要能排除各種環(huán)境因素的影響。目前,對語音識別效果影響最大的就是環(huán)境雜音或嗓音,在公共場合,你幾乎不可能指望計算機能聽懂你的話,來自四面八方的聲音讓它茫然而不知所措。很顯然這極大地限制了語音技術(shù)的應(yīng)用范圍,目前,要在嘈雜環(huán)境中使用語音識別技術(shù)必須有特殊的抗嗓(NoiseCancellation)麥克風(fēng)才能進行,這對多數(shù)用戶來說是不現(xiàn)實的。在公共場合中,個人能有意識地摒棄環(huán)境嗓音并從中獲取自己所需要的特定聲音,如何讓語音識別技術(shù)也能達成這一點呢?這的確是一個艱巨的任務(wù)。以下是實驗部分的截圖:程序附錄using System。using 。using 。using 。using 。using 。using 。using SpeechLib。namespace WindowsApplication1{public partial class Form1 : Form {private SpVoice voice。 //語音合成對象 private SpSharedRecoContext objRecoContext?!?/共享型上下文對象 private ISpeechRecoGrammar grammar?! ?/上下文語法對象添加成員函數(shù) public void RecoContext_Recongnition(int StreamNumber, object StreamPosition, SpeechRecognitionType RecongitionType, ISpeechRecoResult Result) { += (0, 1, true) + 。 //輸出語音識別結(jié)果 } private void InitializeSpeech() {//語音識別初始化 objRecoContext = newSpSharedRecoContext()。//初始化共享型上下文對象 += new _ISpeechRecoContextEvents_RecognitionEventHandler(RecoContext_Recongnition)。//為上下文添加事件處理函數(shù) grammar = (0)。//創(chuàng)建語法器 (, )。//裝載語法規(guī)則 ()。//激活語法器 = 。 }  public Form1() { InitializeComponent()。 } private void button1_Click(object sender, EventArgs e) { = 。 (, )。 } private void Form1_Load(object sender, EventArgs e) { voice = new SpVoiceClass()。 ()。 } private void button2_Click(object sender, EventArgs e) { = 。 } private void button3_Click(object sender, EventArgs e) { = 。 } }}
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1