freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音信號基音周期檢測的軟件設(shè)計畢業(yè)論文-在線瀏覽

2025-08-06 13:41本頁面
  

【正文】 性能比自相關(guān)函數(shù)法和倒譜法有著明顯的改善[17]?!  】梢暬╒isual)程序界面設(shè)計是一種全新的程序設(shè)計方法,它主要是讓程序設(shè)計人員利用軟件本身所提供的各種控件,像搭積木式地構(gòu)造應(yīng)用程序的各種界面。目前能進行可視化程序設(shè)計的語言很多,比較常用的有微軟的Visual Basic、Visual C++、Borland公司的Delphi等。C++及Windows可視化程序設(shè)計計算機科學發(fā)展的每一步幾乎都在軟件設(shè)計和程序設(shè)計語言中得到充分體現(xiàn)?;糁芷跈z測的最終目的是得到與聲音振動頻率吻合較好的基音周期變化的軌跡曲線[21]。自相關(guān)基音檢測算法是一種時域算法,它能直接對時域信號采樣值進行分幀、求短時自相關(guān)函數(shù),并根據(jù)一定的判決準則進行清濁音判斷[22]。隨著信息處理技術(shù)日新月異地發(fā)展,各種先進的基音周期檢測方法將不斷涌現(xiàn),基音周期檢測的準確性和健壯性將逐漸得到改善[24]。 而算法部分的設(shè)計,自相關(guān)算法流程,自相關(guān)算法數(shù)據(jù)分析,自相關(guān)算法的實現(xiàn)及結(jié)果分析,最后分析算法的改進及存在問題。在第3章中,算法實現(xiàn)部分闡述主要內(nèi)容是各主流算法的實現(xiàn)原理,算法流程以及算法的數(shù)據(jù)分析,實現(xiàn)及改進方法。 預(yù)期達到目標是在Visual C++語言環(huán)境下編寫可視化界面,操作可視化界面能夠?qū)崿F(xiàn)語音信號的提取,語音信號的播放,自相關(guān)算法的選擇,及各算法比較,從而能較準確檢測輸入的自相關(guān)語音信號的基音周期。最后進行算法實現(xiàn),當前有幾種經(jīng)典基音檢測算法,從非基于事件的基音周期檢測方法和基于事件的基音周期檢測方法來看,非基于事件的方法一般都先將語音信號分為長度一定的語音幀,然后對每一幀語音求平均基音周期,相比基于事件的基音周期檢測方法來說,它的優(yōu)點是比較簡單,但在語音環(huán)境較惡劣 、信噪比較低時,檢測的結(jié)果下降較快,難以讓人滿意。相比非基于事件的基音周期檢測方法而言,基于事件的基音周期檢測方法并不多,主要方法有小波變換方法和Hilbert Huang變換方法,但實現(xiàn)卻較為困難。 語音信號基音周期檢測軟件設(shè)計的功能分析 通過操作在Visual C++環(huán)境下編寫的可視化界面,能夠?qū)崿F(xiàn)的功能有語音信號的提取,語音信號的播放,基音周期檢測算法的選擇,及最終的基音周期的檢測 。也可在界面上選擇其他算法對基音周期進行檢測并比較其檢測結(jié)果??梢暬缑嬷饕膸讉€基本概念有表單、組件、屬性、事件、方法等。MFC提供了面向?qū)ο蟮目蚣?,程序開發(fā)員可以基于這一框架來開發(fā)Windows應(yīng)用程序。 基因周期檢測算法基音檢測方法大致上可以分為三類:(1)時域估計法,直接由波形來估計基音周期,常見的有自相關(guān)(ACF)法、平均幅度差法(AMDF)等;(2)頻域估計法,利用同態(tài)分析方法將聲道的影響消除,得到屬于激勵部分的信息,然后求取基音周期,常見的有簡化逆濾波(SIFT)法,倒譜法;(3)混合法,基于以上方法的衍生組合算法,如:自相關(guān)法和平均幅度差法相結(jié)合,這些方法在實驗室特定條件下都取得了非常不錯的效果,本課題使用自相關(guān)算法進行基因檢測。濁音有基音周期,而清音的基音周期為零,因而清濁音判斷是基音周期檢測的第一步。通過比較原始信號和它移位后的信號之間的類似性來確定基音周期,如果移位距離等于基音周期,那么,兩個信號具有最大類似性。 本章小結(jié)本章給出了設(shè)計的的總體方案,首先選擇VC++編程語言來對設(shè)計進行實現(xiàn)。56黑龍江工程學院本科生畢業(yè)設(shè)計第3章 算法實現(xiàn) 常用算法介紹常用的基音周期檢測方法如自相關(guān)函數(shù)法、倒譜法、平均幅度差函數(shù)法都屬于非基于事件基音檢測方法,先將語音信號分為長度一定的語音幀,然后對每一幀語音求平均基音周期,它們的優(yōu)點是比較簡單,主要應(yīng)用于只需要平均基音周期作為參數(shù)的語音編解碼,語音識別等。平均幅度差函數(shù)只需加法、減法和取絕對值等計算,算法簡單;倒譜雖然算法復(fù)雜,但基音估計效果較好。 語音信號的短時平均幅度差函數(shù)定義為: ?。ǎ┢渲校谴昂瘮?shù),N是一幀語音信號的長度,因為語音信號的濁音段具有周期性,我們假設(shè)基音周期為,則在濁音段,在處將出現(xiàn)谷點,谷點間的距離即為基音周期。短時平均幅度差函數(shù)可以寫成: ()由于只需加法、減法和取絕對值等計算,故算法簡單,很易于硬件實現(xiàn),從而使得短時平均幅度差函數(shù)法在基音檢測中使用得相當普遍研究表明:當在靜音環(huán)境下或當噪聲較小時,AMDF法可以取的較好的檢測結(jié)果,但在語音環(huán)境較惡劣、信噪比較低時,檢測的效果很差,難以讓人滿意。當采用無噪語音時,用倒譜進行基音提取的效果是很理想的,然而當存在加性噪聲時,其性能將惡化。語音信號不是加性信號,而是卷積信號。經(jīng)過卷積同態(tài)系統(tǒng)后輸出的偽時域序列稱為原序列的“復(fù)倒頻譜”。倒譜是復(fù)倒譜中的偶對稱分量,它們都將卷積運算變?yōu)閭螘r域中的加法運算,使得信號可以運用滿足疊加性的線性系統(tǒng)進行處理。在發(fā)濁音時,聲門激勵是以,為周期的沖激序列 ()式中,是正整數(shù);是正整數(shù),且;是幅度因子;是基音周期(用樣點數(shù)表示的)。 由上式可知,一個周期沖激的有限長度序列,其復(fù)倒譜也是一個周期沖激序列,而且長度不變,只是序列變?yōu)闊o限長度序列。倒譜是復(fù)倒譜的偶對稱分量,它同樣具有與基音周期相同的周期,因而能容易且精確地求出基音周期,但算法實現(xiàn)較為困難。 自相關(guān)算法原理對于離散語音信號,它的短時自相關(guān)函數(shù)定義為: () 如果信號是隨機的或周期的,則這時的定義為: () 上述公式表示,一個信號和延遲k點后的該信號本身的相似性,在任何一種情況下,信號的自相關(guān)函數(shù)都是描述信號特性的一種便利方法。2.當時,自相關(guān)函數(shù)具有最大值;當,處周期信號的自相關(guān)函數(shù)達到極大值。短時自相關(guān)函數(shù)法基音檢測的主要原理是利用短時自相關(guān)函數(shù)的第二條性質(zhì),通過比較原始信號和它移位后的信號之間的類似性來確定基音周期,如果移位距離等于基音周期,那么,兩個信號具有最大類似性。所以首先要進行清濁音分析,只要檢測到峰值的位置,就可以估計語音信號的基音周期值。隨著信息處理技術(shù)日新月異地發(fā)展,各種先進的基音周期檢測方法將不斷涌現(xiàn),基音周期檢測的準確性和健壯性將逐漸得到改善?;谧韵嚓P(guān)函數(shù)的算法是基音周期估計的常用方法,特別適用于噪聲環(huán)境下的基音提取。但通常情況下,基波分量往往不是最強的分量,豐富的諧波成分使語音信號的波形變得非常復(fù)雜,給基音檢測帶來了困難,經(jīng)常發(fā)生基頻的估計結(jié)果為實際基音頻率的二次倍頻或二次分頻的情況。 自相關(guān)算法流程通過對自相關(guān)基音檢測原理的分析后,考慮到檢測準確度和檢測速率兩方面的因素,這里提出了算法實現(xiàn)方案。 自相關(guān)基音檢測算法流程圖在對語音信號進行分析和處理之前,為了提高檢測的準確度,必須對其進行預(yù)處理。如果幀長選得比基音周期短,或共振峰頻率快速改變,會使得自相關(guān)函數(shù)不在基音周期附近取得最大值,從而導(dǎo)致簡單地選取自相關(guān)函數(shù)中最大峰的方法失敗,因此,選擇合適的幀長是重要的,幀長(窗寬)至少要覆蓋兩個基音周期,在目前普遍使用的系統(tǒng)中,一般選擇幀長為30ms;為提高基音檢測的可靠性,減少錯判、倍頻或分頻,無論采用哪一種基音檢測算法都可能產(chǎn)生基音檢測錯誤,使求得的基音周期軌跡中有一個或幾個基音周期估值偏離了正常軌跡(通常是偏離到正常值的2倍或1/2),稱這種偏離點為基音軌跡的“野點” 。采用九階濾波器來進行均值濾波。用短時平均能量進行清/濁音的判斷,語音信號的某幀信號的短時平均能量定義為: () 式中為窗函數(shù),為窗長。故清濁音判斷是基音檢測的第一步。語音信號的采樣率為。預(yù)處理除了數(shù)字化、放大和增益控制外,還包括反混疊濾波和預(yù)加重等。為了解決聲道響應(yīng)的諧波影響,我們只需在計算自相關(guān)函數(shù)之前對語音信號進行預(yù)處理。通常將語音用話筒轉(zhuǎn)化為電信號,再用轉(zhuǎn)換器將其轉(zhuǎn)化成離散的數(shù)字采樣信號后,最后,存入計算機內(nèi)存中。但在較短時間之內(nèi),可以認為其特征基本保持不變,即具有“短時平穩(wěn)性”?!癿_5”的時域波形圖,證明VC++所編寫的界面運行狀況良好,能夠比較準確的顯示出語音信號的波形圖?!癿_5”九階濾波后的時域波形圖。去掉高頻成分,防止共振峰的影響以及高次諧波的影響,使波形變的平滑。所以所取幀長只要大于兩倍基音周期就可以了。根據(jù)自相關(guān)函數(shù)的對稱性性質(zhì),有公式: ()當時,互不相關(guān),則,則可以表示為: ()由以上推導(dǎo)可以看出,當時,語音信號的自相關(guān)函數(shù)不受噪聲的影響,所以自相關(guān)函數(shù)的抗噪性能強,特別適合噪聲環(huán)境下的基音提取,這也是選擇自相關(guān)算法的原因。算法即是對數(shù)據(jù)的操作,而自相關(guān)的實質(zhì)即是自己對自己卷積的過程,數(shù)據(jù)變成原來的兩倍減一,本課題所用的樣本是用Cooldit在普通室內(nèi)環(huán)境下錄制的語音樣本為“m_5” ,采樣頻率為22050hz,通道數(shù)位1,文件長度為374934字節(jié),傳輸速率44100hz,調(diào)整數(shù)為2,每個樣本的數(shù)據(jù)位數(shù)為16位,操作可視化界面,首先點擊打開文件按鈕,從而運行提取語音信號的子程序,并且創(chuàng)建打開文件對話框,選擇“m_5”語音文件打開,即在界面上顯示“m_5”文件的時域波形圖;點擊播放按鈕,可視化界面從而播放打開的“m_5”語音文件,在算法選擇按鈕上選擇自相關(guān)算法,從而關(guān)聯(lián)自相關(guān)子程序,對“m_5”語音文件進行自相關(guān)處理:分幀濾波處理后,去噪并截取有聲段,在進行相關(guān)計算,檢測峰峰間距,最后點擊基因檢測按鍵,計算出基音周期并將結(jié)果顯示在界面,并在界面上顯示卷積之后的基音周期圖。定義字符串“該語音的基音周期為:”,就用對話框函數(shù)將數(shù)值顯示出來。有的對選定的人群有效,對任意的個體性能陡降,有的在說話者情緒平靜時有效,但一遇情緒激動,則大打折扣。 各種基音檢測算法中,最復(fù)雜的是倒譜法,它要做傅立葉變換、計算功率譜、再做傅立葉逆變換,因此運算量很大。 在此次所做的程序設(shè)計中,還有許多的不足之處與需要改進的地方,在處理語音信號時,只是對其中的一幀進行了處理,沒有對所有的幀進行統(tǒng)計,這樣就不具有代表性,不能代表整個語音信號的特性。我們可以在以下方面作一些改進和突破: 1.在預(yù)處理上下功夫由于實際的語音信號常?;旌椭鴱娏业谋尘霸肼暭肮舱穹孱l率,從而使語音信號的波形變得非常復(fù)雜,這常常引起基音檢測的錯判和誤判。 2.在語音信號的產(chǎn)生模型上尋找突破口傳統(tǒng)的語音產(chǎn)生模型起源于1930年Duddley發(fā)明的聲碼器,其基本思想是將激勵和系統(tǒng)相分離,使語音信號解體來分別進行描述而不是直接研究信號波形的本身。 3.適當考慮個性特征及情感、發(fā)音力度的影響近年來國內(nèi)外的研究表明,基音周期的大小與個人的發(fā)音習慣及性別、年齡、發(fā)音時的力度及情感有很大的關(guān)系,傳統(tǒng)的基音檢測都是以“冷漠的”語音為研究對象的,而在實際中,人在發(fā)音時,常常帶著驚訝、喜悅、緊張、憤怒、悲傷等復(fù)雜的感情有時,環(huán)境噪聲引起Lombard效應(yīng)(說話人在高噪聲環(huán)境中為了使自己的聲音能被聽到,有意或無意地提高嗓音,致使其發(fā)音速度及質(zhì)量發(fā)生變化),在這些感情和力度的驅(qū)使下,人的聲帶開啟到最大面積的時間及關(guān)閉的速度與平靜時相比,都要發(fā)生變化,同時共振峰的帶寬和位置都要發(fā)生畸變,這些變化不可避免地影響到基音周期。傳統(tǒng)的語音基音檢測算法中,只對輸出的信號進行處理。本課題在采用傳統(tǒng)自相關(guān)法進行基因檢測的同時,對語音信號進行帶通濾波及分幀等各項處理,減少誤差,使檢測結(jié)果得到改善。通過對語音信號的一系列處理,可得出基音周期曲線。 第4章 系統(tǒng)軟件設(shè)計 軟件的介紹可視化(Visual)程序界面設(shè)計是一種全新的程序設(shè)計方法,它主要是讓程序設(shè)計人員利用軟件本身所提供的各種控件,像搭積木式地構(gòu)造應(yīng)用程序的各種界面。目前能進行可視化程序設(shè)計的語言常用的有Visual Basic、Visual C++、Delphi等。Delphi是一門真正的面向?qū)ο蟮拈_發(fā)工具,并且是完全的可視化,它使用了真編譯,可以讓你的代碼編譯成為可執(zhí)行的文件,而且編譯速度非???。C++及Windows可視化程序設(shè)計計算機科學發(fā)展的每一步幾乎都在軟件設(shè)計和程序設(shè)計語言中得到充分體現(xiàn)。MFC是建立在C++的基礎(chǔ)上,所以強調(diào)C/C++語言基礎(chǔ)對開發(fā)的重要性,本課題使用VC++作為編程語言。 利用Pc機上的聲卡和window操作系統(tǒng)可以進行數(shù)字信號的采集。首先讀取音頻文件,得到音頻數(shù)據(jù)和那些相應(yīng)的編碼信息,之后對數(shù)據(jù)進行處理,最后在可視化界面上顯示基音周期數(shù)值,靜態(tài)波形圖及卷積之后的基音周期圖。 子程序設(shè)計基音周期檢測的軟件設(shè)計主要包括幾部分:1.基因主測試子程序?qū)τ诨魴z測的軟件設(shè)計部分,自相關(guān)法進行基音檢測子程序,定義輸入語音樣點及最大樣點數(shù),定義輸出語音信號的基音周期,采樣頻率為22050hz。 圖4. 2 基音檢測主測試流程圖  2.濾波器設(shè)計濾波器(filter),是一種用來消除干擾雜訊的器件,對特定頻率的頻點或該頻點以外的頻率進行有效濾除的電路,就是濾波器,其功能就是得到一個特定頻率或消除一個特定頻率。為了選取語音頻率段,濾掉所需語音頻率段以外的,并消除語音幀的高次諧波分量, 本課題選擇帶通濾波器對語音信號進行濾波,帶通濾波器能允許一定頻段的信號通過,抑制低于或高于該頻段的信號干擾和噪聲。濾波器并不能夠?qū)⑵谕l率范圍外的所有頻率完全衰減掉,尤其是在所要的通帶外還有一個被衰減但是沒有被隔離的范圍。通常下情況下,
點擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1