【正文】
25 圖 a1經(jīng)過低通濾波器的波形 再對(duì)濾波后的的語音信號(hào) x_low檢測(cè)基音周期,用上面講述的自相關(guān)函數(shù)法和平均幅度差法進(jìn)行基音周期的檢測(cè),再進(jìn)行中值平滑處理,最后進(jìn)行比較。 plot(x_low)。低通濾波器的頻率響應(yīng) 39。 %長(zhǎng)度為 N1的矩形窗 Window b1=fir1(N1,wc1/pi,Window)。 fc1=500。 plot(x1)。39。 end 由程序運(yùn)行結(jié)果可以看出,組合平滑算法對(duì)原始基音周期的“野點(diǎn)”有很好的平滑作用,二次平滑算法在對(duì)語音“我到北京去”的平滑作用上,與組合平滑算法相差無幾,都很好地 實(shí)現(xiàn)了對(duì)原始語音進(jìn)行平滑。 else 1=(n1)/2。 else len=r; x=x.39。 [r,c]=size(x)。 if nargin3 wintype=39。樣點(diǎn)數(shù)’) axis([0,360,0,150]) title(‘二次平滑法’) subplot(515) ,plot(zhouqi4)。樣點(diǎn)數(shù)’) axis([0,360,0,150]) title(39。樣點(diǎn)數(shù)’) axis([0,360,0,150]) title(39。樣點(diǎn)數(shù)‘) axis([0,360,0,150]) title(39。 zhouqi4=v1+zhouqi2。 for i=1:( length(zhouqi)4) V(i+4)=zhouqi(i)。 v(1)=0。 w1=medfilt(w1,5)。 zhouqi2=linsmooth(zhouqi0,5)。 zhouqi=fscanf(fid,39。39。 這里采用組合平滑處理,為了改善平滑的效果可以將兩個(gè)中值平滑串接,圖341(a)所示是將一個(gè) 5點(diǎn)中值平滑和一個(gè) 3點(diǎn)中值平滑串接。所以在提取時(shí),就應(yīng)當(dāng)進(jìn)行相應(yīng)的處理使得得到的基音周期軌跡于現(xiàn)實(shí)的軌跡能比較貼合。 subplot(212) axis([0,200,0, *10^5])。 sum=sum+abs(b1(m)b1(m+k1))。 %顯示聲音信號(hào)的波形 N=200。 figure(1)。 得到結(jié)果如下: 圖 a1基音軌跡圖 短時(shí)平均幅度差函數(shù)法檢測(cè)基音周期 對(duì)每一幀信號(hào) 進(jìn)行平均幅度差運(yùn)算程序如下: x=wavread(39。)。幀數(shù) (n)39。.39。 %讀取第一個(gè)自相關(guān)函數(shù)的最大點(diǎn) end %補(bǔ)回前邊去掉的 10個(gè)點(diǎn) N=N+10。 for i=(k+1):n。 n=220。)。樣點(diǎn)數(shù) 39。)。 a(i)=a(i)/m。 a(k)=a(k)+th0。 th0=max(a)*coeff。 ylabel(39。)。)。 end figure(1)。 n=min(a)。); L=length(x)。.39。)。 攀枝花學(xué)院本科畢業(yè)設(shè)計(jì)(論文 ) 3 基于 Matlab 基音周期的檢測(cè) 13 圖 a1原始語音波形 對(duì)語音信號(hào)采樣,通過 matlab對(duì)語音文件“ ”計(jì)算得知其語音長(zhǎng)度為,若采樣頻率為 11KHz,共計(jì) 27500個(gè)采樣點(diǎn)。短時(shí)分析是將語音信號(hào)分為一段一段的來處理,每一段就稱為一“幀”。 stem(x,39。 打開 Matlab并新建一 .m文件,運(yùn)行: x=wavread(39。 攀枝花學(xué)院本科畢業(yè)設(shè)計(jì)(論文 ) 3 基于 Matlab 基音周期的檢測(cè) 11 3 基于 Matlab 基音周期的檢測(cè) 語音文件的錄制與讀入 1. 利用 windows 附件中的錄音機(jī)功能錄制 23 秒的 .wav 語音文件,并以 a 為文件名保存到 Matlab/work 的文件夾中。 圖 ( a)原信號(hào) (b)平均幅度差函數(shù) 攀枝花學(xué)院本科畢業(yè)設(shè)計(jì)(論文) 2 基音檢測(cè)常用的算法 10 圖 (a)加噪信號(hào) (b) 平均幅度差函數(shù) 本章小結(jié) 對(duì)于語音信號(hào)在檢測(cè)之前先進(jìn)行預(yù)處理即利用中心削波處理,然后詳細(xì)講解了 ACF,AMDF 的基音檢測(cè)算法。很容易在硬件上實(shí)現(xiàn),所以使得短時(shí)平均幅度差函數(shù)法在基音檢測(cè)中使用得相對(duì)比較普遍。 平均幅度差函數(shù)法 短時(shí)平均幅度差函數(shù)的介紹,如果信號(hào) x(n)是標(biāo)準(zhǔn)的周期信號(hào),則相距為周期的整數(shù)倍的樣點(diǎn)上的幅度值是相等的,二者差值為零。觀察濁音信號(hào)的自相關(guān)函數(shù)圖,實(shí)際上,真正反映基音周期的只是少數(shù)幾個(gè)峰,其它的多數(shù)峰都是由于聲道的共振特性引起的。語音信號(hào)的分幀是采用可移動(dòng)的有限長(zhǎng)度的窗口進(jìn)行加權(quán)來實(shí)現(xiàn)。令 h( n) = w2 ( n) ,則有 ? ? )(*)()( 212 nhnxmnhmxE Nnmn ??? ? ??? ) 窗口加權(quán)短時(shí)平均能量 En, 沖激相應(yīng) h(n)的選取直接影響著短時(shí)能量的計(jì)算。但是在無周期性的有聲區(qū)內(nèi),這種方法不能起作用,所以就經(jīng)常采用其他的參數(shù)來提高精確度。計(jì)算起來不方便,近年來高速數(shù)字信號(hào)處理 器 (DSP)的使用,使讓這一算法簡(jiǎn)單有效。 用短時(shí)自相關(guān)函數(shù)法進(jìn)行 基音主要依據(jù)短時(shí)自相關(guān)函數(shù)的第 2 條性質(zhì),比較原始的語音信號(hào)與移位后的語音的相似度確定其基音周期,當(dāng)移動(dòng)的距離等于基音周期,兩個(gè)信號(hào)就具有最大類似性,否則,就不能測(cè)得基音周期。 自相關(guān)函數(shù)原理: 能量有限的語音信號(hào) ??()sn 的短時(shí)自相關(guān)函數(shù)定義為: 10( ) [ ( ) ( ) ] [ ( ) ( ) ]NnmR s n m w m s n m w m?? ? ????? ? ? ? ?? () 其中, ? 為移位距離, ()wm是偶對(duì)稱的窗函數(shù)。削波電平由語音信號(hào)的峰值幅度來決定的,所以,這個(gè)門限 XL 的選擇是很重要的。消除其他的響應(yīng)對(duì)于基音檢測(cè)的影響,因此就采用中心削波技術(shù)去來對(duì)語音信號(hào)進(jìn)行預(yù)處理。所以,采用任何的削減或抑制語音低幅度部分的非線性處理都會(huì)使得自相關(guān)函數(shù)的性能得到一些改善。本章將詳細(xì)的介紹這兩種常用基音檢測(cè)算法的基本原理。但從本質(zhì)上講這些方法是無法檢測(cè)幀內(nèi)基音周期的非平穩(wěn)變化,所以這種檢測(cè)方法的精度不夠高。目前的基音檢測(cè)算法大致可分為兩大類:非基于事件檢測(cè)方法和基于事件檢測(cè)方法 ,這里的事件是指聲門閉合。 第 5 章 說話人的語音識(shí)別在我們生活中的美好展望以及在現(xiàn)實(shí)生活應(yīng)用。 攀枝花學(xué)院本科畢業(yè)設(shè)計(jì)(論文) 1 緒論 4 論文的結(jié)構(gòu)安排 與論文的主要內(nèi)容相對(duì)應(yīng),全文具體章節(jié)安排如下: 第 1 章:先簡(jiǎn)述語音信號(hào)處理的相關(guān)概念,再講基音周期的概念,基音檢測(cè)背景研究的意義以及基音檢測(cè)現(xiàn)狀進(jìn)行說明,最后對(duì)論文的結(jié)構(gòu)進(jìn)行安排。 3.在濁音語音段很難對(duì)每個(gè)基音周期的開始和結(jié)束位置進(jìn)行精確的判斷,一方面因?yàn)檎Z音信號(hào)本身是準(zhǔn)周期的。 1.語音信號(hào)本身是變化的,所以研究起來就十分復(fù)雜 ,聲門激勵(lì)的波形并不是一個(gè)完全周期的序列,在語音的開頭和結(jié)尾部分并不具有規(guī)則的聲帶振動(dòng)的周期性,所以在劃分清濁音的過渡幀是,是很難去判定的,到底是該歸類到周期性的還是歸類到非周期性的。 基音周期檢測(cè)現(xiàn)狀 自從進(jìn)行語音信號(hào)分析研究以來,基音檢測(cè)一直是一個(gè)重點(diǎn)研究的課題。 基音是指發(fā)濁音時(shí)聲帶震動(dòng)所引起的周期性,基音周期是指聲帶震動(dòng)頻率的倒數(shù)。 基音周期與先天個(gè)人的聲帶條件(比如聲帶的厚薄,韌性等)還有后天的個(gè)人說話習(xí)慣都有關(guān)系,在很大程度上反應(yīng)了個(gè)人的語音特征。攜帶者語言中大部分的能量,濁音在時(shí)域上呈現(xiàn)出明顯的周期性。準(zhǔn)確可靠的對(duì)基音周期進(jìn)行檢測(cè)將直接影響整個(gè)語音處理系統(tǒng)的性能。語音信號(hào)是十分復(fù)雜的非平穩(wěn)信號(hào),它不僅包括語義信息,還有個(gè)人特征信息,對(duì) 于語音信號(hào)特征參數(shù)的研究是語音識(shí)別的基礎(chǔ)。因此,表征語音特征參數(shù)的獲取,是利用它們進(jìn)行準(zhǔn)確語音識(shí)別的關(guān)鍵?;魴z測(cè)是語音處理中的一項(xiàng)重要技術(shù)之一 , 也是語音處理中最困難的工作之一,而且是語音處理領(lǐng)域最具挑戰(zhàn)的任務(wù)之一。 基音周期檢測(cè)也稱為基頻檢測(cè) (Pitch Detection) ,它的目標(biāo)是找出和聲帶振動(dòng)頻率完全一致的基音周期變化軌跡曲線 ,或者是盡量相吻合的軌跡曲線。語音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語音信號(hào)進(jìn)行處理的一門學(xué)科,它是一門新興的學(xué)科,同時(shí)又是綜合性的多學(xué)科領(lǐng)域和涉及面很廣的交叉學(xué)科,其中包括語音識(shí)別只是其中的一個(gè)分支。語音識(shí)技術(shù)是用來設(shè)計(jì)一種會(huì)聽話的計(jì)算機(jī),只要對(duì)著麥克風(fēng)講話,便可以指揮計(jì)算機(jī)動(dòng)作,也就是要實(shí)現(xiàn)“芝麻開門”聲控計(jì)算機(jī)的夢(mèng)想,當(dāng)然 現(xiàn)在這已經(jīng)不是夢(mèng)想。同時(shí)語言又屬于聲學(xué)范疇,是相互傳遞信息最重要的手段,是人類最重要,最有效,最常用和最方便的交換信息的形式。 關(guān)鍵詞 : 預(yù)處理 ,基音檢測(cè) ,自相關(guān)函數(shù)法 ,平均幅度差函數(shù)法 ,基音軌跡 ,語音識(shí)別攀枝花學(xué)院本科畢業(yè)設(shè)計(jì)(論文) Abstract II Abstract pitch is characterization parameters of speech signal characteristics, belongs to the category of speech analysis, only the accurate analysis and extract the characteristic parameters of speech signal can use these parameters to speech recognition processing. voice recognition rate of high and low, are dependent on the accuracy of the analysis of speech signal and accuracy, so the pitch period of the study on speech signal processing plays an important role in this paper, through the two algorithm in Matlab pitch period detection, respectively is shorttime autocorrelation method and short time average magnitude difference function method. Pitch period is obtained by the experiment results of speech signal analysis to identify the different people. The curriculum design of pitch detection of speech signals, speech signal, the speech signal processing, distinguish between the voiced and unvoiced speech has different samples values in the filtering, framing, asks the shorttime autocorrelation function, have voiced sound pitch period. The thesis first introduces the research background of speech pitch detection algorithm is very important. Next to the existing algorithm for pitch detection are summarized, and a detailed introduction to this article will use the two kinds of basic pitch detection algorit