freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于基音周期模型的語音識別(存儲(chǔ)版)

2025-10-09 17:42上一頁面

下一頁面
  

【正文】 圖 (a)加噪信號 (b) 平均幅度差函數(shù) 本章小結(jié) 對于語音信號在檢測之前先進(jìn)行預(yù)處理即利用中心削波處理,然后詳細(xì)講解了 ACF,AMDF 的基音檢測算法。 打開 Matlab并新建一 .m文件,運(yùn)行: x=wavread(39。短時(shí)分析是將語音信號分為一段一段的來處理,每一段就稱為一“幀”。)。); L=length(x)。 end figure(1)。)。 th0=max(a)*coeff。 a(i)=a(i)/m。樣點(diǎn)數(shù) 39。 n=220。 %讀取第一個(gè)自相關(guān)函數(shù)的最大點(diǎn) end %補(bǔ)回前邊去掉的 10個(gè)點(diǎn) N=N+10。幀數(shù) (n)39。 得到結(jié)果如下: 圖 a1基音軌跡圖 短時(shí)平均幅度差函數(shù)法檢測基音周期 對每一幀信號 進(jìn)行平均幅度差運(yùn)算程序如下: x=wavread(39。 %顯示聲音信號的波形 N=200。 subplot(212) axis([0,200,0, *10^5])。 這里采用組合平滑處理,為了改善平滑的效果可以將兩個(gè)中值平滑串接,圖341(a)所示是將一個(gè) 5點(diǎn)中值平滑和一個(gè) 3點(diǎn)中值平滑串接。 zhouqi=fscanf(fid,39。 w1=medfilt(w1,5)。 for i=1:( length(zhouqi)4) V(i+4)=zhouqi(i)。樣點(diǎn)數(shù)‘) axis([0,360,0,150]) title(39。樣點(diǎn)數(shù)’) axis([0,360,0,150]) title(39。 if nargin3 wintype=39。 else len=r; x=x.39。 end 由程序運(yùn)行結(jié)果可以看出,組合平滑算法對原始基音周期的“野點(diǎn)”有很好的平滑作用,二次平滑算法在對語音“我到北京去”的平滑作用上,與組合平滑算法相差無幾,都很好地 實(shí)現(xiàn)了對原始語音進(jìn)行平滑。 plot(x1)。 %長度為 N1的矩形窗 Window b1=fir1(N1,wc1/pi,Window)。 plot(x_low)。 攀枝花學(xué)院本科畢業(yè)設(shè)計(jì)(論文 ) 4 語音識別結(jié)果分析 26 4 語音識別結(jié)果分析 通過語音信號基音周期的對比就能夠識別出不同的人 。代表性的參數(shù)基音參數(shù)(靜態(tài)特征)。 說話人識別系統(tǒng)的典型結(jié)構(gòu)如下圖: 圖 說話人識別系統(tǒng)的典型結(jié)構(gòu)圖 由于本課題是錄入的人的聲音,所以就是說話人識別。現(xiàn)在已經(jīng)證實(shí)了基音周期及其派生參數(shù)攜帶著比較多的個(gè)人信息。訓(xùn)練過程就在以后的實(shí)踐中實(shí)現(xiàn),讓一個(gè)人輸入不同的語料,在進(jìn)行基音周期的檢測,多次實(shí)現(xiàn)使得準(zhǔn)確,能在應(yīng)用時(shí),更好的識別一個(gè)人,所以語音識別技術(shù)的提高空間很大,發(fā)展前景也相當(dāng)?shù)膹V闊。雖然處在不同的條件下,說話人 的這些高層次的特征受到一些影響,但是很微小,不至于影響到大的識別特征。不同人的指紋不同,與此類似,不同的說話人也就具有不同的語 音信號 ,說話人識別不再是識別簡單的讀音,短語,句子,而是要發(fā)展成能夠識別各種語種,不僅是國際語音,還能夠識別國內(nèi)各地方的方言,去鑒別此人的更詳細(xì)的信息,現(xiàn)在語音識別的挑戰(zhàn)也是相當(dāng)大的。說話作為交流的媒介,就能節(jié)省人手的動(dòng)作,所以深入的研究語音識別是很有必要的。化學(xué)工業(yè)出版社。 [3]謝仕宏。它始終與當(dāng)時(shí)信息科學(xué)中最活躍的前沿學(xué)科保持密切的聯(lián)系,并且一起發(fā)展。 如今,說話人識別技術(shù)已逐步走入實(shí)際應(yīng)用,而且應(yīng)用領(lǐng)域正在不斷擴(kuò)大。 目前說話人識別系統(tǒng)的研究和開發(fā)已經(jīng)取得了令人鼓舞的成就,在一些系統(tǒng)中取得了很好的應(yīng)用,但它面臨的挑戰(zhàn)是巨大的,潛力的提高的潛力也是很大的,現(xiàn)在的系統(tǒng)的性能還不完善,所以有待于進(jìn)一步提高,這需要人們在說話 人基音周期提取,現(xiàn)有說話人模型的改進(jìn),新模型及識別策略研究上進(jìn)行長期堅(jiān)持不懈的探索??赡鼙菊撐牡慕Y(jié)果不太精確,如果利用更高科技的器件,我相信每個(gè)人的基音周期都能檢測的很準(zhǔn)確。 3)說話人識別的最終目的不是注重說人的內(nèi)容,故在識別時(shí)方法就有所不同,這其中就包括用以比較的幀和幀長的選定,識別邏輯的制定等。說話人識別系統(tǒng)還面臨一些問題: 1)如何選取唯一的參數(shù)能有效并且可靠的表征 預(yù)處理 特征提取 參考模板 模式匹配 判決 攀枝花學(xué)院本科畢業(yè)設(shè)計(jì)(論文 ) 4 語音識別結(jié)果分析 27 說話人的語音特質(zhì),然后是將怎樣對之進(jìn)行處理; 2)如何的設(shè)定測量的相似度,使 得計(jì)算能既簡單又準(zhǔn)確; 3)由于人在不同的狀態(tài)(如人的喜﹑怒﹑哀﹑樂,健康情況和生病情況)是在變化的,選取得參考參數(shù)怎么樣能適應(yīng)于說話人。先天的差異主要表現(xiàn)在語音的共振峰頻率高低,帶寬的大小,平均基頻,頻譜基本形狀的斜率等,后天的差異表現(xiàn)在基頻,共振峰頻率的時(shí)間圖案,單詞的時(shí)間長短。其實(shí),進(jìn)行兩種算法的實(shí)現(xiàn)是想對比那種方法更實(shí)用。 x_low= filter(b1,1,x1)。 if rem(N1,2)==0 N1=N1+1。 x1=x(11001:22020)。 end for k=1:len y(k)=win39。sorry,no matrix here!:(39。幀數(shù)’) ylabel(39。 xlabel(39。中值平滑 線性平滑 攀枝花學(xué)院本科畢業(yè)設(shè)計(jì)(論文 ) 3 基于 Matlab 基音周期的檢測 21 xlabel(39。v(3)=0。 w=zhouqi。rt39。 去除這些“野點(diǎn)”,使得基音軌跡能夠平滑,就需要進(jìn)行平滑后處理。 end s=x(11001:22020)。.39。各幀基音周期 39。axis([0 length(T) 0 10])。 end end p=Rm(10:n)。39。 title(39。 end end m=max(a)。)。 title(39。 for i=1:L。 %顯示聲音信號的波形 得到波形如下: 攀枝花學(xué)院本科畢業(yè)設(shè)計(jì)(論文 ) 3 基于 Matlab 基音周期的檢測 14 圖 a1采樣信號波形 中心削波法的程序及其波形圖: a=wavread(39。 打開 Matlab,運(yùn)行: x=wavread(39。)。 “我到北京去” 錄音(按 鍵), 然后到 23 秒時(shí)停止(按鍵); C:/Matlab/work 中,文件名為 , ,采樣頻率選 11KHz, 16 位,單聲道; 攀枝花學(xué)院本科畢業(yè)設(shè)計(jì)(論文 ) 3 基于 Matlab 基音周期的檢測 12 2. 打開 Matlab 并新建一 .m文件; .m文件中用 y=wavread(‘’)命令讀入語音文件。 如圖 (a)是一幀原始語音信號, (b)是這幀語音信號的 AMDF 函數(shù),從圖中能看出 AMDF 法在基音周期處表現(xiàn)為谷低,通過計(jì)算這些谷低之間的間隔的平均值就可以得到基音周期。常常會(huì)出現(xiàn)檢測的結(jié)果是實(shí)際結(jié)果的 2 倍或者 1/2,就使得基音檢測相當(dāng)困難。由于語音基音頻率范圍為 50Hz到 500Hz,因此折中選擇幀長為 10到 20ms。所以要選擇適當(dāng)?shù)?N 值。 ②當(dāng)τ =0 時(shí),自相關(guān)函數(shù)具有最大值;且當(dāng) 0, , 2 , 3P P P? ? ? ? ?? 處周期信號的自相關(guān)函數(shù)達(dá)到極大值。下面介紹的是中心削波法。預(yù)處理可以去除聲道相應(yīng)的影響及其他帶來擾亂的特征,方法之一就是采用非線性處理。語音信號是典型的時(shí)變、非平穩(wěn)信號,但是,由于語音的形成過程是與發(fā)音器官的運(yùn)動(dòng)密切相關(guān)的,而這種物理運(yùn)動(dòng)要比聲音振動(dòng)速度要緩 慢得多,因此語音信號常常被假定為短時(shí)平穩(wěn)的,即在短時(shí)間內(nèi),其頻譜特性和某些物理特征參量可近似地看作是不變的,非基于事件的檢測方法正是利用語音信號短時(shí)平穩(wěn)性這一特點(diǎn),先將語音信號分為長度一定的語音幀,然后對每一幀的語音求基音周期。 第 3 章:利用 matlab,對基音周期檢測的自相關(guān)函數(shù)法和平均幅度差函數(shù)法進(jìn)行實(shí)現(xiàn),對語音信號濾波前后的基音周期軌跡圖進(jìn)行了比較。 ,或者怎樣直接去除只和聲帶震動(dòng)有關(guān)的音源信息,這些都并非易事。漢語是一門講聲調(diào)的語言,基音周期的變化恰好就是聲調(diào),它攜帶的信息的辨別作用很重要,具有區(qū)別功能,聲調(diào)對于漢語語音的理解極為重要。這種聲帶振動(dòng)的頻率稱為基音頻率,相應(yīng)的周期就成為基音周期。實(shí)驗(yàn)語音學(xué)給出的語音信號的特征參數(shù)本質(zhì)上講是客觀,合理的,存在的問題是不夠完全。在基音提取時(shí),容易錯(cuò)誤的提取真正基頻兩倍的頻率(倍基音)和基頻一攀枝花學(xué)院本科畢業(yè)設(shè)計(jì)(論文) 1 緒論 2 半的頻率(半基音),至于產(chǎn)生哪種錯(cuò)誤隨抽取方法而變化,本論文中會(huì) 介紹兩種比較好的算法來進(jìn)行基音檢測。只有將語音信號分析成其本質(zhì)的特性參數(shù),才能建立用于識別的模板或知識庫。語音識別技術(shù)是一項(xiàng)集聲學(xué),語音學(xué),計(jì)算機(jī),信息處理,人工智能計(jì)算機(jī)接口的范疇。最后在 Matlab 上對語音信號進(jìn)行基音周期的檢測。語音識別率的高低,都依賴于對語音信號分析的準(zhǔn)確性和精確性,因此基音周期的研究在語音信號的處理應(yīng)用中具有十分重要的作用。 the average magnitude difference function method。語音信號處理的一系列技術(shù)及其應(yīng)用已經(jīng)成為信息社會(huì)中不可或缺的組成部分,促進(jìn)了信息社會(huì)的發(fā)展。基音頻率的檢測和共估值在語音編碼,語音合成和語音識別中有著廣泛的應(yīng)用。在這些參數(shù)中,基音周期的提取顯得更重要些,其提取的準(zhǔn)確與否直接影響到語音識別是否真實(shí)再現(xiàn)原始語音信號的頻譜。聲帶的聲學(xué)功能是為語音提供主要的激勵(lì)源,由聲帶的振動(dòng)產(chǎn)生聲音,是形成聲音的基本聲源。語音信號還是隨著一些因素在變化的,男人聲音低,就基音頻率低,女基音頻率還跟隨著人的性別、年齡不同而有所不同?;糁芷谑锹晭д饎?dòng)頻率 F0的倒數(shù),對于語音產(chǎn)生的數(shù)字模型中激勵(lì)源來說,也是一個(gè)重要參數(shù)。另一方面因?yàn)檎Z音信號的波形受共振峰、噪音等 因素的影響。 最后是參考文獻(xiàn)、致謝。 基于事件的檢測方法是通過定位聲門閉合時(shí)刻來對基音周期進(jìn)行估計(jì),而不是對語音信號進(jìn)行短時(shí)平穩(wěn)假設(shè),主要有小波變換方法和 HilbertHuang 變換方法這兩種。并且非線性處理在 采用硬件時(shí)可在時(shí)域低成本地實(shí)現(xiàn)。一般在不損失基音信息的前提下,盡可能的選的高一些,能達(dá)到好的效果。 在實(shí)際中,采用短時(shí)自相關(guān)函數(shù)法進(jìn)行基音檢測時(shí),第一要考慮的問題是窗的問題,使用一個(gè)窗函數(shù),令窗不動(dòng),而語音信號移動(dòng),這就是經(jīng)典的短時(shí)自相關(guān)函數(shù)法。輔助參數(shù)主要有 :語音信號能量;過零數(shù);自相關(guān)函數(shù);線性預(yù)測系數(shù)。選擇的原則是:使得短時(shí)能量既能及時(shí)跟蹤語音能量的緩變規(guī)律,同時(shí)又對語音振幅一個(gè)基音周期內(nèi)的瞬時(shí)變化有顯著平滑的作用。對于濁音信號,在周期整數(shù)倍上,這個(gè)差值不為零,但也小,就可以采用計(jì)算短時(shí)平均幅度差函 數(shù)中兩相鄰谷值間的距離進(jìn)行基音周期估值。自相關(guān)函數(shù)先進(jìn)行基音周期估計(jì)時(shí)先分清濁音和清音,再去尋找的是最大峰值點(diǎn)的位置,而 AMDF 尋找的是它的最小谷值點(diǎn)的位置;自相關(guān)函數(shù)法具有很好的抗噪性,但易受半頻、倍頻錯(cuò)誤影響,而平均幅度差函數(shù)法只需加法、減法和取絕對值等計(jì)算,算法簡單,運(yùn)算量相比自相關(guān)函數(shù)法大為減少,易于硬件實(shí)現(xiàn)。39。分幀時(shí)需要對語音信號進(jìn)行加窗操作,窗口長度的選擇非常重要,窗口長度過短會(huì)使得分析窗內(nèi)沒有包含足夠的數(shù)據(jù)點(diǎn)來進(jìn)行周期判斷,且短時(shí)能量變 化劇烈;窗口長度過長,短時(shí)能量是一段長時(shí)間的平均,不但不能反映出語音信號基頻的細(xì)節(jié)變化部分,而且使得計(jì)算量增大。%讀取聲音文件 x=x(11001:22020)。 m=max(a)。 subplot(2,1,1)。 攀枝花學(xué)院本科畢業(yè)設(shè)計(jì)(論
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1