freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

基于基音周期模型的語音識別(存儲版)

2024-10-08 17:42上一頁面

下一頁面
  

【正文】 圖 (a)加噪信號 (b) 平均幅度差函數 本章小結 對于語音信號在檢測之前先進行預處理即利用中心削波處理,然后詳細講解了 ACF,AMDF 的基音檢測算法。 打開 Matlab并新建一 .m文件,運行: x=wavread(39。短時分析是將語音信號分為一段一段的來處理,每一段就稱為一“幀”。)。); L=length(x)。 end figure(1)。)。 th0=max(a)*coeff。 a(i)=a(i)/m。樣點數 39。 n=220。 %讀取第一個自相關函數的最大點 end %補回前邊去掉的 10個點 N=N+10。幀數 (n)39。 得到結果如下: 圖 a1基音軌跡圖 短時平均幅度差函數法檢測基音周期 對每一幀信號 進行平均幅度差運算程序如下: x=wavread(39。 %顯示聲音信號的波形 N=200。 subplot(212) axis([0,200,0, *10^5])。 這里采用組合平滑處理,為了改善平滑的效果可以將兩個中值平滑串接,圖341(a)所示是將一個 5點中值平滑和一個 3點中值平滑串接。 zhouqi=fscanf(fid,39。 w1=medfilt(w1,5)。 for i=1:( length(zhouqi)4) V(i+4)=zhouqi(i)。樣點數‘) axis([0,360,0,150]) title(39。樣點數’) axis([0,360,0,150]) title(39。 if nargin3 wintype=39。 else len=r; x=x.39。 end 由程序運行結果可以看出,組合平滑算法對原始基音周期的“野點”有很好的平滑作用,二次平滑算法在對語音“我到北京去”的平滑作用上,與組合平滑算法相差無幾,都很好地 實現了對原始語音進行平滑。 plot(x1)。 %長度為 N1的矩形窗 Window b1=fir1(N1,wc1/pi,Window)。 plot(x_low)。 攀枝花學院本科畢業(yè)設計(論文 ) 4 語音識別結果分析 26 4 語音識別結果分析 通過語音信號基音周期的對比就能夠識別出不同的人 。代表性的參數基音參數(靜態(tài)特征)。 說話人識別系統(tǒng)的典型結構如下圖: 圖 說話人識別系統(tǒng)的典型結構圖 由于本課題是錄入的人的聲音,所以就是說話人識別?,F在已經證實了基音周期及其派生參數攜帶著比較多的個人信息。訓練過程就在以后的實踐中實現,讓一個人輸入不同的語料,在進行基音周期的檢測,多次實現使得準確,能在應用時,更好的識別一個人,所以語音識別技術的提高空間很大,發(fā)展前景也相當的廣闊。雖然處在不同的條件下,說話人 的這些高層次的特征受到一些影響,但是很微小,不至于影響到大的識別特征。不同人的指紋不同,與此類似,不同的說話人也就具有不同的語 音信號 ,說話人識別不再是識別簡單的讀音,短語,句子,而是要發(fā)展成能夠識別各種語種,不僅是國際語音,還能夠識別國內各地方的方言,去鑒別此人的更詳細的信息,現在語音識別的挑戰(zhàn)也是相當大的。說話作為交流的媒介,就能節(jié)省人手的動作,所以深入的研究語音識別是很有必要的。化學工業(yè)出版社。 [3]謝仕宏。它始終與當時信息科學中最活躍的前沿學科保持密切的聯系,并且一起發(fā)展。 如今,說話人識別技術已逐步走入實際應用,而且應用領域正在不斷擴大。 目前說話人識別系統(tǒng)的研究和開發(fā)已經取得了令人鼓舞的成就,在一些系統(tǒng)中取得了很好的應用,但它面臨的挑戰(zhàn)是巨大的,潛力的提高的潛力也是很大的,現在的系統(tǒng)的性能還不完善,所以有待于進一步提高,這需要人們在說話 人基音周期提取,現有說話人模型的改進,新模型及識別策略研究上進行長期堅持不懈的探索??赡鼙菊撐牡慕Y果不太精確,如果利用更高科技的器件,我相信每個人的基音周期都能檢測的很準確。 3)說話人識別的最終目的不是注重說人的內容,故在識別時方法就有所不同,這其中就包括用以比較的幀和幀長的選定,識別邏輯的制定等。說話人識別系統(tǒng)還面臨一些問題: 1)如何選取唯一的參數能有效并且可靠的表征 預處理 特征提取 參考模板 模式匹配 判決 攀枝花學院本科畢業(yè)設計(論文 ) 4 語音識別結果分析 27 說話人的語音特質,然后是將怎樣對之進行處理; 2)如何的設定測量的相似度,使 得計算能既簡單又準確; 3)由于人在不同的狀態(tài)(如人的喜﹑怒﹑哀﹑樂,健康情況和生病情況)是在變化的,選取得參考參數怎么樣能適應于說話人。先天的差異主要表現在語音的共振峰頻率高低,帶寬的大小,平均基頻,頻譜基本形狀的斜率等,后天的差異表現在基頻,共振峰頻率的時間圖案,單詞的時間長短。其實,進行兩種算法的實現是想對比那種方法更實用。 x_low= filter(b1,1,x1)。 if rem(N1,2)==0 N1=N1+1。 x1=x(11001:22020)。 end for k=1:len y(k)=win39。sorry,no matrix here!:(39。幀數’) ylabel(39。 xlabel(39。中值平滑 線性平滑 攀枝花學院本科畢業(yè)設計(論文 ) 3 基于 Matlab 基音周期的檢測 21 xlabel(39。v(3)=0。 w=zhouqi。rt39。 去除這些“野點”,使得基音軌跡能夠平滑,就需要進行平滑后處理。 end s=x(11001:22020)。.39。各幀基音周期 39。axis([0 length(T) 0 10])。 end end p=Rm(10:n)。39。 title(39。 end end m=max(a)。)。 title(39。 for i=1:L。 %顯示聲音信號的波形 得到波形如下: 攀枝花學院本科畢業(yè)設計(論文 ) 3 基于 Matlab 基音周期的檢測 14 圖 a1采樣信號波形 中心削波法的程序及其波形圖: a=wavread(39。 打開 Matlab,運行: x=wavread(39。)。 “我到北京去” 錄音(按 鍵), 然后到 23 秒時停止(按鍵); C:/Matlab/work 中,文件名為 , ,采樣頻率選 11KHz, 16 位,單聲道; 攀枝花學院本科畢業(yè)設計(論文 ) 3 基于 Matlab 基音周期的檢測 12 2. 打開 Matlab 并新建一 .m文件; .m文件中用 y=wavread(‘’)命令讀入語音文件。 如圖 (a)是一幀原始語音信號, (b)是這幀語音信號的 AMDF 函數,從圖中能看出 AMDF 法在基音周期處表現為谷低,通過計算這些谷低之間的間隔的平均值就可以得到基音周期。常常會出現檢測的結果是實際結果的 2 倍或者 1/2,就使得基音檢測相當困難。由于語音基音頻率范圍為 50Hz到 500Hz,因此折中選擇幀長為 10到 20ms。所以要選擇適當的 N 值。 ②當τ =0 時,自相關函數具有最大值;且當 0, , 2 , 3P P P? ? ? ? ?? 處周期信號的自相關函數達到極大值。下面介紹的是中心削波法。預處理可以去除聲道相應的影響及其他帶來擾亂的特征,方法之一就是采用非線性處理。語音信號是典型的時變、非平穩(wěn)信號,但是,由于語音的形成過程是與發(fā)音器官的運動密切相關的,而這種物理運動要比聲音振動速度要緩 慢得多,因此語音信號常常被假定為短時平穩(wěn)的,即在短時間內,其頻譜特性和某些物理特征參量可近似地看作是不變的,非基于事件的檢測方法正是利用語音信號短時平穩(wěn)性這一特點,先將語音信號分為長度一定的語音幀,然后對每一幀的語音求基音周期。 第 3 章:利用 matlab,對基音周期檢測的自相關函數法和平均幅度差函數法進行實現,對語音信號濾波前后的基音周期軌跡圖進行了比較。 ,或者怎樣直接去除只和聲帶震動有關的音源信息,這些都并非易事。漢語是一門講聲調的語言,基音周期的變化恰好就是聲調,它攜帶的信息的辨別作用很重要,具有區(qū)別功能,聲調對于漢語語音的理解極為重要。這種聲帶振動的頻率稱為基音頻率,相應的周期就成為基音周期。實驗語音學給出的語音信號的特征參數本質上講是客觀,合理的,存在的問題是不夠完全。在基音提取時,容易錯誤的提取真正基頻兩倍的頻率(倍基音)和基頻一攀枝花學院本科畢業(yè)設計(論文) 1 緒論 2 半的頻率(半基音),至于產生哪種錯誤隨抽取方法而變化,本論文中會 介紹兩種比較好的算法來進行基音檢測。只有將語音信號分析成其本質的特性參數,才能建立用于識別的模板或知識庫。語音識別技術是一項集聲學,語音學,計算機,信息處理,人工智能計算機接口的范疇。最后在 Matlab 上對語音信號進行基音周期的檢測。語音識別率的高低,都依賴于對語音信號分析的準確性和精確性,因此基音周期的研究在語音信號的處理應用中具有十分重要的作用。 the average magnitude difference function method。語音信號處理的一系列技術及其應用已經成為信息社會中不可或缺的組成部分,促進了信息社會的發(fā)展?;纛l率的檢測和共估值在語音編碼,語音合成和語音識別中有著廣泛的應用。在這些參數中,基音周期的提取顯得更重要些,其提取的準確與否直接影響到語音識別是否真實再現原始語音信號的頻譜。聲帶的聲學功能是為語音提供主要的激勵源,由聲帶的振動產生聲音,是形成聲音的基本聲源。語音信號還是隨著一些因素在變化的,男人聲音低,就基音頻率低,女基音頻率還跟隨著人的性別、年齡不同而有所不同?;糁芷谑锹晭д饎宇l率 F0的倒數,對于語音產生的數字模型中激勵源來說,也是一個重要參數。另一方面因為語音信號的波形受共振峰、噪音等 因素的影響。 最后是參考文獻、致謝。 基于事件的檢測方法是通過定位聲門閉合時刻來對基音周期進行估計,而不是對語音信號進行短時平穩(wěn)假設,主要有小波變換方法和 HilbertHuang 變換方法這兩種。并且非線性處理在 采用硬件時可在時域低成本地實現。一般在不損失基音信息的前提下,盡可能的選的高一些,能達到好的效果。 在實際中,采用短時自相關函數法進行基音檢測時,第一要考慮的問題是窗的問題,使用一個窗函數,令窗不動,而語音信號移動,這就是經典的短時自相關函數法。輔助參數主要有 :語音信號能量;過零數;自相關函數;線性預測系數。選擇的原則是:使得短時能量既能及時跟蹤語音能量的緩變規(guī)律,同時又對語音振幅一個基音周期內的瞬時變化有顯著平滑的作用。對于濁音信號,在周期整數倍上,這個差值不為零,但也小,就可以采用計算短時平均幅度差函 數中兩相鄰谷值間的距離進行基音周期估值。自相關函數先進行基音周期估計時先分清濁音和清音,再去尋找的是最大峰值點的位置,而 AMDF 尋找的是它的最小谷值點的位置;自相關函數法具有很好的抗噪性,但易受半頻、倍頻錯誤影響,而平均幅度差函數法只需加法、減法和取絕對值等計算,算法簡單,運算量相比自相關函數法大為減少,易于硬件實現。39。分幀時需要對語音信號進行加窗操作,窗口長度的選擇非常重要,窗口長度過短會使得分析窗內沒有包含足夠的數據點來進行周期判斷,且短時能量變 化劇烈;窗口長度過長,短時能量是一段長時間的平均,不但不能反映出語音信號基頻的細節(jié)變化部分,而且使得計算量增大。%讀取聲音文件 x=x(11001:22020)。 m=max(a)。 subplot(2,1,1)。 攀枝花學院本科畢業(yè)設計(論
點擊復制文檔內容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1