freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的優(yōu)秀很詳細(xì)很嚴(yán)謹(jǐn)+優(yōu)秀++語音信號的采集與分析-預(yù)覽頁

2026-01-07 09:51 上一頁面

下一頁面
 

【正文】 題,查找 閱讀 相關(guān)資料 。其中語音采集和分析儀器的小型化、智能化、數(shù)字化以及多功能化的發(fā)展越來越快,分析速度較以往也有了大幅度的高。 This paper introduces the voice signal acquisition and analysis of the history of the development, as well as the characteristics of speech signal, Collection and analysis methods, Recording machine through the PC section of my own voices, the use of Matlab for simulation analysis, finally add the noise filter to deal with, parison of filter before and after Change。并且,由于語言和語音與人的智力活動密切相 關(guān),與社會文化和進(jìn)步緊密相連,所以它具有最大的信息容量和最高的智能水平。作為高科鼓應(yīng)用領(lǐng)域的研究熱點(diǎn),語音信號 采集與分析 從理論的研究 到產(chǎn)品的開發(fā)已經(jīng)走過了幾十個(gè)春秋并且取得了長足的進(jìn)步。 語音信號 采集與分析 之所以能夠那樣長期地、深 深地吸引廣大科學(xué)工作者去不斷地對其進(jìn)行研究和探討,除了它的實(shí)用性之外,另一個(gè)重要原因是,它始終與當(dāng)時(shí)信息科學(xué)中最活躍的前沿學(xué)科保持密切的聯(lián)系.并且一起發(fā)展。 國內(nèi)外研究現(xiàn)狀 語音信號 的采集與分析 作為一個(gè)重要的研究領(lǐng)域,已經(jīng)有很長的研究歷史 [1]。 20 世紀(jì) 60 年代 初 由于 Faut 和 Steven 的努力,奠定了 語音生成理論的基礎(chǔ),在此基礎(chǔ)上語音 合成的研究得到了扎實(shí)的進(jìn)展 。所以 1969 年美國貝爾研究所的 Pierce 感嘆地說“ 語音識別向何處去 ?” 。這個(gè)研究計(jì)劃不僅在美國園內(nèi),而且對世界各國都產(chǎn)生了很大的影響,它促進(jìn)了連續(xù)語音識別研究的興起。從此矢量量化技術(shù)不僅在語音識別、語音編碼和說話人識別等方面發(fā)揮了重要作用,而且很快推廣到其他許多領(lǐng)域。其理論基礎(chǔ)是 1970 年前后,由 Baum 等 人 建立起來的,隨后,由美國卡內(nèi)基 梅隆 大學(xué) (CMU)的 Baker 和 美國 IBM 公司的 Jelinek 等人將其應(yīng)用到語音識別中。一方面,對聲學(xué)語音學(xué)統(tǒng)計(jì)模型的研究逐漸深入, 魯棒 的語音識別、基于語音段的建模方法及隱馬爾可夫模型與人工種經(jīng)網(wǎng)絡(luò)的結(jié)合成為研究的熱點(diǎn)。第 3章主要是對語音信號進(jìn)行時(shí)域、頻域上的分析 ,如短時(shí)功率譜,短時(shí)能量,短時(shí)平均過零率,語譜圖分析等等。它在數(shù)學(xué)類科技應(yīng)用軟件中在 數(shù)值計(jì)算 方面首屈一指??梢灾苯诱{(diào)用 ,用戶也可以將自己編寫的實(shí)用程序?qū)氲?MATLAB 函數(shù)庫中方便自己以后調(diào)用,此外許多的 MATLAB愛好者都編寫了一些經(jīng)典的程序,用戶可以直接進(jìn)行下載就可以用。在濁音段表現(xiàn)出周期信號的特征,在清音段表現(xiàn)出隨機(jī)噪聲的特征。這樣,預(yù)濾波器必須是一個(gè)帶通濾波器,設(shè)其上、下截止顏率分別是 fH 和 fL,則對于絕人多數(shù)語音編譯碼器, fH=3400Hz、 fL= 60~100Hz、采樣率為 fs= 8kHz;而對丁語音識別而言,當(dāng)用于電話用戶時(shí),指標(biāo)與語音編譯碼器相同。 采樣時(shí)必須要注意滿足 奈奎斯特定理 ,即采樣頻率 fs 必須 以高于受測信號的最高頻率兩倍以上的速度進(jìn)行取樣,才能正確地重建波 它是通過采樣脈沖和模擬信號相乘來實(shí)現(xiàn)的 。 在采樣的過程中應(yīng)注意 采樣間隔的選擇和信號混淆:對模擬信號采樣首先要確定采樣間隔。采樣頻率過低,采樣點(diǎn)間隔過遠(yuǎn),則離散信號不足以反映原有信號波形特征,無法使信號復(fù)原,造成信號混淆。具體振值用舍入法歸到靠近的量化電平上。 在實(shí)際工作中,我們可以利用 windows 自帶的錄音機(jī)錄制語音文件 ,圖 23 是基于 PC河南農(nóng)業(yè)大學(xué)理學(xué)院本科 畢業(yè)論文 (設(shè)計(jì) ) 機(jī) 的語音信號 采集過程 ,聲卡可以完成語音波形的 A/D 轉(zhuǎn)換,獲得 WAVE 文件,為后續(xù)的處理儲備原材料。而且,語音合成的音質(zhì)好壞,語音識別率的高低,也都取決于對語音信號分橋的準(zhǔn)確性 和精確性。但是,由于不同的語音是由人的口腔肌肉運(yùn)動構(gòu)成聲道某種形狀而產(chǎn)生的響應(yīng),而這種口腔肌肉運(yùn)動相對于語音頻率來說是非常緩慢的,所以從另一方面看,雖然語音倍號具有時(shí)變特性,但是在一個(gè)短時(shí)間范圍內(nèi) (一般認(rèn)為在 10~30ms 的短時(shí)間內(nèi) ),其特性基本保持不變即相對 穩(wěn)定,因面可以將其看作是一個(gè)準(zhǔn)穩(wěn)態(tài)過程,即語音信號具有短時(shí) 平 穩(wěn)性。 本文將簡要介紹時(shí)域分析、頻域分析以及語譜圖分析。時(shí)域分析通常用于最基本的參數(shù)分析及應(yīng)用,如語音的分割、預(yù)處理、大分類等。④只使用示波器等通用設(shè)備,使用較為簡單等。 設(shè) 第 n 幀語音信號 Xn(m)的短時(shí)能量用 En 表示,則其計(jì) 算公式如下: 1 20 ()NnnmE x m???? (33) En 是一個(gè)度量語音信號幅度值變化的函數(shù),但它有一 個(gè)缺陷,即它對高電平非常敏感 (因?yàn)樗?計(jì)算時(shí)用的是信號的平方 )。③作為一種超音段信息,用 于 語音識別 中 。過零率就是樣本改變符號的次數(shù)。 對語音信號進(jìn)行分析,發(fā)現(xiàn)發(fā)濁音時(shí),盡管聲道有若干個(gè)共振峰,但由于聲門波引起譜的 高頻跌落,所以其話音能量約集中在 3kHz以下。 利用短時(shí)平均過零率還可以從背景噪聲中找出語音信號,可用于判斷寂靜無聲段和有聲 段的起點(diǎn)和終點(diǎn)位置。 圖 31 是用 Mtalab 仿真 一段語音信號 時(shí)域波形 的 短時(shí)能量和 短時(shí)平均過零率 。因?yàn)檎Z音 波是一個(gè)非平穩(wěn)過程,因此適用于周期、瞬變或平穩(wěn) 隨機(jī)信號的標(biāo)準(zhǔn)傅里葉變換不能用來直接表示語音信號, 而應(yīng)該用短時(shí)傅里葉變換對語音信號的頻譜進(jìn)行分析,相應(yīng)的頻譜稱為“ 短時(shí) 譜 ” 短時(shí)博里葉變換求語音的短時(shí)譜 對第 n 幀語音信號 Xn(m)進(jìn)行傅里葉變換 (離散時(shí)域傅里葉變換, DTFT),可得到短時(shí)傅里葉變換, 其定義如下: 10( ) ( )Njw jw nnnmX e x m e? ??? ? (37) 由定義可知,短時(shí)傅里葉變換實(shí)際就是 窗 選語音信號的標(biāo)準(zhǔn)傅里葉變換。 我們還可以將式 (3— 27)寫成另一種形式。由式 (330)可知,為了使 ()jwnXe 忠實(shí)再現(xiàn) ()jwXe 的特性. ()jwWe 相對于 ()jwXe 來說必須是 — 個(gè)沖激函數(shù)。另外,窗的形狀也對短時(shí)博氏頻譜有影響,如矩形窗,雖然頻率分辨率很高 (即主辯狹窄尖銳 ),但由于第一旁瓣 的衰減很小,有較大的上下沖,采用矩形窗時(shí)求得的 ()jwnXe 與 ()jwXe 的偏差較大,這就是 Gibbs 效應(yīng),所以不適合用于 頻譜 成分很寬的語音分析中。根據(jù)傅里葉變換的性 質(zhì),實(shí)數(shù)序列的傅里葉變換的頻譜具有對稱性,因此,全部頻譜信息包含在長度為 N/2+1個(gè) ()nXk里。由 10k zH / 1N < 30,得 1N> 333,所以 1N = 2L 要取比 333 大的值,這時(shí)可取 1N = 92 = 512 點(diǎn), 不 足的部分采用補(bǔ) 0的辦法解決,此時(shí)頻率分辨率 (即頻率間隔 )為 10 Hz/ 512= ,采樣后的該幀信號頻率處在 0~ 2‘ x19. 53Hz 之間,因此,原連續(xù)信號頻率就處在 0~ 12 Hz? ? 之間 (即max 5f kHz? ),所以我們要在 0~ 5kHz 頻率范圍內(nèi)求其頻譜。 在語音信號數(shù)字處理中,功率譜具有重要意義,在一些語音應(yīng)用系統(tǒng)中.往往都是利用語 音信號的功率 譜 。 河南農(nóng)業(yè)大學(xué)理學(xué)院本科 畢業(yè)論文 (設(shè)計(jì) ) 圖 32 同一人兩次說同一詞的功率譜比較 Figure 32 that the same person twice the power spectrum of the same word parison 可以看出功率譜圖比較好地反映出聲音的個(gè)人特征:在低頻部分(頻率低于 6000Hz),同一人說同一詞,其功率譜圖中的各個(gè)波峰所對應(yīng)的頻率基本相同;不同人說同一詞,其功率譜圖的出現(xiàn)波峰的頻率比較接近;同一人說不同詞時(shí)功率譜的形狀差別較大。但是由于語音信號隨時(shí)間變化是很緩慢的,因而在一段短 時(shí)間內(nèi) (如 10~ 30ms之間,即所謂的一幀之內(nèi) )可以認(rèn)為其頻譜是固定不變的,這種頻譜又稱為短時(shí)譜。語諾圖是一種三維 頻譜 ,它是 表示語音 頻譜隨時(shí)間變化的圖形,其縱軸為頻率,橫軸為時(shí)間,任一給定頻率成分在給定時(shí)刻的強(qiáng)弱用相應(yīng)點(diǎn)的灰度或色調(diào)的濃談來表示。 帶通濾波器有兩種帶寬可供選擇:窄帶為 45Hz,寬帶為 300Hz。 語語圖的實(shí)際應(yīng)用是用于確定出講話人的本性。雖然對采用語譜圖的講活人識別技術(shù)的可靠性過存在相當(dāng)人的懷疑,但目前這一技術(shù)已在司法法庭小得到某些認(rèn)可及采用 [11]。橫杠是與時(shí)間 軸 平行的幾條深黑色帶紋,它們相應(yīng)于短時(shí) 譜 中的幾個(gè)凸出點(diǎn),也就是共振峰。每個(gè)豎直條相當(dāng)于一個(gè)基音,條紋 的起點(diǎn)相當(dāng)于聲門脈沖的起點(diǎn),條紋之間的距離 表示 基音周 期。把原始的待傳信號托附到高頻振蕩的過程稱為調(diào)制 。 0 0 . 5 1 1 . 5 2 2 . 5x 1 0521012調(diào)制信號 + 原始信號的波形0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5 4x 1 0401000202130004000調(diào)制信號 + 原始信號的頻譜 圖 43 調(diào)制后的語音信號 +原始語音信號 Figure 43 voice modulated signal + the original speech signal 由圖可知低頻部分是原始信號,高頻部分是經(jīng)過調(diào)制后的信號。Ap=1。 [n,wn]=ellipord(wp,wc,Ap,As)。 河南農(nóng)業(yè)大學(xué)理學(xué)院本科 畢業(yè)論文 (設(shè)計(jì) ) 0 0 . 5 1 1 . 5 2 2 . 5x 1 05 0 . 500 . 5低通濾波后的信號波形0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5 4x 1 040100200300400低通濾波后信號頻譜 總 結(jié) 通過這次課程設(shè)計(jì),使我對語音信號有了全面的認(rèn)識,對數(shù)字信號處理的知識又有了 深刻 的理解 , 在之前數(shù)字信號與處理的學(xué)習(xí)以及完成課后的作業(yè)的過程中,已經(jīng)使用過MATLAB,對其有了一些基礎(chǔ)的了解和認(rèn)識。這次設(shè)計(jì)使我了解了 MATLAB的使用方法,學(xué)會分析濾波器的優(yōu)劣和性能,提高了分析和動手實(shí)踐能力。在平易近人學(xué)識淵博的李老師的熏陶下,使我感覺到自己知識的淺薄,在浩瀚的知識海洋面前,使我感覺到自己要不斷進(jìn)取。 28(10):95— 97. 附錄一: %語音信號時(shí)域頻域分析 [y,Fs,bits]=wavread(39。 y=y(:,1)。 halflength=floor(sigLength/2)。xlabel(39。 figure。)。 y=y(:,1)。 % sound(y,fs)。 title(39。 yf=abs(fft(y))。 %先將抽取后的值全設(shè)為零 for i=1:80:lg。 subplot(211)。)。 plot(yx,ycqf)。)。 x = reshape(x(1:frmsize*frmt),frmsize,frmt)。 % 換算成分貝 xFFTdB(xFFTdB+20) = +20。plot(x(1:frmsize*frmt))。 % 畫波形 subplot(2,1,2)。)。 subplot(211)。)。原始信號頻譜 39。fm39。 subplot(211)。)。調(diào)制后信號頻譜 39。 Y2=fft(y2,40000)。title(39。plot(abs(Y2))。 % sound(y2)。As=100。wp=2*fp/fs1。 x=filter(b,a,y2)。plot(x)。 subplot(212)。)。) specgram(x,240,8000,80)。 frameinc=80。 zcr2=5。 count=0。 signs=(temp1.*temp2)0。 %計(jì)算短時(shí)能量 %調(diào)整能量門限 amp1=min(amp1,max(amp)/4)。 for n=1:length(zcr)。 silence=0。 else %靜音狀態(tài) status=0。 else %語音將結(jié)束 silence=silence+1。 silence=0。 end end j=0。 end end j=1 for i=1:length(jiesu1)1 if((jiesu1(i+1)jiesu1(i))100)amp。zcr(i+1)) kaishi1(j)=i+1 j=j+1。 subplot(311) plot(x) axis([1 length(x) 1 1]) ylabel(39。color39。 line([x2*f
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1