freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于dsp(數(shù)字信號處理器)的語音信號處理系統(tǒng)設計-全文預覽

2024-12-31 15:12 上一頁面

下一頁面
  

【正文】 S k X k X k X k?? ? ? 式中*表示復共軛運算。為了完成實時運算可以采用先進的數(shù)字信號處理芯片、陣列處理芯片或專用 FFT 芯片。而 1N 一般取 25 512 或 1024,為了將 ()nxm的點數(shù)從 N 擴大力 1N ,可以采用補 0的辦法,在擴大的部分添若干個 14 0取樣值,然后再對添 0 后的序列進行 FFT。 它實際上是 ()jwnXe 在頻域的取樣,如下所示: 22 10( ) ( ) ( ) ( 0 1 )k k mNjjNNn n nmX e X k x m e k N?? ? ??? ? ? ? ?? (35) 在語音信號數(shù)字處理中,都是采用 ()nxm的離散博里葉變換 (DFT) ()nXk來替代()jwnXe 并且可以用高效的快速傅里葉變換 (FFT)算法完成由 ()nxm至 ()nXk的轉換。另外,窗的形狀也對短時 傅 氏頻譜有影響,如矩形窗,雖然頻率分辨率很高 (即主辯狹窄尖銳 ),但由于第一 旁瓣 的衰減很小,有較大的上下沖,采用矩形窗時求得的 ()jwnXe 與 ()jwXe 的偏差較大,這就是 Gibbs 效應,所以不適合用于 頻譜 成分很寬的語音分析中。 ()jwWe 相對于 ()jwXe 來說必須是 — 個沖激函數(shù)。設語音信號序列和窗口序列的標準傅 里立 葉變換均存在。這里,窗 w(nm)是一個“滑動的”窗口,它隨 n 的變化而沿著序列 X(n)滑動。從廣義上講,語音信號的頻域分析包括語音信號的頻譜、功率譜、倒頻譜、頻譜包絡分析等,而常用的頻域分析方法有帶通濾波器組法、傅里葉變換法、線 性 預測法等幾種。 如當弱摩擦音 (如 [f]、 [h]等音素 ),弱 爆 破音 (如 [p]、 [t]、 [k]等音素 )為語音的開頭或結尾;以鼻音 (如 [n]、 [m]等音素 )為語音的結尾時。 利用短時平均過零率還可以從背景噪聲中找出語音信號,可用于判斷寂靜無聲段和有聲段的起點和終點位置。 對語音信號進行分析,發(fā)現(xiàn)發(fā)濁音時,盡管聲道有若干個共振峰,但由于聲門波引起 功率 譜的 高頻跌落,所以其話音能量約集中在 3kHz 以下。過零率就是樣本改變符號的次數(shù)。③作為一種超音段信息,用于語音識別中。 設 第 n幀語 音信號 Xn(m)的短時能量用 En 表示,則其計算公式如下: 1 20 ()NnnmE x m???? En 是一個度量語音信號幅度值變化的函數(shù),但它有一 個缺陷,即它對高電平非常敏感 (因為它 計算時用的是信號的平方 )?!?4 只使用示波器等通用設備,使用較為簡單等。時域分析通常用于最基本的參數(shù)分析及應用,如語音的分割、預處理、大分類等。 本文將簡要介紹時域分析、頻域分析以及語譜圖分析。但是,由于不同的語音是由人的 口腔肌肉運動構成聲道某種形狀而產(chǎn)生的響應,而這種口腔肌肉運動相對于語音頻率來說是非常緩慢的,所以從另一方面看,雖然語音 信 號具有時變特性,但是在一個短時間范圍內(nèi) (一般認為在 10~ 30ms 的短時間內(nèi) ),其特性基本保持不變即相對穩(wěn)定,因 而 可以將其看作是一個準穩(wěn)態(tài)過程,即語音信號具有短時 平 穩(wěn)性。而且,語音合成的音質好壞,語音識別率的高低,也都取決于對語音信號分 析 的準確性和精確性。 在實際工作中,我們可以利用 windows 自 帶的錄音機錄制語音文件 ,圖 25是基于 PC 機 的語音信號 采集過程 ,聲卡可以完成語音波形的 A/D 轉換,獲得 WAVE文件,為后續(xù)的處理儲備原材料。具體振 動 值用舍入法歸到靠近的量化電平上。采樣頻率過低,采樣點間隔過遠,則離散信號不足以反映原有信號波形特征,無法使信號復原,造成信號混淆。 在采樣的過程中應注意采樣間隔的選擇和信號混淆:對模擬信號采樣首先要確定采樣間隔 。 采樣時必須要注意滿足 奈奎斯特定理 ,即采樣頻率 fs 必須 以高于受測信號的最高頻率兩倍以上的速度進行取樣,才能正確地重建波 形, 它是通過采樣脈沖和模擬信號相乘來實現(xiàn)的。這樣,預濾波器必須是一個帶通濾波器,設其上、下截止 頻 率分別是 fH 和 fL,則對于絕 大 多數(shù)語音編譯碼器,fH=3400Hz、 fL= 60~100Hz、采樣率為 fs= 8kHz;而對丁語音識別而言,當用于電話用戶時,指標與語音編譯碼器相同。在濁音段表現(xiàn)出周期信號的特征,在清音段表現(xiàn)出隨機噪聲的特征。第 4章是對語音信號的綜合和分析,包括語音信號的調(diào)制 、 疊加和濾波??梢哉f,數(shù)字信號處理是把許多經(jīng)典的理論體系作為自己的理論基礎,同時又使自己成為一系列新興學科的理論基礎。而數(shù)字信號處理的實現(xiàn)則是理論和應用之間的橋梁。 數(shù)字信號處理是利用計算機 或專用處理設備,以數(shù)字形式對信號進行采集、變換、濾波、估值、增強、壓縮、識別等處理,以得到符合人們需要的信號形式。另一方面,為了語音識別實用化的需要,講者自適應、聽覺模型、快速搜索識別算法以及進一步的語言模型的研究等課題倍受關注。由于美國貝爾實驗室的 Babiner 等人在 20世紀 80年代中期,對隱馬爾可夫模型深人 淺 出的介紹,才使世界各國從事語音信號處理的研究人員了解和熟悉,進而成為一個公認的研究熱點,也是目前語音識別等的主流研究途徑。因此, 20 世紀 80 年代開始出現(xiàn)的語音信號處理技術產(chǎn)品化的熱 潮 ,與上述語音信號處理新技術的推動作用是分不開的。歷時五年的龐大的 ARPA 研究計劃,雖然在語音理解、語言統(tǒng)計模型等方面的研究積累了一些經(jīng)驗,取得了許多成果,但沒能達到巨大投資應得的成果,在1976 年停了下來,進入 了 深刻的反省階段。 到了 1970 年,好似反駁 Pierce 的批評,單詞識別裝置開始了實用化階段,其后實用化的進程進一步高漲,實用機的生產(chǎn)銷售也上了軌道。 20世紀 60年代中期形成的一 系列數(shù)字信號處理方法和技術, 如 數(shù)字濾波器、快速博里葉變換 (FFT)等成為語音信號數(shù)字處理 的理論和技術基礎。 2 但是它的快速發(fā)展可以說是從 1940 年前后 Dudley 的聲碼器 (vocoder)和 potter等人的可見語音 ( Visible Speech)開始的。語音信號采集與分析 是以語音語言學和數(shù)字信號處理為基礎而形成的一門涉及面很廣的綜合性學科,與心理、生理學、計算機科學、通信與信息科學以及模式識別和人工智能等學科都有著非常密切的關系。 工業(yè)生產(chǎn)部門 的語聲控制,電話、電信系統(tǒng)的自動撥號、輔助控制與查詢以及醫(yī)療衛(wèi)生和福利事業(yè)的生活支援系統(tǒng)等各種實際應用領域相接軌,并且有望成為下一代操作系統(tǒng)和應用程序的用戶界面。 讓計算機能聽懂人類的語言,是人類自計算機誕生以來夢寐以求的想法。 聲音是人類常用的工具,是相互傳遞信息的最主要的手段。信號處理是 Matlab 重要應用的領域之一。 I 摘要 語音信號處理是研究用數(shù)字信號處理技術和語音學知識對語音信號進行處理的新興的學科,是目前發(fā)展最為迅速的信息科學研究領域的核心技術之一。 Matlab 語言是一種數(shù)據(jù)分析和處理功能十分強大的計算機應用軟件,它可以將聲音文件變換為離散的數(shù)據(jù)文 件,然后利用其強大的矩陣運算能力處理數(shù)據(jù),如數(shù)字濾波、傅里葉變換、時域和頻域分析、聲音回放以及各種圖的呈現(xiàn)等,它的信號處理與分析工具箱為語音信號分析提供了十分豐富的功能函數(shù),利用這些功能函數(shù)可以快捷而又方便地完成語音信號的處理和分析以及信號的可視化,使人機交互更加便捷。語言是人類持有的功能?,F(xiàn)在,人類已開始進入了信息化時代,用現(xiàn)代手段研究語音 信 號 ,使人們能更加有效地產(chǎn)生、傳輸、存儲、獲取和應用語音信息,這對于促進社會的發(fā)展具有十分重要的意義。它正在直接與辦公、交通、金融、公安、商業(yè)、 旅游等行業(yè)的語音咨詢與管理。 語音信號 采集與分析 之所以能夠那樣長期地、深深地吸引廣大科學工作者去不斷地對其進行研究和探討,除了它的實用性之外,另一個重要原因是,它始終與 當時信息科學中最活躍的前沿學科保持密切的 聯(lián)系, 并且一起發(fā)展。 國內(nèi)外研究現(xiàn)狀 語音信號 的采集與分析 作為一個重要的研究領域,已經(jīng)有很長的研究歷史。 20世紀 60年代 初 由于 Faut 和 Steven 的努力,奠定了 語 音生成理論的基礎,在此基礎上語音合成的研究得到了扎實的進展 。所以 1969 年美國貝爾研究所的 Pierce 感嘆地說“ 語音識別向何處去 ?” 。這個研究計劃不僅在美國園內(nèi),而且對世界各國都產(chǎn)生了很大的影響,它促進了連續(xù)語音識別研究的興起。從此矢量量化技術不僅在語音 識別、語音編碼和說話人識別等方面發(fā)揮了重要作用,而且很快推廣到其他許多領域。其理論基礎是 1970 年前后,由 Baum等 人 建立起來的,隨后,由美國卡內(nèi)基 梅 隆 大學 (CMU)的 Baker 和 美國 IBM 公司的Jelinek 等人將其應用到語音識別中。一方面,對聲學語音學統(tǒng)計模型的研究逐漸深入, 魯棒 的語音識別、基于語音段的建模方法及隱馬爾可夫模型 與人工 神 經(jīng)網(wǎng)絡的結合成為研究的熱點。在過去的二十多年時間里,數(shù)字信號處理已經(jīng)在通信等領域得到極為廣泛的應用。反過來,數(shù)字信號處理的應用又促進了數(shù)字信號處理理論的提高。近來新興的一些學科,如人工智能、模式識別、神經(jīng)網(wǎng)絡等,都與數(shù)字信號處理密不可分。第 3 章主要是對語音信號進行時域、頻域上的分析 ,如短時功率譜,短時能量,短時平均過零率,語譜圖分析等等。 ○ 2 在時域內(nèi),語音信號具有“短時性”的特點,即在總體上,語音信號的特征是隨著時間而變化的,但在一段較短的時間間隔內(nèi),語音信號保持平穩(wěn)。 ○ 2 抑制 50Hz 的電源工頻干擾。 采樣也稱抽樣,是信號在時間上的離散化,即按照一定時間間隔△ t 在模擬信號 x (t)上逐點采取其瞬時值。 7 0 1 2 3 4 5 6x 1 04 0 . 200 . 20 . 40 . 6抽取后的信號0 5000 10000 1500011 . 522 . 53 圖 24抽取后的信號時域波形圖和頻域波形圖 對上述信號進行 1/80 采樣頻率抽取,即 采樣頻率 變?yōu)閷⒔?500Hz 時,由于采樣頻率比較小,所以采樣點數(shù)就稀疏,所得離散信號就越偏離于原信號,頻譜也發(fā)生了混疊。但過高的采樣頻率并不可取,對固定長度( T)的信號,采集到過大的數(shù)據(jù)量( N=T/△ t),給計算機增加不必要的計算工作量和存儲空間;若數(shù)據(jù)量( N)限定,則采樣時間過短,會導致一些數(shù)據(jù)信息被排斥在外。量化電平按級數(shù)變化,實際的振動值是連續(xù)的物理量。市面上購買到的普通聲卡在這方面做的都很好,語音聲波通過話筒輸入到聲卡后直接獲得的是經(jīng)過防混疊濾波、 A/D 變換、量化處理的離 8 散的數(shù)字信號。 Windows 自帶的錄音機 聲音 麥克風 聲卡 濾波 采樣 A/D 轉換 Wav 9 3 語音信號的分析 語音信號分析是語音信號處理的前提和基礎,只有分析出可表示語音信號本質特征的參數(shù),才有可能利用這些參數(shù)進行高效的語音通信、語音合成和語音識別等處理。因為,語音信號從整體來看其特性及表征其本質特征的參數(shù)均是隨時間而變化的,所以它是一個非 平 穩(wěn)態(tài)過程,不能用處理 平 穩(wěn)信號的數(shù)字信號處理技術對其進行分析處理。 根據(jù)所分析出的參數(shù)的性質的不同,可將語音信號分析分為時域分析 、頻域分析、倒 頻 域分析等; 時域分析方法具有簡單、計算量小、物理意義明確等優(yōu)點,但由于語音信號最重要的感知特性反映在功率譜中,而相位變化只起著很小的作用,所以相對于時域分析來說頻域分析更為重要。語音信號本身就是時域信號,因而時域分析是最 早使用,也是應用最廣泛的一種分析方法,這種方法直接利用語音信號的時域波形。 ○ 3 可以得到語音的一些重要的參數(shù)。 短時能量及短時平均幅度分析 設語音波形時域信號為 x(l)、加密分幀處理后得到的第 n幀語音信號為 Xn(m),則 Xn(m)滿足下式: ( ) ( ) ( ) ( )nx m w m x n m m?? 01mN? ? ? 1 0 ~ ( 1)( ) { mNmwm ???? , 0, 其 他 值 其中, n= 0, 1T, 2T,?,并且 N為幀長, T為幀移長度。 ② 可以用來區(qū)分聲母與韻母的分界,無聲與有聲 的分界,連字 (指字之間無間隙 )的分界等。對于連續(xù)語音信號,過零即意味著時域波形通過時間軸;而對于離散信號,如果相鄰的取樣值改變符號則稱為過零。對于后一個問題除了可以采用低直流漂移器件外, 也 可以在軟件上加以解決,這就是算出每一 幀的直流分 量 并予以濾除 。當然,這種高低僅是相對而言,并沒 有 精確的數(shù)值關系。但是研究表明,在以某些音為開始或結尾時。
點擊復制文檔內(nèi)容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1