freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)論文基于dsp音視頻矩陣控制的研究與實現(xiàn)-在線瀏覽

2024-09-18 15:12本頁面
  

【正文】 .. 46 McBSP 控制寄存器 ................................................................................ 46 TLC320AD50C 的控制寄存器 ............................................................... 48 McBSP 模塊驅(qū)動程序 ............................................................................ 48 端點檢測的實現(xiàn) ............................................................................................. 50 本章小結(jié) ......................................................................................................... 50 結(jié)論 ............................................................................................................................ 51 參考文獻(xiàn) ...................................................................................... 錯誤 !未定義書簽。 I 摘要 ............................................................................................. 錯誤 !未定義書簽。 Abstract ....................................................................................... 錯誤 !未定義書簽。 攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文 .......................................... 錯誤 !未定義書簽。 畢業(yè)設(shè)計(論文)原創(chuàng)性聲明和使用授權(quán)說明 原創(chuàng)性聲明 本人鄭重承諾:所呈交的畢業(yè)設(shè)計(論文),是我個 人在指導(dǎo)教師的指導(dǎo)下進(jìn)行的研究工作及取得的成果。對本研究提供過幫助和做出過貢獻(xiàn)的個人或集體,均已在文中作了明確的說明并表示了謝意。 作者簽名: 日 期: 學(xué)位論文原創(chuàng)性聲明 本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨立進(jìn)行研究所取得的研究成果。對本文的研究做出重要貢獻(xiàn)的個人和集體,均已在文中以明確方式標(biāo)明。 作者簽名: 日期: 年 月 日 學(xué)位論文版權(quán)使用授權(quán)書 本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。 涉密論文按學(xué)校規(guī)定處理。最簡單的模擬音頻矩陣系統(tǒng)是利用電子開關(guān),來實現(xiàn)輸入與輸出的連接。根據(jù)使用的需要,也可以在不同的顯示終端上同時顯示相同或不同的視頻源內(nèi)容可以做到音頻和視頻同步或者不同步 。但是 傳統(tǒng)音視頻 矩陣的功能單一,也不具備擴展功能 。語音技術(shù)和數(shù)字信號處理技術(shù)的不斷發(fā)展使矩陣控制從模擬技術(shù)向數(shù)字技術(shù)發(fā)展,數(shù)字化網(wǎng)絡(luò)化成為信號處理的必然趨勢。 語音端點檢測檢測的作用 語音端點檢測 (Endpoint Detection) ,也被稱為語音活躍檢測 ( Voice Activity Detection,簡稱 VAD) ,主要應(yīng)用在語音處理中的語音編解碼,語音識別、語音增強及語音監(jiān)控等領(lǐng)域 [2]。一個完整的語音識別系統(tǒng)可大致分為四部分:語音信號預(yù)處理,語音特征提取,聲學(xué)模型與模式匹配,語言模型與語言處理。一般的信號流都存在一定的背景聲,而語音 識別的模型都是基于語音信號訓(xùn)練的,語音信號和語音模型進(jìn)行模式匹配才有意義。如圖 11 所示 [3]。 2. 在信號流中檢測到語音信號后,判斷此處是否是語句的開始或結(jié)束點 。 因此,這種開始 /結(jié)束的判定尤為重要 。 可以大量減少信號傳輸量及識別器的運算負(fù)載,對于語音對話的實時識別有重要作用 。 對非語音信號的識別不僅是一種資源浪費,而且有可能改變對話的狀態(tài),造成對用戶的困擾 。 在端點檢測找到語音的起始點時,系統(tǒng)將停止提示音的播放 , 完成打斷功能 。在科研領(lǐng)域,如 3G 手機等通訊產(chǎn)品的研發(fā)上,這一技術(shù)是不容回避的問題,要求在不影響接收語音信號質(zhì)量的前提下,盡可能地降低靜音段的數(shù)據(jù)傳輸率,此時精確的端點檢測就非常必要。由此可見,語音端點檢測技術(shù)己經(jīng)成為語音信號處理領(lǐng)域的重要課題之一,具有重要的理論研究價值和廣闊的應(yīng)用前景。下面 是語音 端點檢測 近幾年 研究的發(fā)展介紹。對于每個語音幀,計算其較為重要的 8 個參數(shù):歸一化的短時低通能量、歸一化的短時 高通能量、過零率、低頻帶的一階、二階反射系數(shù)、前向后向匹配相關(guān)系數(shù)及它們的乘積。 1998 年 Hongtao Hu 應(yīng)用小波變換的技術(shù)進(jìn)行語音端點檢測,在降低計算量的同時提高了算法的性能。他們采用在離散傅立葉變換 (DFT)系數(shù)域的統(tǒng)計模型,噪聲環(huán)境下的語音和噪聲譜分布均假設(shè)為聯(lián)合高斯分布。 20xx 年 Shin 等人提出的廣義伽瑪分布提供了一個比高斯、拉普拉斯和伽瑪分布更好的純凈語音譜的模型。 語音與噪音 在能量域 通常 有不同的分布,如果我們能分清含有低功率噪音和高功率語音的成分,即使帶噪語音的平均信噪比很低,我們也有可能提取更多可靠的語音信息。將帶噪語音映射到噪聲特征空間。與規(guī)模較小的特征值。 除了 上述 幾種方法外,近些年來,還有短時分形維數(shù)的帶噪聲語音信號端點檢測方法;應(yīng)用倒譜系數(shù)作為判決特征的帶噪語音端點檢測方法,它包括應(yīng)用倒譜距離測量軌跡和應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)的方法?;?HMM 模型的檢測方法也是語音信號端點檢測中的重要方法,用 viterbi 解碼算法對待測信號進(jìn)行分解,求出語音的哪些語音幀與模型相匹配,從而得出端點所在處。 數(shù)字信號處理器 (DSP)的發(fā)展?fàn)顩r DSP(Digital Signal Processing)是一種具有特殊結(jié)構(gòu)的微處理器,是建立在數(shù)字信號處理的各種理論和算法基礎(chǔ)上,專門完成各種實時數(shù)字信息處理的芯片。芯片內(nèi)部采用程序和數(shù)據(jù)分開的哈佛結(jié)構(gòu) ,具有專門的硬件乘法器,廣泛采用流水線操作,具有良好的并行特性,提供特殊的 DSP 指令,可以快速地實現(xiàn)各種數(shù)字信號處理算法 。在 DSP 出現(xiàn)之前數(shù)字信號處理主要依靠 MPU( 微處理器 ) 來完成。因此,直到 70 年代,有人才提出了 DSP 的理論和算法基礎(chǔ)。 DSP 芯片的問世是個里程碑,它標(biāo)志 著 DSP 應(yīng)用系統(tǒng)由大型系統(tǒng)向小型化邁進(jìn)了一大步。進(jìn)入 80 年代后期,隨著數(shù)字信號處理技術(shù)應(yīng)用范圍的擴大,要求提高處理速度,到 1988 年出現(xiàn)了浮點 DSP,同時提供了高級語言的編譯器,使運算速度進(jìn)一步提高,其應(yīng)用范圍逐步擴大到通信、計算機領(lǐng)域。以 DSP 作為主要元件,再加上外圍設(shè)備和特定功能單元綜合成的單一芯片,加速了 DSP 解決方案 (DSP Solution)的發(fā)展,同時產(chǎn)品價格降低,運 算速度和集成度大幅提高 [7]。當(dāng)前的 DSP 多數(shù)基于 RISC( 精簡指令集計算機 ) 結(jié)構(gòu),且進(jìn)入了 VLSI( 超大規(guī)模集成電路 ) 階段。這樣的芯片通常稱之為MVP( 多媒體視頻處理器 ) 。而第六代 TMSC6000 系列則是目前速度最快,性能最高的 DSP 芯片,該系列芯片的發(fā)展 中有高至 5000MIPS, 3G FLOPS 的處理性能。 作為 DSP 業(yè)界公認(rèn)的龍頭, TI 一直在技術(shù)上獨領(lǐng)風(fēng)騷,為 適應(yīng) 不同領(lǐng)域提供了不同的解決方案。其中 C54xx 以其低廉的價格,低功耗和高性能等 特點被廣泛應(yīng)用到通信和個人消費電子領(lǐng)域。大小都是 64K,總共是 192K 大小。其中, TMS320C5402 所 采 用的 RAM 是 雙 存 取訪 問 RAM (DARAM)。 DARAM 總是被映射到數(shù)據(jù)存儲空間上,也可被映射進(jìn)程序存儲空間用于保存程序代碼。所以, TMS320C5402 是 54系列芯片的典型代表。 本論文主要把語音端點檢測的算法應(yīng)用到實際的音視頻矩陣控制系統(tǒng)中,借住了 TI 公司的數(shù)字信號處理器 TMS320C5402 利用語音端點檢測的算法實現(xiàn)音視頻矩陣的智能控制,符合了音視頻 矩陣控制的發(fā)展現(xiàn)狀。本文主要研究音頻信號的處理,對視頻信號只用做控制和傳輸。 3.掌握 DSP 開發(fā)板的工作原理、硬件結(jié)構(gòu), 以 TMS320C5402 為核心設(shè)計硬件電路。 5.優(yōu)化系統(tǒng),對軟硬件進(jìn)行合理配置,提高系統(tǒng)性能。計算機合成的語音音質(zhì)的好壞,計算機語音識別率的高低,都取決于計算機語音分析工作質(zhì)量的高低。因此,可以先對語音做頻譜分析,得到提高語音識別率的有用數(shù)據(jù),并據(jù)此來設(shè)計計算機語音識別系統(tǒng)的硬件和軟件。例如, 20 世紀(jì) 40 年代,貝爾電話實驗室的研究人員就對語音分析做了大量、細(xì)微且卓有成效的工作,這些工作的成果推動了計算機語音處理的發(fā)展。這 3 種方法分別由對應(yīng)的圖來表示:時域分析對應(yīng)時域波形圖 、 頻譜分析對應(yīng)頻域波形圖 、語譜分析則對應(yīng)語譜圖。各種電信號可以記錄成時域波形,人體的生物電 ( 如腦電、心電等 ) 也可以記錄成時域波形。 時域分析法的特點是: 1. 用時域波形表示的語音信號比較直觀,清晰易懂 。 3. 用時域語音信號進(jìn)行一些數(shù)字處理,可以得到語音信號的一些重要特征參數(shù),為分析語音信號提供了有用的基礎(chǔ) 。 音頻時域波形圖如圖 21 所示 。語音信號的頻域分析包含有語音信號的頻譜、功率譜、倒頻譜、頻譜包絡(luò)、短時間頻譜等。與上文時域圖相對應(yīng)的一幅頻譜圖如圖 22 所示。 2. 語音信號的頻譜具有非常明顯的聲學(xué)概念,利用頻譜分析獲得的語音特征具有實際的物理意義 。 4. 頻域分析要用到 FFT 變換等,有時會需要專門的硬件工具 。 20 世紀(jì) 40 年代已經(jīng)研制成功了語譜儀,將它用于語音分析做出的圖叫語譜圖。語譜圖提供有關(guān)不同時間不同頻率的相對音強的有價值信息,可以在二個維度 ( 時間及頻率 ) 上表示出音強的關(guān)系。這一點是優(yōu)于前兩種分析方法的 。 3. 從語譜圖上還可以得到能量隨語音發(fā)生過程 ( 時間 ) 的變化情況,由此可以區(qū)別濁音及清音、輔音 ( 或聲母 ) 等的不同種類。與不同的人有不同的指紋類似,不同講話者的語譜圖有不同的聲紋,據(jù)此可以用于識別講話者的身份。對于語譜分析方法,目前在語音端點檢測的方法中應(yīng)用還有待進(jìn)一步的研究。通過大量的文獻(xiàn)調(diào)研與實際研究發(fā)現(xiàn),現(xiàn)有的各種語音 10 信號端點檢測技術(shù)都存在各自的不足,比如基于自相關(guān)相似距離的語音信號端點檢測方法,總的來說它與 HMM 方法的效果大致相同,但是對于結(jié)尾的判斷卻優(yōu)于 HMM 模型,這是因為語音大多以濁音結(jié)尾,此時自相關(guān)法的判斷精度較高,但是對于清音開頭的語音,尤其是 [s], [ks], [n]等音節(jié),自相關(guān)算法的檢測精度就不高。 表 21 各類方法優(yōu)缺點比較 Table 21 The camparison of characteristic of several methods 方法 優(yōu)點 缺點 短時平均過零率 較簡單 難以識別弱爆破音、摩擦音、 末尾的鼻音拖長的元音等 短時能量或平均幅度 較簡單 弱摩擦音與結(jié)尾時的鼻音易和 噪聲混淆 HMM 較準(zhǔn)確 需要事先訓(xùn)練 雙門限比較法 有效區(qū)分語音信號中的 濁音和噪聲 難以區(qū)分清音和噪聲 自相關(guān)相似距離 對濁音的檢測精度較高 對開端的清音檢測精度不夠 頻帶方差 較準(zhǔn)確 在脈沖干擾下門限值需要 測定 盡管語音端點檢測的研究工作迄今已近幾十年,取 得了輝煌的成就,但是現(xiàn)有的語音識別系統(tǒng)還面臨著許多困難,具體表現(xiàn)在以下幾個方面: 1.語音端點檢測算法的適應(yīng)性差。另外,全世界有近百種官方語言,每種語言有多達(dá)幾十種方言,同種語言的不同方 言 在語音上相差懸殊,這樣,隨著語言環(huán)境的改變,系統(tǒng)性能也會變得很差。由于語音數(shù)據(jù)大部分都是在接近理想的條件下采集的,語音一般都要在高保真設(shè)備上錄制語音,尤其要在無噪環(huán)境下錄音。 3.對于一些能量較低的爆破音、鼻音,如: ///,//,//,//,/ shstthf 等,與噪聲相混合容易造成誤判而截去這些音節(jié)的有效成分,對識別結(jié)果造成影響。 基于上述提到的噪聲和適應(yīng)性 等 問題,論文在研究了兩種基于小波的語音端點檢測算法的基礎(chǔ) 上 , 采用了 綜合 兩種算法的方 法 來解決 以上 問題。 小波分析的基本理論 小波變換 (Wavelet Transform)是八十年代后期發(fā)展起來的應(yīng)用數(shù)學(xué)分支,在理論上構(gòu)成較系統(tǒng)的構(gòu)架主要是法國數(shù)學(xué)家 Y. Meyer、 地質(zhì)物理學(xué)家 J . Morlet 和 理論 物 理學(xué) 家 A . Grossman 的 貢 獻(xiàn) 。 Mallat 提出的多分辨率分析 (multiresolotion alysis, MRA)的思想,使小波的構(gòu)造趨于規(guī)范。小波的基本思
點擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1