freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)論文基于dsp音視頻矩陣控制的研究與實(shí)現(xiàn)-預(yù)覽頁

2025-08-16 15:12 上一頁面

下一頁面
 

【正文】 □ 良 □ 中 □ 及格 □ 不及格 (在所選等級前的□內(nèi)畫“√”) 教研室主任(或答辯小組組長): (簽名) 年 月 日 教學(xué)系意見: 系主任: (簽名) 年 月 日 第 1章 緒論 課題研究的目的和意義 音視頻矩陣概述 音視頻矩陣在系統(tǒng)中介于 音 視頻源與顯示或復(fù)用終端之間,負(fù)責(zé)將不同的音視頻信號按用戶的選擇進(jìn)行集中調(diào)控。本人完全意識到本聲明的法律后果由本人承擔(dān)。 作 者 簽 名: 日 期: 指導(dǎo)教師簽名: 日 期: 使用授權(quán)說明 本人完全了解 大學(xué)關(guān)于收集、 保存、使用畢業(yè)設(shè)計(jì)(論文)的規(guī)定,即:按照學(xué)校要求提交畢業(yè)設(shè)計(jì)(論文)的印刷本和電子版本;學(xué)校有權(quán)保存畢業(yè)設(shè)計(jì)(論文)的印刷本和電子版,并提供目錄檢索與閱覽服務(wù);學(xué)??梢圆捎糜坝 ⒖s印、數(shù)字化或其它復(fù)制手段保存論文;在不以贏利為目的前提下,學(xué)??梢怨颊撐牡牟糠只蛉績?nèi)容。 致謝 .............................................................................................. 錯(cuò)誤 !未定義書簽。 I 摘要 ............................................................................................. 錯(cuò)誤 !未定義書簽。 攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文 .......................................... 錯(cuò)誤 !未定義書簽。對本研究提供過幫助和做出過貢獻(xiàn)的個(gè)人或集體,均已在文中作了明確的說明并表示了謝意。對本文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。 涉密論文按學(xué)校規(guī)定處理。根據(jù)使用的需要,也可以在不同的顯示終端上同時(shí)顯示相同或不同的視頻源內(nèi)容可以做到音頻和視頻同步或者不同步 。語音技術(shù)和數(shù)字信號處理技術(shù)的不斷發(fā)展使矩陣控制從模擬技術(shù)向數(shù)字技術(shù)發(fā)展,數(shù)字化網(wǎng)絡(luò)化成為信號處理的必然趨勢。一個(gè)完整的語音識別系統(tǒng)可大致分為四部分:語音信號預(yù)處理,語音特征提取,聲學(xué)模型與模式匹配,語言模型與語言處理。如圖 11 所示 [3]。 因此,這種開始 /結(jié)束的判定尤為重要 。 對非語音信號的識別不僅是一種資源浪費(fèi),而且有可能改變對話的狀態(tài),造成對用戶的困擾 。在科研領(lǐng)域,如 3G 手機(jī)等通訊產(chǎn)品的研發(fā)上,這一技術(shù)是不容回避的問題,要求在不影響接收語音信號質(zhì)量的前提下,盡可能地降低靜音段的數(shù)據(jù)傳輸率,此時(shí)精確的端點(diǎn)檢測就非常必要。下面 是語音 端點(diǎn)檢測 近幾年 研究的發(fā)展介紹。 1998 年 Hongtao Hu 應(yīng)用小波變換的技術(shù)進(jìn)行語音端點(diǎn)檢測,在降低計(jì)算量的同時(shí)提高了算法的性能。 20xx 年 Shin 等人提出的廣義伽瑪分布提供了一個(gè)比高斯、拉普拉斯和伽瑪分布更好的純凈語音譜的模型。將帶噪語音映射到噪聲特征空間。 除了 上述 幾種方法外,近些年來,還有短時(shí)分形維數(shù)的帶噪聲語音信號端點(diǎn)檢測方法;應(yīng)用倒譜系數(shù)作為判決特征的帶噪語音端點(diǎn)檢測方法,它包括應(yīng)用倒譜距離測量軌跡和應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)的方法。 數(shù)字信號處理器 (DSP)的發(fā)展?fàn)顩r DSP(Digital Signal Processing)是一種具有特殊結(jié)構(gòu)的微處理器,是建立在數(shù)字信號處理的各種理論和算法基礎(chǔ)上,專門完成各種實(shí)時(shí)數(shù)字信息處理的芯片。在 DSP 出現(xiàn)之前數(shù)字信號處理主要依靠 MPU( 微處理器 ) 來完成。 DSP 芯片的問世是個(gè)里程碑,它標(biāo)志 著 DSP 應(yīng)用系統(tǒng)由大型系統(tǒng)向小型化邁進(jìn)了一大步。以 DSP 作為主要元件,再加上外圍設(shè)備和特定功能單元綜合成的單一芯片,加速了 DSP 解決方案 (DSP Solution)的發(fā)展,同時(shí)產(chǎn)品價(jià)格降低,運(yùn) 算速度和集成度大幅提高 [7]。這樣的芯片通常稱之為MVP( 多媒體視頻處理器 ) 。 作為 DSP 業(yè)界公認(rèn)的龍頭, TI 一直在技術(shù)上獨(dú)領(lǐng)風(fēng)騷,為 適應(yīng) 不同領(lǐng)域提供了不同的解決方案。大小都是 64K,總共是 192K 大小。 DARAM 總是被映射到數(shù)據(jù)存儲空間上,也可被映射進(jìn)程序存儲空間用于保存程序代碼。 本論文主要把語音端點(diǎn)檢測的算法應(yīng)用到實(shí)際的音視頻矩陣控制系統(tǒng)中,借住了 TI 公司的數(shù)字信號處理器 TMS320C5402 利用語音端點(diǎn)檢測的算法實(shí)現(xiàn)音視頻矩陣的智能控制,符合了音視頻 矩陣控制的發(fā)展現(xiàn)狀。 3.掌握 DSP 開發(fā)板的工作原理、硬件結(jié)構(gòu), 以 TMS320C5402 為核心設(shè)計(jì)硬件電路。計(jì)算機(jī)合成的語音音質(zhì)的好壞,計(jì)算機(jī)語音識別率的高低,都取決于計(jì)算機(jī)語音分析工作質(zhì)量的高低。例如, 20 世紀(jì) 40 年代,貝爾電話實(shí)驗(yàn)室的研究人員就對語音分析做了大量、細(xì)微且卓有成效的工作,這些工作的成果推動(dòng)了計(jì)算機(jī)語音處理的發(fā)展。各種電信號可以記錄成時(shí)域波形,人體的生物電 ( 如腦電、心電等 ) 也可以記錄成時(shí)域波形。 3. 用時(shí)域語音信號進(jìn)行一些數(shù)字處理,可以得到語音信號的一些重要特征參數(shù),為分析語音信號提供了有用的基礎(chǔ) 。語音信號的頻域分析包含有語音信號的頻譜、功率譜、倒頻譜、頻譜包絡(luò)、短時(shí)間頻譜等。 2. 語音信號的頻譜具有非常明顯的聲學(xué)概念,利用頻譜分析獲得的語音特征具有實(shí)際的物理意義 。 20 世紀(jì) 40 年代已經(jīng)研制成功了語譜儀,將它用于語音分析做出的圖叫語譜圖。這一點(diǎn)是優(yōu)于前兩種分析方法的 。與不同的人有不同的指紋類似,不同講話者的語譜圖有不同的聲紋,據(jù)此可以用于識別講話者的身份。通過大量的文獻(xiàn)調(diào)研與實(shí)際研究發(fā)現(xiàn),現(xiàn)有的各種語音 10 信號端點(diǎn)檢測技術(shù)都存在各自的不足,比如基于自相關(guān)相似距離的語音信號端點(diǎn)檢測方法,總的來說它與 HMM 方法的效果大致相同,但是對于結(jié)尾的判斷卻優(yōu)于 HMM 模型,這是因?yàn)檎Z音大多以濁音結(jié)尾,此時(shí)自相關(guān)法的判斷精度較高,但是對于清音開頭的語音,尤其是 [s], [ks], [n]等音節(jié),自相關(guān)算法的檢測精度就不高。另外,全世界有近百種官方語言,每種語言有多達(dá)幾十種方言,同種語言的不同方 言 在語音上相差懸殊,這樣,隨著語言環(huán)境的改變,系統(tǒng)性能也會變得很差。 3.對于一些能量較低的爆破音、鼻音,如: ///,//,//,//,/ shstthf 等,與噪聲相混合容易造成誤判而截去這些音節(jié)的有效成分,對識別結(jié)果造成影響。 小波分析的基本理論 小波變換 (Wavelet Transform)是八十年代后期發(fā)展起來的應(yīng)用數(shù)學(xué)分支,在理論上構(gòu)成較系統(tǒng)的構(gòu)架主要是法國數(shù)學(xué)家 Y. Meyer、 地質(zhì)物理學(xué)家 J . Morlet 和 理論 物 理學(xué) 家 A . Grossman 的 貢 獻(xiàn) 。小波的基本思想是通過伸縮平移一組小范圍的基,使其時(shí)頻域窗口均隨頻率的變化而變化,以實(shí)現(xiàn)對低頻分量采用大視窗分析,對高頻分量采用小視窗分析 [10]。例如 Gabor 在 1946 年提出的 Gabor 變換, Burt 在 1982 年提出的金字塔式圖像壓縮編碼概念,通信及語言處理中的子帶編碼 (subband coding),數(shù)字信號處理中的多采樣濾波器組 (multirate sampling filterbank),計(jì)算機(jī)視覺中的多分辨率分析等。它在語音信號處理方面的潛力己經(jīng)得到確認(rèn)。 ? ? ? ? ? ? ? ?,1,f R tW T f t d t f t t???? ? ? ??? ? ?????????? (21) 式中 0?? 是尺度因子, ? 反映位移,其值可正可負(fù)。 由以上定義,我們可以看出小波變換和傅立葉變換一 樣,也是一種積分變換, ? ?,fWT??為小波變換系數(shù)。 從 小波 分析 ??, t??? 的角度看, ??, t??? 是一族超完備基函數(shù),它們 之間是線性相關(guān)的,度量冗余度的量稱為再生核 [12]如式 (23), 它反映了小波變換的冗余性。 ? ? ? ? ? ?? ? ? ?00000 0 , ,000,1, , ,1 1 11 ,RRRK t t d tCttdtCttC? ? ? ???? ? ? ??? ? ? ? ? ???????????????????? ?????? ?????? (25) 式中 K 是小波 ??, t??? 與 ??00, t???的 內(nèi)積,反映了兩者的相關(guān)程度。目前通行的辦法是對尺度進(jìn)行冪數(shù)級離散化,即令?取 0 , 0,m mZ? ? ?? ? ?,此時(shí)對應(yīng)的小波函數(shù) 如式 (26)所示 。所以每當(dāng) m 增加 l 時(shí),尺度 ? 增加一倍,對應(yīng)的頻率減小一半,可見采樣率可以降低一半而不致引起信息的丟失 ( 帶通信號的采樣率決定于其帶寬,而不是決定于其頻率上限 ) 。 ? ? ? ? ? ?0000 , 0 , 1 , 2 , ,jjf kW T k f t t d t j k Z??? ? ? ??? ? ??? ?? (28) 14 在實(shí)際中,我們一般取 0 2?? ,這時(shí) 121, 2 , 2 , 2 j? ? ???。每級逼近都是用某一低通平滑函數(shù) ??t? 對 ??ft做平滑 的結(jié)果,在逐級逼近時(shí)平滑函數(shù) ??t? 也做逐級伸縮,這就是“多分辨率”,即用不 同 分辨率來逐級逼近待分析函數(shù) ??ft??臻g剖分是完整的,即當(dāng) k??? 時(shí), ? ?2jV L R? ,包含整個(gè)平面 可積的實(shí)變函數(shù)空間。 函數(shù)的時(shí)移不改變其所屬空間 , 即如果 ?? jf t V? 則 有式 (213)。這種算 法根據(jù)高斯白噪聲在小波變換域內(nèi)各個(gè)子帶的平均能量變化平緩的特點(diǎn) 來 判別語音段和噪聲段。信號在傳播過程中會被各種加性噪聲所干擾,加性噪聲雖然獨(dú)立于有用信號,但它卻始終干擾有用信號,因而不可避免地對語音信號造成危害。雖然消除這些噪聲不一定很容易,但至少在原理上可消除或基本消除。隨機(jī)過程的統(tǒng)計(jì)特性是通過它的概率分布或數(shù)字特征加以表述的。 17 ? ? ? ?, ,i i i i i iiF x t f x tx? ?? (216) 在一般情況下用一維分布函數(shù)去描述隨機(jī)過程的完整統(tǒng)計(jì)特性是極不充分的,通常需要在足夠多的時(shí)刻上考慮隨機(jī)過程的多維分布函數(shù)。 , , , , , 。也就是說,如果對于任意的正整數(shù) n 和任意實(shí)數(shù) 12,nt t t??? , ? ,隨機(jī)過程??t? 的 n 維概率密度函數(shù)滿足 式 (218), 則稱 ??t? 是平穩(wěn)隨機(jī)過程。 , ,n n n n n nf x x x t t t f x x x t t t? ? ?? ? ? ? ?? ? ? ? ? ? ? ? ?? ? (218) 隨機(jī)噪聲中的起伏噪聲是熱噪聲,散彈噪聲以及宇宙噪聲為代表的噪聲。所謂高斯過程 ??t? ,即指定它的任意 n 維 ? ?1,2,n? ??? 概率密度 如 式 (219)所示 。 ? ? ? ?? ?j j k kjk jkE X t X tb ?????? ????????? (222) 由上式可以看出,由于正態(tài)隨機(jī)過程的 n 維分布僅由各隨機(jī)變量的數(shù)學(xué)期望、方差和兩兩之間的歸一化協(xié)方差函數(shù)所決定 [16]。由高斯白噪聲特點(diǎn)可知,該噪聲在相當(dāng)寬的頻率范圍內(nèi)具有平坦的功率譜密度。這就為我們進(jìn)行端點(diǎn)檢測提供了可行的方法。語音的幅頻特性 如 圖 26 所示 。小波 ??t? 和尺度函數(shù) ??t? 中的支撐區(qū) [17]為 21N? , ??t? 的消失矩為 0N( 除 1N? 外 ) , dbN不具有對稱性 ( 即非線性相位 ) 。 2. 算法原理 。而噪聲在各個(gè)子帶內(nèi)的平均能量分布均勻。 21 11 M miimEEM ?? ? (225) 式中 M 表示小波層數(shù)。 根據(jù)式 (26),選取 db3作為小波基函數(shù)對待測信號 ??xt? 進(jìn)行四層小波變換,得到小波系數(shù) ? ?1, 2, , 5mksm? ???。 在 Windows操作系統(tǒng)下使用 MATLAB進(jìn)行算法仿真,仿真成功后 編程 實(shí)現(xiàn)。語音采樣后進(jìn)行分幀處理,幀長為 20ms , 220個(gè)點(diǎn),幀移 10ms , 110 個(gè)點(diǎn)。而高頻子帶中, m 值從小到大頻率依次降低。每當(dāng)信號從語音段進(jìn)入噪聲段時(shí),重新取三幀語音的參數(shù) ? ?2i? 的平均值作為閾值。 6. 對所得的結(jié)果與標(biāo)準(zhǔn)結(jié)果進(jìn)行比較以得到檢測率。從表中結(jié)果可以看出子帶平均能量方差的算法不僅在安靜的環(huán)境下有較好的識別率,在加入噪音后 ( 實(shí)驗(yàn)中采用含有高斯白噪聲且信噪比 15db, 10db, 0db的語音數(shù)據(jù) ) 系統(tǒng)識別率下降很少,充分說明這種特 24 征有很好的抗噪性。根據(jù)這一特性,可知對處理的語音信號進(jìn)行小波變換,每一小波子帶內(nèi)的小波系數(shù)也必有相同的統(tǒng)計(jì)特性
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1