freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于聲紋的說話人特征識(shí)別畢業(yè)論文(留存版)

2024-09-07 15:07上一頁面

下一頁面
  

【正文】 ............................................................................ 29 Matlab 中實(shí)現(xiàn) MFCC 的提取 ........................................................ 31 基音周期的提取 ........................................................................................... 33 基音周期的介紹 ................................................................................. 33 短時(shí)自相關(guān)函數(shù) ................................................................................. 34 MATLAB 中實(shí)現(xiàn)基音周期的提取 ................................................ 35 第四章 說話人識(shí)別系統(tǒng)的實(shí)現(xiàn) ................................................................................ 36 實(shí)驗(yàn)實(shí)現(xiàn)的環(huán)境 ........................................................................................... 36 WAV 聲音文件格式分析 ........................................................................... 36 實(shí)驗(yàn)平臺(tái)的選擇 ............................................................................................ 37 錄音 ................................................................................................................ 37 預(yù)處理和端點(diǎn)檢測(cè) ....................................................................................... 37 實(shí)驗(yàn)所用語音庫的建立 ................................................................................ 38 系統(tǒng)實(shí)驗(yàn)框圖和步驟 ................................................................................... 39 實(shí)驗(yàn)結(jié)果和分析 ............................................................................................ 41 實(shí)驗(yàn)結(jié)果 ............................................................................................. 41 結(jié)果分析 ............................................................................................ 46 小結(jié) ............................................................................................................... 46 參考文獻(xiàn) ...................................................................................................................... 47 附 錄 .......................................................................................................................... 48 致 謝 .......................................................................................................................... 62 九江學(xué)院學(xué)士學(xué)位論文 1 引 言 語音是人類交流信息的基本手段。例如,利用線性預(yù)測(cè)分析來進(jìn)行語音合成,其先決條件是要先用線性預(yù)測(cè)方法分析語音庫,如果線性預(yù)測(cè)分析獲得的語音參數(shù)較好,則用此參數(shù)合成的 語音音質(zhì)就好。這就使得每個(gè)人的語 音聲學(xué)特征既有相對(duì)穩(wěn)定性,又有變異性,不是絕對(duì)、一成不變的。 說話人識(shí)別應(yīng)用領(lǐng)域 由于與其他生物識(shí)別技術(shù)相比,說話人識(shí)別技術(shù)具有不可遺忘和忘記、不需記憶、使用方便等優(yōu)點(diǎn),同時(shí)說話人識(shí)別還具有更為準(zhǔn)確、經(jīng)濟(jì)及可擴(kuò)展性良好等眾多優(yōu)勢(shì),因 此,說話人識(shí)別技術(shù)在以下許多方面得到廣泛應(yīng)用。此外,與其他生物認(rèn)證技術(shù)相比,說話人識(shí)別技術(shù)還有以下幾個(gè)方面的優(yōu)勢(shì): ( 1) 用戶 接受程度高 —— 以說話人的聲音作為特征進(jìn)行識(shí)別,用戶不需要記住復(fù)雜、繁多、易 忘的密碼,不需要隨時(shí)準(zhǔn)備著攜帶智能卡、鑰匙之類的東西,九江學(xué)院學(xué)士學(xué)位論文 5 更不需要像其他生物識(shí)別技術(shù)一樣,刻意的用手觸摸傳感器或把眼睛湊向攝像頭,是一種比較自然的識(shí)別技術(shù)。說話人識(shí)別中存在的噪音、多通道、情感等熱點(diǎn)研究方向都屬于這方面。 4. 可靠性和經(jīng)濟(jì)性。如 HMM 模型與神經(jīng)網(wǎng)絡(luò), HMM 模型與支持向量機(jī) SVM( Support Vector Machine)的結(jié)合都可以有效地改善系統(tǒng)的性能。僅僅依靠發(fā)音器官的特點(diǎn)而提取出來的特征不足以表示每個(gè)說話人的特點(diǎn)。隨著人們對(duì)人耳聽覺系統(tǒng)生理特征的認(rèn)識(shí),這兩年語音識(shí)別領(lǐng)域提出了一些比較新的抗噪聲語音特征,比如基于聽覺掩蔽特性的特征參數(shù)、基于人耳聽覺響度特性的特征參數(shù)、基于人耳聽覺子帶特征的提取。 基于聲紋的說話人特征識(shí)別 10 第二章 說話人識(shí)別的基本介紹 語音的基礎(chǔ)知識(shí) 在前面我們提到過一些語音的相關(guān)知識(shí),這里我們將繼續(xù)并更加詳細(xì)具體的談到語音方面的知識(shí)。清音具有一定的隨機(jī)性。 輻射模型 R(z)與嘴形有關(guān),研究表明,口唇輻射在高頻端較為顯著,在低頻端時(shí)影響較小,所以輻射模型 R(z)為一階高通濾波器的形式。分幀是用可移九江學(xué)院學(xué)士學(xué)位論文 13 動(dòng)的有限長(zhǎng)度窗口進(jìn)行加權(quán)的方法來實(shí)現(xiàn)的。 圖 22 語音信號(hào)處理分類 說話人識(shí)別與語音識(shí)別的區(qū)別在于,說話人識(shí)別不注重包含在語音信號(hào)中的文字符號(hào)信息及語義內(nèi)容,而是著眼于語音信號(hào)體現(xiàn)的個(gè)人特征。 ( 3) 按照說話人的語音來源可分為兩類:開集、閉集的說話人識(shí)別。其中端點(diǎn)檢測(cè)、自動(dòng)分 段的準(zhǔn)確性與否直接影響系統(tǒng)性能的優(yōu)劣。也就是說,當(dāng)只假設(shè)用 AR 信號(hào)分析時(shí)結(jié)果偏差會(huì)很大。 ① 典型的 非參數(shù)模型有模板匹配、矢量量化模型等。此方 法就是通過利用滿足上述條件的 ??nw 來描述輸入模板與參考模板的世間對(duì)應(yīng)關(guān)系,求解這兩個(gè)模板匹配時(shí)累積距離最小所對(duì)應(yīng)的規(guī)整函數(shù)。 識(shí) 別 時(shí) 用 測(cè) 試 語 音 特 征 矢 量 求 解 的 最 大 后 驗(yàn) 概 率? ?? ?NiP i ?2,1,|0m a x ?? 對(duì)應(yīng)的說話人就是識(shí)別的結(jié)果。在 VQ 方法中,碼書矢量只描述了語音特征在特征空間中的聚類中心信息,是對(duì)說話人特征的不完整描述; GMM 則是對(duì)特征參數(shù)矢量分布的完整描述,它對(duì)每一個(gè)說話人模型用一種概率密度函數(shù)表示,特別是在與文本無關(guān)的說話人識(shí)別中, GMM 已經(jīng)成為占統(tǒng)治性地位的識(shí)別方法。矢量量化模型就是從這些矢量中尋找少數(shù)具有代表性的典型矢量進(jìn)而構(gòu)成的說話人模型。常用的模型大體上可以分為三類:模板匹配法 —— 動(dòng)態(tài)時(shí)間規(guī)整法和矢量量化法;概率模型法 —— 高斯混合模型和隱馬爾可夫模型;辨別分類器法 —— 人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)。特征提取的任務(wù)是選取唯一表現(xiàn)說話人身份的有效且穩(wěn)定可靠的用戶語音特征;模式匹配的任務(wù)是對(duì)訓(xùn)練和識(shí)別時(shí)的特征模式進(jìn)行相似的匹配。 模式匹配 建立參考模版或模型 識(shí)別判斷 預(yù)處理 特征提取 識(shí)別 訓(xùn)練 自適應(yīng) 基于聲紋的說話人特征識(shí)別 18 計(jì)算測(cè)試音與說話人模型的匹配距離或者似然概率,來進(jìn)行匹配計(jì)算。在訓(xùn)練階段,每個(gè)用戶分別說出若干訓(xùn)練語句,系統(tǒng)據(jù)此經(jīng)過相應(yīng)的預(yù)處理和特征提取后對(duì)其進(jìn)行分析 ,并為每個(gè)用戶建立一個(gè)能夠描述這一用戶說話個(gè)性特征的模版或模型庫,用來作為這一用戶個(gè)性特征的標(biāo)準(zhǔn)圖案。 ( 2) 按識(shí)別對(duì)象的不同可以分為三類: 文本相關(guān) 、 文本無關(guān) 、指定問文本待識(shí)別語音 判斷是誰說的 S1 . . . Si SN 待識(shí)別語音 判斷是否是 Si說的 S1 . . . Si SN 基于聲紋的說話人特征識(shí)別 16 的說話人識(shí)別。 —— 端點(diǎn)檢測(cè)是根據(jù)語音的特點(diǎn)及其參數(shù)的統(tǒng)計(jì)規(guī)律,從一段語音中找出語音信號(hào)的開始位置點(diǎn)和終止位置點(diǎn)。因此,在應(yīng)用這種模型時(shí),要注意其適用條件。 語音產(chǎn)生模型 建立語音信號(hào)的數(shù)學(xué)模型對(duì)于語音處理具有重要意義。這些結(jié)構(gòu)對(duì)每個(gè)人來說都是有差異的,由此造成了每個(gè)人的生源普、基音頻率、共振峰頻率以及帶寬的不同。 —— 通常實(shí)驗(yàn)室中的說話人識(shí)別系統(tǒng)都要求使用者花費(fèi)大量的時(shí)間來訓(xùn)練和識(shí)別,以獲取高識(shí)別率,或者通過大容量的語音數(shù)據(jù)庫來做到這一點(diǎn)。 DOBTOTH 等學(xué)者從電話交換機(jī)上獲取的語音信號(hào)表示, %的對(duì)話過程中都含有其他噪聲信號(hào)干擾。 影響說話人識(shí)別性能的因素 說話人識(shí)別技術(shù)發(fā)展至今已經(jīng)變的相當(dāng)成熟,而且在國(guó)際上已經(jīng)有了一些成功的應(yīng)用。上述提到的問題主要是這兩方面引起的,其系統(tǒng)的優(yōu)劣性也往往取決于這兩方面。 5. 噪聲問題。 ( 6) 隱私保護(hù)性強(qiáng) —— 說話人識(shí)別技術(shù)采用語音特征進(jìn)行身份確認(rèn),只需提供語音信號(hào),不 涉及隱私問題,用戶無任何心理障礙。 —— 對(duì)于大量的錄音素材,將說話人識(shí)別技術(shù)與連續(xù)語音識(shí)別技術(shù)相結(jié)合,可以檢索出其中我們感興趣的特定人所說的內(nèi)容。 九江學(xué)院學(xué)士學(xué)位論文 3 第一章 說話人識(shí)別研究 說話人識(shí)別 (Speaker Recognition, SR)技術(shù),也常被人們稱為聲紋識(shí) 別(Voiceprint Recognition, VR)技術(shù),是生物認(rèn)證技術(shù)的一種。時(shí)域分析具有簡(jiǎn)單直觀、清晰易懂、運(yùn)算量小、物理意義明確等優(yōu)點(diǎn);但更為有效的分析多是圍繞頻 域進(jìn)行的,因?yàn)檎Z音中最重要的感知特性反映在其功率譜中,而相位變化只起著很小的作用。波形表示僅僅是通過采樣和量化的過程保存模擬語音信號(hào)的“波形”,而參數(shù)表示則是把語音信號(hào)表示成某種語音產(chǎn)生模型輸出。 本文介紹了 說話人識(shí)別的概念、原理及其識(shí)別實(shí)現(xiàn)的方法,指出了說話人識(shí)別技術(shù)的應(yīng)用前景。 語音信號(hào)處理雖然包括了語音通信、語音合成和語音識(shí)別等方面的內(nèi)容,但其前提是對(duì)語音信號(hào)進(jìn)行分析。近年來,各個(gè)分支都取得了很大的進(jìn)步,已經(jīng)深入應(yīng)用到通信、辦公自動(dòng)化、遠(yuǎn)程控制、聲控電話撥號(hào)、計(jì)算機(jī)語音應(yīng)答、機(jī)器人聽覺與口語系統(tǒng)等使用系統(tǒng)中。 由于每個(gè)人的聲音特征都是唯一的,而且?guī)缀鹾苌贂?huì)發(fā)生變化的。另外,現(xiàn)在很多法庭已經(jīng)使用聲紋作為鑒別犯罪的依據(jù)。因?yàn)檎f話人的發(fā)音常常與環(huán)境、說話人的情緒、說話人的健康狀況有密切關(guān)系,說話人的語音特征不是靜態(tài)的、固定不變的,它具有時(shí)變特性。如何將語音識(shí)別和說話人識(shí)別有機(jī)的結(jié)合起來,對(duì)于這一點(diǎn),指定文本型的說話人識(shí)別是一個(gè)有益的嘗試。語音特征參數(shù)對(duì)說話人識(shí)別系統(tǒng)的性能至關(guān)重要,雖然倒譜參數(shù)得到廣泛應(yīng)用,但語音特征參數(shù)仍是一個(gè)研究熱點(diǎn)。 人與人之間聲音存在差異使得自動(dòng)說話人識(shí)別技術(shù)能夠成為可能,但同時(shí)也正是因?yàn)槿说恼Z音具有多變性使得這個(gè)問題變得復(fù)雜起來。在進(jìn)行語音信號(hào)提取之前,將語音中噪聲部分有效的去除,使去噪后的語音背景和信噪比與訓(xùn)練語音相似,特征提取的時(shí)候就能得到較為理想的語音特征。 第二章 介紹了說話人識(shí)別的基本原理和說話人識(shí)別系統(tǒng)的結(jié)果、模型。而要發(fā)出構(gòu)成語音的音素,還需靠唇、齒、舌、腭。 P 值越大,則模型的傳輸函數(shù)和實(shí)際聲道的傳輸函數(shù)的吻合程度越高。 、加窗 —— 語音信號(hào)的準(zhǔn)平穩(wěn)特性,使得只在短時(shí)段上才可視為一個(gè)平穩(wěn)過程,可以用對(duì)平穩(wěn)過程的分析方法進(jìn)行分析,因此需將語音信號(hào)劃分為一個(gè)一個(gè)的短時(shí)段,每一短時(shí)段稱為一幀。短時(shí)平均過零率可以粗略估計(jì)語音的頻譜特性,它與語音的清
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1