freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音信號(hào)端點(diǎn)檢測算法的研究畢業(yè)論文-資料下載頁

2025-06-24 18:14本頁面
  

【正文】 E Transaetionson speeeh and Audio Proeessing, 2002, 10(3): 14615724. Javier Hermado, Climent Nadeu .Linear Predietiono fone一side dautocor relation sequen eefornoises Peeeh reeognition. IEEE Transaetion on speeeh and Audio Proeessing, 1997,5(1):808425. 樸春俊,馬靜霞,2006,26(11):2685269026. 果永振,2003,1,81127. Solei mani SA, Ahadi5M. Voice Aetivity Deteetion basedon Combination of Mult iPle Feature susing Linear/Kernel Diseriminant Analyses. In:, International Confereneeon Informationand Communieation Teehnologies. Damascus, 2008,l528. Chen Guang hua, Liu Jun hai, Ye Im Proved Method of End Points Deteetion Based on Energy Frequeney Value. In Confereneeon High Density Mierosy stem Designand Pack agin gand Com Ponent Failure Analysis. Shanghai, 2006,91129. Tanyer 5G, Ozer tivity deteetion innon stationary noise. IEEE Transae tionson speeeh and Audio Proeessing, 2000,8(4):47848230. LIMJP pENHE nhaneem entand band width eomp ressiono fnoisy sPeeeh. Proeee dings of the IEEE, 2001,67(12):1586160431. Jun qua JC, MakB, ReavesB. Arobustal gorith mforword boundary deteetion in the Presenee of noise. IEEE Transaetion son speeeh and Audio Proeessing, 1994,2(3):40641232. ,2003,27(2):11312033. 柴君,趙振東,2006,33(3):636534. 徐大為,吳邊,2003,39(l):11511735. Fu ji motoM ,Ishi zukaK, NakataniT. Avoiee activity detection based on the ada Ptiveint egration of multiple speeeh feature sanda signal decision seheme. In IEEE International Confereneeon Aeousties speeeh and Signal Proeessing. Las Vegas,2008,4441444436. Won Ho Shin, young Lee,Yun kun Lee, 2000,1399140237. Wa heedK, WeaverK, Salam FM. ARobust Algorithm for Deteeting Speeeh Segments Usingan Entro Pie Contrast. In: The 2002 45th Mid west Sym Posiumon Cireuitsand Systems. Thlsa,2002,328331致謝本研究及畢業(yè)論文是在我的導(dǎo)師王娜老師的親切關(guān)懷和悉心指導(dǎo)下完成的,論文定題到寫作定稿,傾注了老師的大量的心血。王娜老師嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度、寬厚待人的高尚品格、敏銳的學(xué)術(shù)洞察力和忘我的工作精神都給我留下了深刻的印象,對我樹立正確的治學(xué)觀念產(chǎn)生了直接而深刻的影響,激勵(lì)我永遠(yuǎn)奮發(fā)向上。王老師的言傳身教、悉心指導(dǎo)培養(yǎng)了我正確的科研方法和思維模式,使我終身受益。在論文完成之際,我謹(jǐn)向王娜老師表示衷心的感謝和崇高的敬意。感謝我生活學(xué)習(xí)了四年的母校一一燕山大學(xué)里仁學(xué)院,母校給了我一個(gè)寬闊的學(xué)習(xí)平臺(tái),讓我不斷吸取新知,充實(shí)自己。感謝一直關(guān)心與支持我的同學(xué)和朋友們,感謝你們的鼓勵(lì)和幫助。還要感謝感謝學(xué)院2009級(jí)全體同學(xué),三年來,我們朝夕相處,共同進(jìn)步,感謝你們給予我的所有關(guān)心和幫助,.同窗之誼,我將終生難忘。最后,衷心感謝各位專家在百忙中抽出時(shí)間評(píng)閱本文并提出寶貴意見!附錄1燕 山 大 學(xué)本科畢業(yè)設(shè)計(jì)(論文)開題報(bào)告課題名稱: 語音信號(hào)端點(diǎn)檢測算法的研究 學(xué)院(系): 里仁學(xué)院電氣工程系 年級(jí)專業(yè): 09檢測2 學(xué)生姓名: 賈鐘強(qiáng) 指導(dǎo)教師: 王娜 完成日期: 2013321 綜述本課題國內(nèi)外研究動(dòng)態(tài),說明選題的依據(jù)和意義語言是人類特有的功能,聲音是人類常用的工具,通過聲音傳遞信息是人類最重要、最有效、最準(zhǔn)確、最方便的信息交換的方式。隨著現(xiàn)代科學(xué)的蓬勃發(fā)展,人類社會(huì)越來越顯示出信息社會(huì)的特點(diǎn),猶如衣、食、住、行對于人類是必要的一樣,通信和信息交換也成為了人類社會(huì)存在的必要條件,不但在人與人之間,而且在人與機(jī)器之間每時(shí)每刻都需要進(jìn)行大量的信息交換,讓計(jì)算機(jī)聽懂人類的語言,是人類自計(jì)算機(jī)誕生以來夢寐以求的想法。語音技術(shù)的應(yīng)用己經(jīng)成為一個(gè)具有競爭性的高新技術(shù)產(chǎn)業(yè),它正在直接與辦公、交通、金融、公安、商業(yè)、旅游等行業(yè)的語音咨詢與管理,工業(yè)生產(chǎn)部門的語聲控制,電話、電信系統(tǒng)的自動(dòng)撥號(hào)、輔助控制與查詢以及醫(yī)療衛(wèi)生和福利事業(yè)的生活支援系統(tǒng)等各種實(shí)際應(yīng)用領(lǐng)域相接軌,并且有望成為下一代操作系統(tǒng)和應(yīng)用程序的用戶界面。多媒體技術(shù)的發(fā)展,使語音技術(shù)逐漸在越來越多的場合中推廣使用,語音信號(hào)處理技術(shù)發(fā)展迅速,其研究成果具有重要的學(xué)術(shù)及應(yīng)用價(jià)值,涉及一系列前沿課題。A. 國內(nèi)外研究動(dòng)態(tài)對語音端點(diǎn)檢測的研究最早可以追溯到上個(gè)世紀(jì)的50年代,當(dāng)時(shí)是在一個(gè)實(shí)時(shí)語音翻譯系統(tǒng)中,為了解決語音段和無語音段的檢測問題而提出來的,在語音識(shí)別和說話人識(shí)別中,背景噪聲使得端點(diǎn)檢測變得復(fù)雜,同時(shí),長距離電話傳輸信道中還存在人順嘴,呼吸等類似的噪聲,最近幾年,無線電話、免提式電話、IP電話越來越流行,這些通信設(shè)備大多工作于信噪比較低的環(huán)境中,傳統(tǒng)的語音端點(diǎn)檢測算法都是針對實(shí)驗(yàn)室安靜環(huán)境,直到近年來,噪聲環(huán)境下的語音端點(diǎn)檢測才開始研究。在1977年,Rabiner等人提出了一種基于LPC歐氏距離測度的端點(diǎn)檢測方法,該算法是Rabiner等人在解決信號(hào)輸出的語音很難用一般的算法來區(qū)分無語音、靜默音和語音而提出來的,其主要思路是:先對這三種語音各自進(jìn)行訓(xùn)練,得到各自的頻域特性,然后利用LPC的測度和能量的非線性組合來對這三種語音進(jìn)行檢測[12]。LuLie等人提出一種基于時(shí)域特征參數(shù)端點(diǎn)檢測方法一一用短時(shí)能量變化率來進(jìn)行端點(diǎn)檢測,這種算法采用的不是短時(shí)能量而是短時(shí)能量的變化率,在信噪比較高的情況下,在噪聲和語音的區(qū)分點(diǎn)區(qū)域,由于信號(hào)幀的變化較劇烈,該方法選取的參數(shù)是一個(gè)小于1的正數(shù),而在噪聲區(qū)間或者語音區(qū)間由于信號(hào)不同,幀間的能量較平穩(wěn),變化不大,參數(shù)為0值,此方法的優(yōu)點(diǎn)是具有一定的魯棒性,但仍然存在信噪比低時(shí)的失效問題[13]。2008年, Shin等人提出了基于修正最大后驗(yàn)準(zhǔn)則的端點(diǎn)檢測算法[12]。Masakiyo Fujimoto等人提出基于多特征和信號(hào)決策自適應(yīng)綜合的語音端點(diǎn)檢測算法[14]。潘欣裕等人將HilbertHuang變換中的經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)引入端點(diǎn)檢測,并提出了基于EMD擬合特征的語音端點(diǎn)檢測新方法[7]。近年來,通訊技術(shù)特別是移動(dòng)通訊技術(shù)的飛速發(fā)展,對語音信號(hào)端點(diǎn)檢測方法研究提供了十分現(xiàn)實(shí)的要求,為了提高實(shí)時(shí)通信中語音端點(diǎn)檢測系統(tǒng)的性能,提出了子帶統(tǒng)計(jì)濾波器的方法[5]。通過子帶統(tǒng)計(jì)濾波器在頻域分別對噪聲和語音進(jìn)行估計(jì),再利用信噪比特征,根據(jù)設(shè)定的門限值進(jìn)行語音和非語音的區(qū)分,對所有子帶的SNR進(jìn)行融合,形成SAF函數(shù),此算法充分利用頻域特征,并減少對噪聲的頻域能量分布的依賴,當(dāng)噪聲是非固定的時(shí)候,該方法也能可靠的執(zhí)行。語音是人類相互交流和通信最方便快捷的手段。如何高效地實(shí)現(xiàn)語音傳輸、存儲(chǔ)或通過語音實(shí)現(xiàn)人機(jī)交互,是語音信號(hào)處理領(lǐng)域中的重要研究課題。而語音端點(diǎn)檢測是語音分析、語音合成、語音編碼、說話人識(shí)別中的一個(gè)重要環(huán)節(jié),直接影響到后續(xù)工作的準(zhǔn)確性。在實(shí)際應(yīng)用中,首先通常要求對系統(tǒng)的輸入信號(hào)進(jìn)行判斷,準(zhǔn)確地找出語音信號(hào)的起始點(diǎn)和終止點(diǎn),這樣才能采集真正的語音數(shù)據(jù),減少數(shù)據(jù)量和運(yùn)算量,并減少處理時(shí)間。經(jīng)過幾十年的努力,語音信號(hào)處理在語音識(shí)別、語音增強(qiáng)、語音編碼、說話人識(shí)別、說話人情感識(shí)別、語音合成等方面取得了巨大的進(jìn)步,然而,一旦這些技術(shù)應(yīng)用在實(shí)際環(huán)境中,由于環(huán)境噪聲、信道、說話人自身因素等方面的影響,性能急劇下降,因?yàn)樵趯?shí)際環(huán)境中沒有完全純凈的語音信號(hào),一般都會(huì)伴有噪聲或其它干擾。例如,辦公室環(huán)境下,電腦風(fēng)扇轉(zhuǎn)動(dòng)的聲音,鍵盤敲打的聲音等都是噪聲,而語音信號(hào)處理系統(tǒng)的處理對象是有效語音信號(hào),即排除了純噪聲段的語音信號(hào)段。語音端點(diǎn)檢測的任務(wù)就是判斷待處理信號(hào)是語音還是非語音,從輸入信號(hào)中找到語音部分的起止點(diǎn)。端點(diǎn)檢測是語音識(shí)別、語音增強(qiáng)以及語音編碼等中的一個(gè)重要環(huán)節(jié)。 研究的基本內(nèi)容,擬解決的主要問題在語音識(shí)別中,通常是先根據(jù)一定的端點(diǎn)檢測算法,對語音信號(hào)中的有聲片段和無聲片段進(jìn)行分割,而后再針對有聲片段,依據(jù)語音的某些特征進(jìn)行識(shí)別。研究表明,即使在安靜的環(huán)境中,語音識(shí)別系統(tǒng)一半以上的識(shí)別錯(cuò)誤來自端點(diǎn)檢測器。因此,作為語音識(shí)別系統(tǒng)的第一步,端點(diǎn)檢測的關(guān)鍵不容忽視,尤其是噪聲環(huán)境下語音的端點(diǎn)檢測,它的準(zhǔn)確性很大程度上直接影響著后續(xù)的工作能否有效進(jìn)行。端點(diǎn)檢測中所需要運(yùn)用算法的選擇,第一是基于距離熵的語音端點(diǎn)檢測算法,第二是基于支持向量機(jī)的多特征端點(diǎn)檢測算法,兩種算法都需要深入的研究。 研究步驟、方法及措施 輸入語音 端點(diǎn)檢測確定門限特征提取預(yù)處理 (l)預(yù)處理:包括濾波,預(yù)加重,分幀,加窗等,這里要考慮濾波器參數(shù)選擇,分幀時(shí)幀長長度的選擇,加窗窗函數(shù)的選擇。 1)預(yù)濾波 預(yù)濾波可以達(dá)到兩個(gè)目標(biāo),第一,可以抑制輸入信號(hào)各頻域分量中頻率超過FS/2的所有分量(FS為采樣頻率),以防止混疊干擾。第二,預(yù)濾波可抑制50Hz電源工頻的干擾。 2)預(yù)加重 由于語音信號(hào)的平均功率受聲門激勵(lì)和口鼻輻射的影響,高頻端大約在80Hz以上按6dB/倍頻程跌落,所以當(dāng)求語音信號(hào)頻譜時(shí),頻率越高相應(yīng)的成分越小,高頻部分的頻譜比低頻部分難求,因此要對語音信號(hào)進(jìn)行預(yù)加重處理。預(yù)加重的中心思想是利用信號(hào)特性和噪聲特性的差別來有效地對信號(hào)進(jìn)行處理,目的是提升高頻部分,使信號(hào)的頻譜變得平坦,保持在低頻到高頻的整個(gè)頻帶中,能用同樣的信噪比求頻譜,以便于頻譜分析或聲道參數(shù)分析。 3)分幀語音信號(hào)從整體來看其特性及表征其本質(zhì)特征的參數(shù)均是隨時(shí)間變化的,但是它又具有短時(shí)平穩(wěn)特性,在短時(shí)間內(nèi)(一般為10ms30ms內(nèi))可以看作是一個(gè)近似不變的平穩(wěn)過程。目前絕大多數(shù)的語音信號(hào)處理技術(shù)均是在短時(shí)的基礎(chǔ)上對語音信號(hào)進(jìn)行分幀處理,然后分別對每一幀提取特征參數(shù)段。4)加窗對語音信號(hào)進(jìn)行分幀后要進(jìn)行加窗操作,這是為了避免截?cái)嘈?yīng)。因?yàn)橹苯臃謳喈?dāng)于對語音信號(hào)加了一個(gè)矩形窗,由于時(shí)域相乘對應(yīng)頻域卷積,而矩形窗的旁瓣較大,會(huì)因?yàn)樵跁r(shí)域?qū)⑿盘?hào)截?cái)喽陬l域引起頻譜泄漏,即由于頻域卷積而使能量泄漏到其它頻率處,并且分幀的長度越短這種效應(yīng)越明顯。要克服這個(gè)問題,則要在分幀后對語音信號(hào)進(jìn)行加窗。(2)特征提取:在時(shí)域或者頻域提取能反映語音本質(zhì)特征的聲學(xué)參數(shù),如短時(shí)能量,短時(shí)過零率等。特征提取目的是將輸入信號(hào)轉(zhuǎn)化為特征參數(shù),然后利用特征參數(shù)進(jìn)行語音段與無聲段的區(qū)分。特征提取是語音端點(diǎn)檢測的關(guān)鍵問題,特征參數(shù)選擇的好壞直接影響到語音端點(diǎn)檢測的準(zhǔn)確率的高低。(3)確定門限:語音段最開始的幾幀一般為無聲段,根據(jù)無聲段的特征值大小確定門限值,一般選擇較大和較小兩個(gè)門限值Tmin和Tmax,TminTmax, Tmin很容易被超過,數(shù)值較小,對信號(hào)變化很敏感,Tmax數(shù)值較大,語音信號(hào)要一定的強(qiáng)度才能超過。(4)端點(diǎn)檢測:確定門限后就可以進(jìn)行端點(diǎn)檢測,根據(jù)門限值來區(qū)分有語音段和噪聲段,得出檢測結(jié)果。四、研究工作進(jìn)度 第12周 畢業(yè)設(shè)計(jì)初期工作第3周 畢業(yè)設(shè)計(jì)前期 閱讀文獻(xiàn),收集資料。確立初步設(shè)計(jì)方案第4周 開題考核 完成開題報(bào)告和文獻(xiàn)綜述第59周 畢業(yè)設(shè)計(jì)中期 完善設(shè)計(jì)方案,翻譯外文資料,撰寫論文初稿第10周 中期考核第1115周 畢業(yè)設(shè)計(jì)后期 完成畢業(yè)設(shè)計(jì)撰寫論文第16周 論文評(píng)審第17周 論文答辯五、主要參考文獻(xiàn) [M].北京:機(jī)械工業(yè)出版社,2003
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1