freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音信號端點檢測算法的研究畢業(yè)論文-資料下載頁

2025-06-24 18:14本頁面
  

【正文】 E Transaetionson speeeh and Audio Proeessing, 2002, 10(3): 14615724. Javier Hermado, Climent Nadeu .Linear Predietiono fone一side dautocor relation sequen eefornoises Peeeh reeognition. IEEE Transaetion on speeeh and Audio Proeessing, 1997,5(1):808425. 樸春俊,馬靜霞,2006,26(11):2685269026. 果永振,2003,1,81127. Solei mani SA, Ahadi5M. Voice Aetivity Deteetion basedon Combination of Mult iPle Feature susing Linear/Kernel Diseriminant Analyses. In:, International Confereneeon Informationand Communieation Teehnologies. Damascus, 2008,l528. Chen Guang hua, Liu Jun hai, Ye Im Proved Method of End Points Deteetion Based on Energy Frequeney Value. In Confereneeon High Density Mierosy stem Designand Pack agin gand Com Ponent Failure Analysis. Shanghai, 2006,91129. Tanyer 5G, Ozer tivity deteetion innon stationary noise. IEEE Transae tionson speeeh and Audio Proeessing, 2000,8(4):47848230. LIMJP pENHE nhaneem entand band width eomp ressiono fnoisy sPeeeh. Proeee dings of the IEEE, 2001,67(12):1586160431. Jun qua JC, MakB, ReavesB. Arobustal gorith mforword boundary deteetion in the Presenee of noise. IEEE Transaetion son speeeh and Audio Proeessing, 1994,2(3):40641232. ,2003,27(2):11312033. 柴君,趙振東,2006,33(3):636534. 徐大為,吳邊,2003,39(l):11511735. Fu ji motoM ,Ishi zukaK, NakataniT. Avoiee activity detection based on the ada Ptiveint egration of multiple speeeh feature sanda signal decision seheme. In IEEE International Confereneeon Aeousties speeeh and Signal Proeessing. Las Vegas,2008,4441444436. Won Ho Shin, young Lee,Yun kun Lee, 2000,1399140237. Wa heedK, WeaverK, Salam FM. ARobust Algorithm for Deteeting Speeeh Segments Usingan Entro Pie Contrast. In: The 2002 45th Mid west Sym Posiumon Cireuitsand Systems. Thlsa,2002,328331致謝本研究及畢業(yè)論文是在我的導(dǎo)師王娜老師的親切關(guān)懷和悉心指導(dǎo)下完成的,論文定題到寫作定稿,傾注了老師的大量的心血。王娜老師嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度、寬厚待人的高尚品格、敏銳的學(xué)術(shù)洞察力和忘我的工作精神都給我留下了深刻的印象,對我樹立正確的治學(xué)觀念產(chǎn)生了直接而深刻的影響,激勵我永遠(yuǎn)奮發(fā)向上。王老師的言傳身教、悉心指導(dǎo)培養(yǎng)了我正確的科研方法和思維模式,使我終身受益。在論文完成之際,我謹(jǐn)向王娜老師表示衷心的感謝和崇高的敬意。感謝我生活學(xué)習(xí)了四年的母校一一燕山大學(xué)里仁學(xué)院,母校給了我一個寬闊的學(xué)習(xí)平臺,讓我不斷吸取新知,充實自己。感謝一直關(guān)心與支持我的同學(xué)和朋友們,感謝你們的鼓勵和幫助。還要感謝感謝學(xué)院2009級全體同學(xué),三年來,我們朝夕相處,共同進(jìn)步,感謝你們給予我的所有關(guān)心和幫助,.同窗之誼,我將終生難忘。最后,衷心感謝各位專家在百忙中抽出時間評閱本文并提出寶貴意見!附錄1燕 山 大 學(xué)本科畢業(yè)設(shè)計(論文)開題報告課題名稱: 語音信號端點檢測算法的研究 學(xué)院(系): 里仁學(xué)院電氣工程系 年級專業(yè): 09檢測2 學(xué)生姓名: 賈鐘強 指導(dǎo)教師: 王娜 完成日期: 2013321 綜述本課題國內(nèi)外研究動態(tài),說明選題的依據(jù)和意義語言是人類特有的功能,聲音是人類常用的工具,通過聲音傳遞信息是人類最重要、最有效、最準(zhǔn)確、最方便的信息交換的方式。隨著現(xiàn)代科學(xué)的蓬勃發(fā)展,人類社會越來越顯示出信息社會的特點,猶如衣、食、住、行對于人類是必要的一樣,通信和信息交換也成為了人類社會存在的必要條件,不但在人與人之間,而且在人與機器之間每時每刻都需要進(jìn)行大量的信息交換,讓計算機聽懂人類的語言,是人類自計算機誕生以來夢寐以求的想法。語音技術(shù)的應(yīng)用己經(jīng)成為一個具有競爭性的高新技術(shù)產(chǎn)業(yè),它正在直接與辦公、交通、金融、公安、商業(yè)、旅游等行業(yè)的語音咨詢與管理,工業(yè)生產(chǎn)部門的語聲控制,電話、電信系統(tǒng)的自動撥號、輔助控制與查詢以及醫(yī)療衛(wèi)生和福利事業(yè)的生活支援系統(tǒng)等各種實際應(yīng)用領(lǐng)域相接軌,并且有望成為下一代操作系統(tǒng)和應(yīng)用程序的用戶界面。多媒體技術(shù)的發(fā)展,使語音技術(shù)逐漸在越來越多的場合中推廣使用,語音信號處理技術(shù)發(fā)展迅速,其研究成果具有重要的學(xué)術(shù)及應(yīng)用價值,涉及一系列前沿課題。A. 國內(nèi)外研究動態(tài)對語音端點檢測的研究最早可以追溯到上個世紀(jì)的50年代,當(dāng)時是在一個實時語音翻譯系統(tǒng)中,為了解決語音段和無語音段的檢測問題而提出來的,在語音識別和說話人識別中,背景噪聲使得端點檢測變得復(fù)雜,同時,長距離電話傳輸信道中還存在人順嘴,呼吸等類似的噪聲,最近幾年,無線電話、免提式電話、IP電話越來越流行,這些通信設(shè)備大多工作于信噪比較低的環(huán)境中,傳統(tǒng)的語音端點檢測算法都是針對實驗室安靜環(huán)境,直到近年來,噪聲環(huán)境下的語音端點檢測才開始研究。在1977年,Rabiner等人提出了一種基于LPC歐氏距離測度的端點檢測方法,該算法是Rabiner等人在解決信號輸出的語音很難用一般的算法來區(qū)分無語音、靜默音和語音而提出來的,其主要思路是:先對這三種語音各自進(jìn)行訓(xùn)練,得到各自的頻域特性,然后利用LPC的測度和能量的非線性組合來對這三種語音進(jìn)行檢測[12]。LuLie等人提出一種基于時域特征參數(shù)端點檢測方法一一用短時能量變化率來進(jìn)行端點檢測,這種算法采用的不是短時能量而是短時能量的變化率,在信噪比較高的情況下,在噪聲和語音的區(qū)分點區(qū)域,由于信號幀的變化較劇烈,該方法選取的參數(shù)是一個小于1的正數(shù),而在噪聲區(qū)間或者語音區(qū)間由于信號不同,幀間的能量較平穩(wěn),變化不大,參數(shù)為0值,此方法的優(yōu)點是具有一定的魯棒性,但仍然存在信噪比低時的失效問題[13]。2008年, Shin等人提出了基于修正最大后驗準(zhǔn)則的端點檢測算法[12]。Masakiyo Fujimoto等人提出基于多特征和信號決策自適應(yīng)綜合的語音端點檢測算法[14]。潘欣裕等人將HilbertHuang變換中的經(jīng)驗?zāi)B(tài)分解(EMD)引入端點檢測,并提出了基于EMD擬合特征的語音端點檢測新方法[7]。近年來,通訊技術(shù)特別是移動通訊技術(shù)的飛速發(fā)展,對語音信號端點檢測方法研究提供了十分現(xiàn)實的要求,為了提高實時通信中語音端點檢測系統(tǒng)的性能,提出了子帶統(tǒng)計濾波器的方法[5]。通過子帶統(tǒng)計濾波器在頻域分別對噪聲和語音進(jìn)行估計,再利用信噪比特征,根據(jù)設(shè)定的門限值進(jìn)行語音和非語音的區(qū)分,對所有子帶的SNR進(jìn)行融合,形成SAF函數(shù),此算法充分利用頻域特征,并減少對噪聲的頻域能量分布的依賴,當(dāng)噪聲是非固定的時候,該方法也能可靠的執(zhí)行。語音是人類相互交流和通信最方便快捷的手段。如何高效地實現(xiàn)語音傳輸、存儲或通過語音實現(xiàn)人機交互,是語音信號處理領(lǐng)域中的重要研究課題。而語音端點檢測是語音分析、語音合成、語音編碼、說話人識別中的一個重要環(huán)節(jié),直接影響到后續(xù)工作的準(zhǔn)確性。在實際應(yīng)用中,首先通常要求對系統(tǒng)的輸入信號進(jìn)行判斷,準(zhǔn)確地找出語音信號的起始點和終止點,這樣才能采集真正的語音數(shù)據(jù),減少數(shù)據(jù)量和運算量,并減少處理時間。經(jīng)過幾十年的努力,語音信號處理在語音識別、語音增強、語音編碼、說話人識別、說話人情感識別、語音合成等方面取得了巨大的進(jìn)步,然而,一旦這些技術(shù)應(yīng)用在實際環(huán)境中,由于環(huán)境噪聲、信道、說話人自身因素等方面的影響,性能急劇下降,因為在實際環(huán)境中沒有完全純凈的語音信號,一般都會伴有噪聲或其它干擾。例如,辦公室環(huán)境下,電腦風(fēng)扇轉(zhuǎn)動的聲音,鍵盤敲打的聲音等都是噪聲,而語音信號處理系統(tǒng)的處理對象是有效語音信號,即排除了純噪聲段的語音信號段。語音端點檢測的任務(wù)就是判斷待處理信號是語音還是非語音,從輸入信號中找到語音部分的起止點。端點檢測是語音識別、語音增強以及語音編碼等中的一個重要環(huán)節(jié)。 研究的基本內(nèi)容,擬解決的主要問題在語音識別中,通常是先根據(jù)一定的端點檢測算法,對語音信號中的有聲片段和無聲片段進(jìn)行分割,而后再針對有聲片段,依據(jù)語音的某些特征進(jìn)行識別。研究表明,即使在安靜的環(huán)境中,語音識別系統(tǒng)一半以上的識別錯誤來自端點檢測器。因此,作為語音識別系統(tǒng)的第一步,端點檢測的關(guān)鍵不容忽視,尤其是噪聲環(huán)境下語音的端點檢測,它的準(zhǔn)確性很大程度上直接影響著后續(xù)的工作能否有效進(jìn)行。端點檢測中所需要運用算法的選擇,第一是基于距離熵的語音端點檢測算法,第二是基于支持向量機的多特征端點檢測算法,兩種算法都需要深入的研究。 研究步驟、方法及措施 輸入語音 端點檢測確定門限特征提取預(yù)處理 (l)預(yù)處理:包括濾波,預(yù)加重,分幀,加窗等,這里要考慮濾波器參數(shù)選擇,分幀時幀長長度的選擇,加窗窗函數(shù)的選擇。 1)預(yù)濾波 預(yù)濾波可以達(dá)到兩個目標(biāo),第一,可以抑制輸入信號各頻域分量中頻率超過FS/2的所有分量(FS為采樣頻率),以防止混疊干擾。第二,預(yù)濾波可抑制50Hz電源工頻的干擾。 2)預(yù)加重 由于語音信號的平均功率受聲門激勵和口鼻輻射的影響,高頻端大約在80Hz以上按6dB/倍頻程跌落,所以當(dāng)求語音信號頻譜時,頻率越高相應(yīng)的成分越小,高頻部分的頻譜比低頻部分難求,因此要對語音信號進(jìn)行預(yù)加重處理。預(yù)加重的中心思想是利用信號特性和噪聲特性的差別來有效地對信號進(jìn)行處理,目的是提升高頻部分,使信號的頻譜變得平坦,保持在低頻到高頻的整個頻帶中,能用同樣的信噪比求頻譜,以便于頻譜分析或聲道參數(shù)分析。 3)分幀語音信號從整體來看其特性及表征其本質(zhì)特征的參數(shù)均是隨時間變化的,但是它又具有短時平穩(wěn)特性,在短時間內(nèi)(一般為10ms30ms內(nèi))可以看作是一個近似不變的平穩(wěn)過程。目前絕大多數(shù)的語音信號處理技術(shù)均是在短時的基礎(chǔ)上對語音信號進(jìn)行分幀處理,然后分別對每一幀提取特征參數(shù)段。4)加窗對語音信號進(jìn)行分幀后要進(jìn)行加窗操作,這是為了避免截斷效應(yīng)。因為直接分幀相當(dāng)于對語音信號加了一個矩形窗,由于時域相乘對應(yīng)頻域卷積,而矩形窗的旁瓣較大,會因為在時域?qū)⑿盘柦財喽陬l域引起頻譜泄漏,即由于頻域卷積而使能量泄漏到其它頻率處,并且分幀的長度越短這種效應(yīng)越明顯。要克服這個問題,則要在分幀后對語音信號進(jìn)行加窗。(2)特征提取:在時域或者頻域提取能反映語音本質(zhì)特征的聲學(xué)參數(shù),如短時能量,短時過零率等。特征提取目的是將輸入信號轉(zhuǎn)化為特征參數(shù),然后利用特征參數(shù)進(jìn)行語音段與無聲段的區(qū)分。特征提取是語音端點檢測的關(guān)鍵問題,特征參數(shù)選擇的好壞直接影響到語音端點檢測的準(zhǔn)確率的高低。(3)確定門限:語音段最開始的幾幀一般為無聲段,根據(jù)無聲段的特征值大小確定門限值,一般選擇較大和較小兩個門限值Tmin和Tmax,TminTmax, Tmin很容易被超過,數(shù)值較小,對信號變化很敏感,Tmax數(shù)值較大,語音信號要一定的強度才能超過。(4)端點檢測:確定門限后就可以進(jìn)行端點檢測,根據(jù)門限值來區(qū)分有語音段和噪聲段,得出檢測結(jié)果。四、研究工作進(jìn)度 第12周 畢業(yè)設(shè)計初期工作第3周 畢業(yè)設(shè)計前期 閱讀文獻(xiàn),收集資料。確立初步設(shè)計方案第4周 開題考核 完成開題報告和文獻(xiàn)綜述第59周 畢業(yè)設(shè)計中期 完善設(shè)計方案,翻譯外文資料,撰寫論文初稿第10周 中期考核第1115周 畢業(yè)設(shè)計后期 完成畢業(yè)設(shè)計撰寫論文第16周 論文評審第17周 論文答辯五、主要參考文獻(xiàn) [M].北京:機械工業(yè)出版社,2003
點擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1