freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于特征參數(shù)在歌唱比賽評(píng)分方法中的研究-畢業(yè)論文-資料下載頁

2025-06-27 20:42本頁面
  

【正文】 主要的功能是負(fù)責(zé)產(chǎn)生激勵(lì)振動(dòng),相當(dāng)于聲音信號(hào)產(chǎn)生系統(tǒng)中的“激勵(lì)系統(tǒng) ”;而“聲道系統(tǒng)”是指從聲門直到嘴唇之間的呼吸通道的這一部分組織;語音信號(hào)會(huì)從嘴唇輻射出去,所以嘴唇以外相當(dāng)于聲音信號(hào)產(chǎn)生系統(tǒng)中的“輻射系統(tǒng) ”。根據(jù)聲音信號(hào)產(chǎn)生系統(tǒng)這三個(gè)部分的特點(diǎn),我們可以為他們分別建立各自的數(shù)學(xué)模型——激勵(lì)模型、聲道模型和輻射模型。所以,只需要用激勵(lì)模型、聲道模型和輻射模型這三個(gè)數(shù)學(xué)子模型就可以聯(lián)合表示一個(gè)完整的聲音信號(hào)產(chǎn)生系統(tǒng)的數(shù)學(xué)模型。在此,我們將聲音信號(hào)的數(shù)學(xué)模型建立出來,具體如下圖所示:A u周期脈沖發(fā)生器聲門脈沖模型 G ( z )聲道模型 V ( z )輻射模型 R ( z )隨機(jī)噪聲發(fā)生器基音頻率A v清 / 輔音開關(guān)X ( n )圖 聲音發(fā)生系統(tǒng)模擬圖 sound analog system②梅爾倒頻譜系數(shù)(MFCC) [3738]是充分考慮了人耳的聽覺特性 [39],將語音信號(hào)的頻譜轉(zhuǎn)化為了基于Mel尺度的非線性頻譜,最后轉(zhuǎn)換到倒譜域上從而得到梅爾倒頻譜系數(shù)(MFCC)。因?yàn)镸FCC與LPCC相比,具有以下的這些優(yōu)點(diǎn):①因?yàn)檎Z音信號(hào)中的語音信息主要是集中在語音信號(hào)的低頻部分, 而高頻部分則比較容易受到背景噪聲的影響, MFCC通過將線性頻譜轉(zhuǎn)化為Mel頻譜,更加強(qiáng)調(diào)了語音信號(hào)中低頻部分的信息,從而更加突出了易于識(shí)別的語音信號(hào)信息,對(duì)噪重慶大學(xué)碩士學(xué)位論文 2 相關(guān)的理論知識(shí)和概念18聲的干擾進(jìn)行了有效的屏蔽。而LPCC 是屬于線性頻譜, 所以不具備這一特性;②梅爾倒頻譜系數(shù)(MFCC)沒有任何前提假設(shè), 可在各種情況下進(jìn)行使用。而LPCC的假定前提條件是所處理的語音信號(hào)是為自回歸的, 但是對(duì)于動(dòng)態(tài)特性較強(qiáng)的輔音信號(hào), 這個(gè)假設(shè)在要就比較嚴(yán)格的情況下是不能成立的。由于梅爾倒頻譜系數(shù)(MFCC)充分模擬了人的聽覺特性,并且沒有任何前提假設(shè),還具有較高的抗噪能力,在本文的歌唱評(píng)分方法中采用MFCC作為歌唱者對(duì)歌詞掌握程度的特征參數(shù)。 聲音強(qiáng)度聲音強(qiáng)度是指聲音信號(hào)中主音調(diào)的強(qiáng)弱程度,是判別樂音的基礎(chǔ)。聲音強(qiáng)度是一個(gè)客觀的物理量,其常用單位為“分貝(db) ”。聲音強(qiáng)度主要取決于聲波振動(dòng)幅度的大小,振幅越大,強(qiáng)度越大;振幅越小,強(qiáng)度越小。例如:在夜深人靜時(shí),樹葉的碰撞聲、動(dòng)物的呼吸聲大約20dB聲壓級(jí);兩人正常的談話聲約60dB聲壓級(jí);大聲喊叫約85dB聲壓級(jí);汽車?guó)Q喇叭、火車通過聲約100dB聲壓級(jí);飛機(jī)起飛的聲音約120dB聲壓級(jí)。但這還不是人耳對(duì)聲音強(qiáng)度反映的主觀量。人耳對(duì)聲音強(qiáng)度反映的主觀量稱之為“響度” ,其單位為“宋” 。由于人們的主觀感受強(qiáng)度受“頻率”和“音強(qiáng) ”兩方面的因素所影響,所以“宋” 被定義為40db1000Hz純音所引起的響度。在音樂體系中,音的強(qiáng)弱是由發(fā)音時(shí)發(fā)音體振動(dòng)幅度(簡(jiǎn)稱振幅)的大小決定的,兩者成正比關(guān)系,振幅越大則音越強(qiáng) ,反之則越 弱。音樂作品中的強(qiáng)弱變化叫做 力度 ,用文字或符號(hào)來標(biāo)明,如 f(強(qiáng))、p(弱)等。重慶大學(xué)碩士學(xué)位論文 3 聲音信號(hào)預(yù)處理193 聲音信號(hào)預(yù)處理在介紹完一些關(guān)于音樂和語音信號(hào)方面的基本理論知識(shí)和概念之后,我們接下來將制定一定的技術(shù)流程來實(shí)現(xiàn)對(duì)歌唱者歌唱水平的評(píng)價(jià)方法。本文給出的歌唱評(píng)分方法主要技術(shù)流程如下圖所示:特征參數(shù)提取特征矢量匹配(DTW)評(píng)分機(jī)制聲音預(yù)處理特征參數(shù)提取聲音預(yù)處理評(píng)價(jià)分?jǐn)?shù)標(biāo)準(zhǔn)模板待測(cè)模板圖 評(píng)分方法技術(shù)路線圖 technical line of scoring method從上圖我們可以看出,在對(duì)聲音信號(hào)做特征參數(shù)提取、特征矢量匹配以及歌唱評(píng)分之前還需要對(duì)標(biāo)準(zhǔn)模板和待測(cè)模板進(jìn)行必要的預(yù)處理。因?yàn)楦鶕?jù)現(xiàn)有的聲音信號(hào)處理技術(shù)的一般流程,對(duì)聲音信號(hào)進(jìn)行預(yù)處理是對(duì)聲音信號(hào)進(jìn)行特征參數(shù)提取的前提和基礎(chǔ),只有預(yù)先對(duì)歌唱者的聲音信號(hào)文件進(jìn)行一些必要的處理,才能更好地利用這些處理過的聲音信號(hào)進(jìn)行特征參數(shù)提取。因此聲音信號(hào)預(yù)處理在聲音信號(hào)的特征參數(shù)提取之中占有很重要的作用。為了更有效地提取語音信號(hào)的特征參數(shù),在進(jìn)行聲音信號(hào)特征參數(shù)提取之前需要對(duì)語音信號(hào)進(jìn)行預(yù)處理 [16,17] 。聲音信號(hào)的預(yù)處理過程包括預(yù)加重,分幀,加窗。 聲音信號(hào)預(yù)加重由于聲音信號(hào)在其產(chǎn)生以后,其平均功率譜會(huì)因?yàn)槭艿铰曢T激勵(lì)和發(fā)音者口、鼻輻射的影響,聲音信號(hào)的高頻部分大約會(huì)在800Hz以上按照6dB/ 倍頻程衰減,因此我們對(duì)于所接收到的聲音信號(hào),其頻率越高則其相應(yīng)的成分就會(huì)衰減得越多,所以會(huì)導(dǎo)致高頻部分的頻譜會(huì)比低頻部分的頻譜更弱,以至于影響我們對(duì)聲音信號(hào)中高頻部分頻譜的分析,所以我們需要在對(duì)聲音信號(hào)的預(yù)處理中對(duì)聲音信號(hào)進(jìn)行預(yù)加重處理。預(yù)加重的目的是為了消除發(fā)聲過程中聲帶和嘴唇輻射的影響,補(bǔ)重慶大學(xué)碩士學(xué)位論文 3 聲音信號(hào)預(yù)處理20償語音功率譜的固有衰落和受發(fā)音系統(tǒng)所壓抑的高頻部分,凸顯在較高部分的基音頻率,以便于后續(xù)進(jìn)行的頻譜分析和特征參數(shù)提取。對(duì)于聲音信號(hào)的預(yù)加重處理我們可以通過一階高通數(shù)字濾波器進(jìn)行實(shí)現(xiàn): ( )1()Hz???其中 , 值設(shè)置越大對(duì)高頻分量幅度的提升就會(huì)越大。?在語音信號(hào)處理中, 。?用MATLAB進(jìn)行仿真,對(duì)實(shí)例音樂文件進(jìn)行預(yù)加重,其預(yù)加重之前和預(yù)加重之后的信號(hào)頻譜圖分別如下:圖 聲音原始信號(hào)圖 original signal of sound圖 聲音信號(hào)加重圖 aggravation of sound signal從以上兩幅圖像中,我們可以看出,在對(duì)聲音信號(hào)進(jìn)行加重處理以后,背景噪音被進(jìn)一步減弱,有效聲音信號(hào)變得更加清晰,主要的發(fā)聲片段也可以一目了然。對(duì)原始聲音信號(hào)進(jìn)行預(yù)加重與處理,其目的是為了降低聲音信號(hào)中低頻部分和背景噪聲的干擾,并且也可以對(duì)本實(shí)驗(yàn)中的語音文件中的高頻部分進(jìn)行提升,重慶大學(xué)碩士學(xué)位論文 3 聲音信號(hào)預(yù)處理21更有利于接下來的一系列操作。 聲音信號(hào)的采樣和分幀聲音信號(hào)其實(shí)是一種非平穩(wěn)無規(guī)律的時(shí)變信號(hào),人們發(fā)聲器官的運(yùn)動(dòng)與聲音信號(hào)的產(chǎn)生有著密切的關(guān)系。由于人們發(fā)聲器官狀態(tài)的變化速度相比較于聲音的振動(dòng)速度要緩慢得多,因此我們可以認(rèn)為聲音信號(hào)在一段很短的時(shí)間內(nèi)是相對(duì)平穩(wěn)不變的,即具有短時(shí)穩(wěn)定性 [120] 。在1040ms的范圍內(nèi),聲音信號(hào)的頻譜特性以及一些物理上的特征參數(shù)可以基本上保持不變。于是我們可以把每個(gè)短時(shí)的語音段稱為一個(gè)分析幀,幀是進(jìn)行短時(shí)語音分析的長(zhǎng)度單位。此時(shí),每個(gè)分析幀就如同從一個(gè)具有固定特性的持續(xù)語音中截取出來的,對(duì)該幀進(jìn)行處理就相當(dāng)于對(duì)固定特性的持續(xù)聲音信號(hào)進(jìn)行處理。分幀有兩種情況:連續(xù)分幀和交疊分幀。第 K 幀第 K + 1 幀第 K + 2 幀幀長(zhǎng)幀長(zhǎng)幀長(zhǎng)圖 連續(xù)分幀圖 continuous framing第 K 幀第 K + 1 幀第 K + 2 幀幀移 幀長(zhǎng) 幀移圖 重疊分幀圖 overlapping framing重慶大學(xué)碩士學(xué)位論文 3 聲音信號(hào)預(yù)處理22為了將從人們發(fā)聲器官中產(chǎn)生的原始模擬語音信號(hào)轉(zhuǎn)化為數(shù)字信號(hào),必須要經(jīng)過聲音信號(hào)采樣和聲音信號(hào)量化這兩個(gè)步驟,從而可以得到在時(shí)間和幅度上均呈現(xiàn)為離散數(shù)字的語音信號(hào)。根據(jù)恩奎斯特采樣定理:只有當(dāng)聲音信號(hào)的采樣頻率大于聲音信號(hào)的兩倍帶寬時(shí),在采樣的過程中才不會(huì)丟失聲音信號(hào)的信息,并且還可以從采樣所得到的聲音信號(hào)中做到精確地重構(gòu)原始聲音信號(hào)波形。比如,我們?nèi)粘K玫碾娫捳Z音的頻率范圍大約是603400Hz左右,因而采樣頻率一般取8kHz 。但是在某些實(shí)際語音信號(hào)的處理中,采樣頻率通常會(huì)取710kHz。而為了實(shí)現(xiàn)更加高質(zhì)量的語音合成結(jié)果或者需要使語音識(shí)別系統(tǒng)可以達(dá)到更高的語音識(shí)別成功率,某些現(xiàn)代語音處理系統(tǒng)的語音高端頻率甚至?xí)U(kuò)展到79kHz,所以相應(yīng)的采樣頻率也需要提高到1520kHz。而在聲音信號(hào)的帶寬不明確時(shí),在對(duì)聲音信號(hào)進(jìn)行采樣前應(yīng)該接入反混疊濾波器(低通濾波器),使聲音信號(hào)的帶寬限定在某一個(gè)范圍內(nèi)。否則,如果采樣頻率不滿足恩奎斯特采樣定理,則會(huì)產(chǎn)生頻譜混疊的現(xiàn)象,而此時(shí)的聲音信號(hào)中的高頻成分將會(huì)產(chǎn)生失真。 在本文中,由于聲音信號(hào)的輸入是采用電腦耳機(jī)上的麥克風(fēng),為了減少運(yùn)算量和程序運(yùn)行時(shí)間,語音采樣率為8000Hz,每幀有256個(gè)采樣點(diǎn),對(duì)應(yīng)的時(shí)間長(zhǎng)度為32ms ,幀移為半個(gè)幀長(zhǎng)。對(duì)示例音樂文件進(jìn)行分幀后的結(jié)果如下圖所示:圖 分幀效果圖 effect of framing從上圖得到的聲音信號(hào)部分分幀效果圖中可以看到,一個(gè)連續(xù)的音樂文件被分成了許多個(gè)大小為幀長(zhǎng)(32ms)的片段。而這些幀長(zhǎng)片段的波形圖像,對(duì)應(yīng)著圖中多條不同的曲線,圖中每一條曲線代表了其中某一幀的波形圖。重慶大學(xué)碩士學(xué)位論文 3 聲音信號(hào)預(yù)處理23 語音信號(hào)的加窗對(duì)于經(jīng)過分幀后的聲音信號(hào),為了補(bǔ)償在幀的邊緣出現(xiàn)的信號(hào)不連續(xù) [21],需要對(duì)聲音信號(hào)加上一個(gè)有限長(zhǎng)度的窗口,窗口的長(zhǎng)度為幀長(zhǎng)。在信號(hào)處理中,可以說加窗處理是一個(gè)很有必要的過程,因?yàn)槲覀兊挠?jì)算機(jī)只能處理有限長(zhǎng)度的信號(hào),所以要將原始信號(hào)S(t)要以T時(shí)間(采樣時(shí)間)截?cái)?,即有限化,成為ST(t)后再進(jìn)一步處理,這個(gè)過程序就是加窗處理。一般來說,對(duì)聲音信號(hào)進(jìn)行加窗主要目的是用于對(duì)截?cái)嗵幍牟贿B續(xù)變化進(jìn)行平滑,減少泄漏。此外,對(duì)聲音信號(hào)進(jìn)行加窗還有很多其它的原因,如減少噪聲干擾、限定測(cè)試的持續(xù)時(shí)間、從頻率接近的信號(hào)中分離出幅值不同的信號(hào)等等。下面我們例舉幾種比較常用的窗函數(shù)以及其主要的指標(biāo): 窗函數(shù)及其各項(xiàng)指標(biāo) window function and its targets窗函數(shù)名稱 最高旁瓣高度 (dB) 旁瓣衰減率(dB/倍頻程) 等效噪聲 帶(bin) 中心峰全寬(bin)矩形窗 13 6 三角窗 27 12 海寧窗 32 18 漢明窗 43 6 布萊克曼窗 58 18 凱瑟窗 69 6 現(xiàn)有的窗函數(shù)以及其主要的適用范圍如下表: 窗函數(shù)及其適用范圍 window function and its use of scope窗函數(shù)名稱 適用范圍矩形窗 頻譜分析(頻率響應(yīng)測(cè)試);區(qū)分頻率接近且幅度幾乎相等的信號(hào)凱瑟窗 區(qū)分頻率接近而幅度相差較大的信號(hào);區(qū)分頻率接近而形狀不同的信號(hào)指數(shù)窗 響應(yīng)信號(hào)漢明窗 聲音信號(hào);相位相差很少的正弦信號(hào)平頂窗 分析無精確參照物且要求精確測(cè)試的信號(hào),特別是幅度精度測(cè)試; 正弦波且幅度精確性較為重要的信號(hào);海寧窗 頻譜分析(頻率響應(yīng)測(cè)試);正弦波或組合正弦波信號(hào); 窄帶隨機(jī)信號(hào)、振動(dòng)信號(hào);未知信號(hào)重慶大學(xué)碩士學(xué)位論文 3 聲音信號(hào)預(yù)處理24在語音信號(hào)處理中最常用到的就是矩形窗和漢明窗。這兩種窗函數(shù)的定義分別為:①矩形窗: ( )101()nNn????????其 它其中N為每幀的采樣點(diǎn)數(shù)。矩形窗的函數(shù)圖像如下:圖 矩形窗函數(shù)曲線圖 rectangular window function curve②漢明窗: ( )?(2/(1)01() nNnNn???????其 他重慶大學(xué)碩士學(xué)位論文 3 聲音信號(hào)預(yù)處理25漢明窗的函數(shù)圖像如下:圖 漢明窗函數(shù)曲線圖 hamming window function curve從上圖中我們可以看出,窗函數(shù)主要起到了一個(gè)調(diào)整聲音信號(hào)文件元素值的作用,在兩幀之間的交匯處,對(duì)于聲音信號(hào)的削弱越小,距離交匯處越遠(yuǎn),對(duì)聲音信號(hào)波形的削弱越大。窗函數(shù)的選擇,會(huì)在很大程度上很大影響短時(shí)分析特征參數(shù)的特性,因此需要選擇合適的窗函數(shù),使其短時(shí)參數(shù)可以更好地反映聲音信號(hào)的特征變化。對(duì)于不同的短時(shí)分析方法(時(shí)域、頻域分析等),以及求取不同的語音特征參數(shù),對(duì)窗函數(shù)的選擇要求都不一樣。對(duì)于時(shí)域分析,由于加窗的實(shí)質(zhì)是將聲音信號(hào)與窗函數(shù)進(jìn)行相乘,所以就要求可以盡量減小時(shí)域窗口兩端的坡度,使窗口兩端邊緣之間的銜接不會(huì)出現(xiàn)非常急劇地變化,加窗后的語音信號(hào)可以平滑過渡到零,減少語音分幀造成的截?cái)嘈?yīng)。對(duì)于頻域分析,加窗相當(dāng)于語音信號(hào)的頻譜與窗函數(shù)頻譜的卷積,選擇的窗函數(shù)希望具有較窄的主瓣寬度以及較小的旁瓣峰值。給出矩形窗和漢明窗的頻域特性。 矩形窗和漢明窗函數(shù)的頻域特性 frequency domain characteristics of rectangular and hamming window functions窗函數(shù)名稱 旁瓣峰值 主瓣峰值矩形窗函數(shù) 13dB 4 /N?漢明窗函數(shù) 41dB 8 /N重慶大學(xué)碩士學(xué)位論文 3 聲音信號(hào)預(yù)處理26從表中可以看出,矩形窗的主瓣寬度比較小,聲音矩形窗具有較高的頻譜分辨率;但是矩形窗的旁瓣峰值較大,所以如果將矩形窗作為窗函數(shù)則會(huì)使聲音信號(hào)的頻譜泄漏比較嚴(yán)重。綜合考慮下來,雖然漢明窗主瓣寬度是矩形窗主瓣寬度的兩倍,但是漢明窗的旁瓣衰減加大(上表中漢明窗的旁瓣峰值為41dB )。因而漢明窗具有更為平滑的低通特性,可以在較高程度上反映短時(shí)聲音信號(hào)的頻率特性。因此在本文的實(shí)驗(yàn)中,選取漢明窗作為窗函數(shù)。重慶大學(xué)碩士學(xué)位論文 4 特征參數(shù)提取274 特征參數(shù)提取特征參數(shù)提取 [22]就是指從歌唱者的聲音信號(hào)中獲得一組能夠描述聲音信號(hào)特征參數(shù)的過程。聲音信號(hào)特征參數(shù)主要可以分為3類:時(shí)域參數(shù)、頻域參數(shù)和倒頻譜參數(shù)。聲音信號(hào)的時(shí)域分析就是指對(duì)聲音信號(hào)的時(shí)域參數(shù)進(jìn)行分析和提取。而在我們對(duì)聲音信號(hào)進(jìn)行分析時(shí),最先觀察到的就是聲音信號(hào)的時(shí)域波形。本質(zhì)上來說,聲音信號(hào)本身其實(shí)就可以看作是時(shí)域信號(hào),因此我們也最早
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1