freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于特征參數(shù)的歌唱評(píng)分方法研究畢業(yè)論文(參考版)

2025-06-30 20:36本頁(yè)面
  

【正文】 由于平均幅值差法(AMDF法)在具有噪音并且語(yǔ)速、音調(diào)變化較快的情況下性能較差,以及倒譜法會(huì)因?yàn)樵胍舻挠绊懚蟠蠼档突纛l率提取的準(zhǔn)確率,甚至?xí)霈F(xiàn)嚴(yán)重誤差;鑒于在本論文中的實(shí)驗(yàn)環(huán)境是在普通的房間里而且實(shí)驗(yàn)設(shè)備也比較簡(jiǎn)單和落后(),再加上本文中基音頻率提取的對(duì)象是歌曲,所以本文采用自相關(guān)法(ACF法)來(lái)進(jìn)行基音頻率的提取。雖然利用這種方法進(jìn)行提取基音頻率的效果較好,但倒譜分析算法比較復(fù)雜并且計(jì)算量較大。這些提取基音頻率的方法大致分為3類(lèi): ①波形估計(jì)法:直接根據(jù)語(yǔ)音信號(hào)的波形來(lái)估計(jì)基音周期,分析出波形上的周期峰值; ②相關(guān)處理法:相關(guān)處理法是在語(yǔ)音信號(hào)處理中使用得最廣泛的基音頻率提取方法,主要是因?yàn)橄嚓P(guān)處理法具有較強(qiáng)的抗波形相位失真的特性,另外相關(guān)處理法在硬件的實(shí)現(xiàn)上可以做到結(jié)構(gòu)簡(jiǎn)單、容易實(shí)現(xiàn)。 多種基音頻率的提取方法盡管對(duì)于基音頻率的提取存在著很多的困難,但由于提取基音頻率的重要性,基音頻率的提取一直是一個(gè)重要的研究熱點(diǎn)。綜上所述,無(wú)論是在語(yǔ)音信號(hào)的分析與合成,語(yǔ)音文件的壓縮編碼與解碼,還是語(yǔ)音識(shí)別以及說(shuō)話(huà)者的確認(rèn)等語(yǔ)音信號(hào)數(shù)字處理的各個(gè)領(lǐng)域,能否準(zhǔn)確有效地檢測(cè)基音周期都將直接影響到整個(gè)語(yǔ)音信號(hào)數(shù)字處理系統(tǒng)的性能。因此語(yǔ)音合成的一項(xiàng)重要基礎(chǔ)工作就是需要對(duì)語(yǔ)音信號(hào)中的聲調(diào)信息進(jìn)行分析和識(shí)別,而且在有效開(kāi)展這項(xiàng)工作之前的前提準(zhǔn)備工作就是要準(zhǔn)確、有效地提取語(yǔ)音信號(hào)的基音周期。而在語(yǔ)音信號(hào)的特征參數(shù)提取中,基音周期的提取是一個(gè)關(guān)鍵點(diǎn),基音周期是否能夠準(zhǔn)確提取將直接影響到合成后的語(yǔ)音文件是否能夠完整、真實(shí)地再現(xiàn)原始語(yǔ)音信號(hào)的頻譜。而基音頻率則可以作為是確定各種聲調(diào)特征的一個(gè)重要特征參數(shù),因此對(duì)語(yǔ)音信號(hào)中基音頻率的有效提取,在語(yǔ)音識(shí)別領(lǐng)域中具有非常重要的意義。所以,我們可以通過(guò)大大提高計(jì)算機(jī)對(duì)語(yǔ)音聲調(diào)特征的識(shí)別能力來(lái)達(dá)到計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的語(yǔ)音智能化。首先,對(duì)于帶有聲調(diào)的語(yǔ)言(比如漢語(yǔ)),我們知道聲調(diào)也是語(yǔ)言文字意思的重要組成部分,我們可以把說(shuō)話(huà)者語(yǔ)音信號(hào)中的聲調(diào)信息作為語(yǔ)音特征參數(shù)提取到語(yǔ)音識(shí)別系統(tǒng)的語(yǔ)音識(shí)別特征參數(shù)向量中去,可以大大地減少需要識(shí)別的文字音節(jié),從而提高語(yǔ)音識(shí)別的精確度。正是由于存在以上的種種難點(diǎn),雖然提取基音頻率的方法有許多種,但是到目前為止還依然沒(méi)有找到一個(gè)可以對(duì)各類(lèi)人群(包括男人、女人、老人、兒童及不同語(yǔ)種的人群)以及在各種環(huán)境條件情況下都能比較準(zhǔn)確提取基音頻率的通用方法。④在實(shí)際應(yīng)用中,幾乎是無(wú)處不在的背景噪聲會(huì)大大地影響到基音頻率的提取。例如聲道的共振峰可能會(huì)在很大程度上改變聲門(mén)波形的形態(tài),從而嚴(yán)重地影響到激勵(lì)信號(hào)的諧波形態(tài),這些都會(huì)給基音頻率的提取造成困難。而且在語(yǔ)音信號(hào)的頭部和尾部并不具有像人的聲帶振動(dòng)那樣呈現(xiàn)出準(zhǔn)周期性,并且有些清濁音的過(guò)渡幀存在很難判定它是否呈現(xiàn)有周期性的情況,以上這些情況都會(huì)對(duì)基音頻率的計(jì)算帶來(lái)一定的困難。因此,基音頻率就成為了我們考察歌唱者是否完整正確地將整首歌曲的音調(diào)演繹完美的參考特征參數(shù)。 基音頻率的提取人們?cè)诔璧臅r(shí)候,由于歌詞中的每個(gè)字都有它對(duì)應(yīng)的音調(diào),這就需要歌唱者在歌唱此歌曲的時(shí)候,要將每個(gè)字的音調(diào)都要唱準(zhǔn),不能唱跑調(diào)。通過(guò)不斷地實(shí)驗(yàn)和探索, 人們發(fā)現(xiàn)聲音信號(hào)是聲道頻率特性和激勵(lì)信號(hào)源兩者的共同結(jié)果, 后者對(duì)于某一信號(hào)來(lái)說(shuō)常帶有一定的隨機(jī)性, 而歌唱者的聲音個(gè)性特征在很大程度上取決于歌唱者的發(fā)聲聲道。同態(tài)信號(hào)處理也稱(chēng)為同態(tài)濾波,它實(shí)現(xiàn)了將卷積關(guān)系變換為求和關(guān)系的分離處理,即解卷。聲音信號(hào)的頻域分析主要包括有聲音信號(hào)的頻譜分析、功率譜分析、倒頻譜分析等,而頻域分析通常采用的方法主要有傅里葉變換法、線(xiàn)性預(yù)測(cè)法以及數(shù)字帶通濾波器組法等。因?yàn)槿祟?lèi)對(duì)于聲音信號(hào)的感知是與人類(lèi)自身的聽(tīng)覺(jué)系統(tǒng)具有頻譜分析的功能是緊密相關(guān)的,因此,我們?nèi)绻枰治龊吞幚砺曇粜盘?hào)也可以采用頻譜分析這種重要的聲音信號(hào)分析方法。聲音信號(hào)的時(shí)域參數(shù)主要有:短時(shí)能量、短時(shí)過(guò)零率、短時(shí)自相關(guān)函數(shù)以及短時(shí)平均幅度差函數(shù)等。而在我們對(duì)聲音信號(hào)進(jìn)行分析時(shí),最先觀(guān)察到的就是聲音信號(hào)的時(shí)域波形。聲音信號(hào)特征參數(shù)主要可以分為3類(lèi):時(shí)域參數(shù)、頻域參數(shù)和倒頻譜參數(shù)。因此在本文的實(shí)驗(yàn)中,選取漢明窗作為窗函數(shù)。綜合考慮下來(lái),雖然漢明窗主瓣寬度是矩形窗主瓣寬度的兩倍,但是漢明窗的旁瓣衰減加大(上表中漢明窗的旁瓣峰值為41dB )。給出矩形窗和漢明窗的頻域特性。對(duì)于時(shí)域分析,由于加窗的實(shí)質(zhì)是將聲音信號(hào)與窗函數(shù)進(jìn)行相乘,所以就要求可以盡量減小時(shí)域窗口兩端的坡度,使窗口兩端邊緣之間的銜接不會(huì)出現(xiàn)非常急劇地變化,加窗后的語(yǔ)音信號(hào)可以平滑過(guò)渡到零,減少語(yǔ)音分幀造成的截?cái)嘈?yīng)。窗函數(shù)的選擇,會(huì)在很大程度上很大影響短時(shí)分析特征參數(shù)的特性,因此需要選擇合適的窗函數(shù),使其短時(shí)參數(shù)可以更好地反映聲音信號(hào)的特征變化。這兩種窗函數(shù)的定義分別為:①矩形窗: ( )101()nNn????????其 它其中N為每幀的采樣點(diǎn)數(shù)。此外,對(duì)聲音信號(hào)進(jìn)行加窗還有很多其它的原因,如減少噪聲干擾、限定測(cè)試的持續(xù)時(shí)間、從頻率接近的信號(hào)中分離出幅值不同的信號(hào)等等。在信號(hào)處理中,可以說(shuō)加窗處理是一個(gè)很有必要的過(guò)程,因?yàn)槲覀兊挠?jì)算機(jī)只能處理有限長(zhǎng)度的信號(hào),所以要將原始信號(hào)S(t)要以T時(shí)間(采樣時(shí)間)截?cái)?,即有限化,成為ST(t)后再進(jìn)一步處理,這個(gè)過(guò)程序就是加窗處理。而這些幀長(zhǎng)片段的波形圖像,對(duì)應(yīng)著圖中多條不同的曲線(xiàn),圖中每一條曲線(xiàn)代表了其中某一幀的波形圖。 在本文中,由于聲音信號(hào)的輸入是采用電腦耳機(jī)上的麥克風(fēng),為了減少運(yùn)算量和程序運(yùn)行時(shí)間,語(yǔ)音采樣率為8000Hz,每幀有256個(gè)采樣點(diǎn),對(duì)應(yīng)的時(shí)間長(zhǎng)度為32ms ,幀移為半個(gè)幀長(zhǎng)。而在聲音信號(hào)的帶寬不明確時(shí),在對(duì)聲音信號(hào)進(jìn)行采樣前應(yīng)該接入反混疊濾波器(低通濾波器),使聲音信號(hào)的帶寬限定在某一個(gè)范圍內(nèi)。但是在某些實(shí)際語(yǔ)音信號(hào)的處理中,采樣頻率通常會(huì)取710kHz。根據(jù)恩奎斯特采樣定理:只有當(dāng)聲音信號(hào)的采樣頻率大于聲音信號(hào)的兩倍帶寬時(shí),在采樣的過(guò)程中才不會(huì)丟失聲音信號(hào)的信息,并且還可以從采樣所得到的聲音信號(hào)中做到精確地重構(gòu)原始聲音信號(hào)波形。分幀有兩種情況:連續(xù)分幀和交疊分幀。于是我們可以把每個(gè)短時(shí)的語(yǔ)音段稱(chēng)為一個(gè)分析幀,幀是進(jìn)行短時(shí)語(yǔ)音分析的長(zhǎng)度單位。由于人們發(fā)聲器官狀態(tài)的變化速度相比較于聲音的振動(dòng)速度要緩慢得多,因此我們可以認(rèn)為聲音信號(hào)在一段很短的時(shí)間內(nèi)是相對(duì)平穩(wěn)不變的,即具有短時(shí)穩(wěn)定性 [120] 。對(duì)原始聲音信號(hào)進(jìn)行預(yù)加重與處理,其目的是為了降低聲音信號(hào)中低頻部分和背景噪聲的干擾,并且也可以對(duì)本實(shí)驗(yàn)中的語(yǔ)音文件中的高頻部分進(jìn)行提升,重慶大學(xué)碩士學(xué)位論文 3 聲音信號(hào)預(yù)處理21更有利于接下來(lái)的一系列操作。?在語(yǔ)音信號(hào)處理中, 。預(yù)加重的目的是為了消除發(fā)聲過(guò)程中聲帶和嘴唇輻射的影響,補(bǔ)重慶大學(xué)碩士學(xué)位論文 3 聲音信號(hào)預(yù)處理20償語(yǔ)音功率譜的固有衰落和受發(fā)音系統(tǒng)所壓抑的高頻部分,凸顯在較高部分的基音頻率,以便于后續(xù)進(jìn)行的頻譜分析和特征參數(shù)提取。聲音信號(hào)的預(yù)處理過(guò)程包括預(yù)加重,分幀,加窗。因此聲音信號(hào)預(yù)處理在聲音信號(hào)的特征參數(shù)提取之中占有很重要的作用。本文給出的歌唱評(píng)分方法主要技術(shù)流程如下圖所示:特征參數(shù)提取特征矢量匹配(DTW)評(píng)分機(jī)制聲音預(yù)處理特征參數(shù)提取聲音預(yù)處理評(píng)價(jià)分?jǐn)?shù)標(biāo)準(zhǔn)模板待測(cè)模板圖 評(píng)分方法技術(shù)路線(xiàn)圖 technical line of scoring method從上圖我們可以看出,在對(duì)聲音信號(hào)做特征參數(shù)提取、特征矢量匹配以及歌唱評(píng)分之前還需要對(duì)標(biāo)準(zhǔn)模板和待測(cè)模板進(jìn)行必要的預(yù)處理。音樂(lè)作品中的強(qiáng)弱變化叫做 力度 ,用文字或符號(hào)來(lái)標(biāo)明,如 f(強(qiáng))、p(弱)等。由于人們的主觀(guān)感受強(qiáng)度受“頻率”和“音強(qiáng) ”兩方面的因素所影響,所以“宋” 被定義為40db1000Hz純音所引起的響度。但這還不是人耳對(duì)聲音強(qiáng)度反映的主觀(guān)量。聲音強(qiáng)度主要取決于聲波振動(dòng)幅度的大小,振幅越大,強(qiáng)度越大;振幅越小,強(qiáng)度越小。 聲音強(qiáng)度聲音強(qiáng)度是指聲音信號(hào)中主音調(diào)的強(qiáng)弱程度,是判別樂(lè)音的基礎(chǔ)。而LPCC的假定前提條件是所處理的語(yǔ)音信號(hào)是為自回歸的, 但是對(duì)于動(dòng)態(tài)特性較強(qiáng)的輔音信號(hào), 這個(gè)假設(shè)在要就比較嚴(yán)格的情況下是不能成立的。因?yàn)镸FCC與LPCC相比,具有以下的這些優(yōu)點(diǎn):①因?yàn)檎Z(yǔ)音信號(hào)中的語(yǔ)音信息主要是集中在語(yǔ)音信號(hào)的低頻部分, 而高頻部分則比較容易受到背景噪聲的影響, MFCC通過(guò)將線(xiàn)性頻譜轉(zhuǎn)化為Mel頻譜,更加強(qiáng)調(diào)了語(yǔ)音信號(hào)中低頻部分的信息,從而更加突出了易于識(shí)別的語(yǔ)音信號(hào)信息,對(duì)噪重慶大學(xué)碩士學(xué)位論文 2 相關(guān)的理論知識(shí)和概念18聲的干擾進(jìn)行了有效的屏蔽。所以,只需要用激勵(lì)模型、聲道模型和輻射模型這三個(gè)數(shù)學(xué)子模型就可以聯(lián)合表示一個(gè)完整的聲音信號(hào)產(chǎn)生系統(tǒng)的數(shù)學(xué)模型。由此,我們可以知道聲音信號(hào)產(chǎn)生系統(tǒng)分為三部分:“聲門(mén)子系統(tǒng)” ,此系統(tǒng)主要分布在聲門(mén)(聲帶)以下的部位,“聲門(mén)子系統(tǒng) ”主要的功能是負(fù)責(zé)產(chǎn)生激勵(lì)振動(dòng),相當(dāng)于聲音信號(hào)產(chǎn)生系統(tǒng)中的“激勵(lì)系統(tǒng) ”;而“聲道系統(tǒng)”是指從聲門(mén)直到嘴唇之間的呼吸通道的這一部分組織;語(yǔ)音信號(hào)會(huì)從嘴唇輻射出去,所以嘴唇以外相當(dāng)于聲音信號(hào)產(chǎn)生系統(tǒng)中的“輻射系統(tǒng) ”。通過(guò)確定一組唯一的線(xiàn)性預(yù)測(cè)系數(shù)使實(shí)際語(yǔ)音信號(hào)的樣本與線(xiàn)性預(yù)測(cè)樣本之間的誤差(方差)達(dá)到最小,語(yǔ)音信號(hào)的特性則在這組預(yù)測(cè)系數(shù)中得到了準(zhǔn)確有效的反映,這組預(yù)測(cè)系數(shù)也可以作為語(yǔ)音識(shí)別中所需要用到的語(yǔ)音信號(hào)特征參數(shù)。而且線(xiàn)性預(yù)測(cè)這種方法也是目前為止最為流行、最為有效的語(yǔ)音信號(hào)分析方法之一。板倉(cāng)等人在1967年首先將線(xiàn)性預(yù)測(cè)技術(shù)應(yīng)用到了語(yǔ)音信號(hào)的分析與合成中。1947年,研究人員維納首次提出線(xiàn)性預(yù)測(cè)(LP)這一術(shù)語(yǔ)。對(duì)于這個(gè)方面的特征參數(shù),主要可以參考:線(xiàn)性預(yù)測(cè)倒譜參數(shù)(LPCC)和梅爾倒頻譜系數(shù)(MFCC):①線(xiàn)性預(yù)測(cè)倒譜參數(shù)(LPCC) [35,36]的前提是假設(shè)語(yǔ)音信號(hào)為回歸信號(hào),通過(guò)利用線(xiàn)性預(yù)測(cè)分析提取出線(xiàn)性預(yù)測(cè)倒譜參數(shù)(LPCC)。所以梅爾倒頻譜系數(shù)更能反映出人耳的聽(tīng)覺(jué)特性。通俗的說(shuō)就是:人們可以在非常寧?kù)o的情況下聽(tīng)見(jiàn)一個(gè)聲音信號(hào)強(qiáng)度比較弱的聲音;但是如果是換作在嘈雜的環(huán)境下,就不一定可以聽(tīng)見(jiàn)之前相同聲音信號(hào)強(qiáng)度的聲音了;除非增強(qiáng)此聲音的信號(hào)強(qiáng)度。并且高頻率的聲音信號(hào)更加容易被低頻率的聲音信號(hào)所掩蔽,而高頻率的聲音信號(hào)對(duì)于低頻率的聲音信號(hào)的掩蔽效應(yīng)則不是那么明顯。根據(jù)人類(lèi)在生理學(xué)方面的研究,發(fā)現(xiàn)人耳對(duì)于不相同頻率的聲音信號(hào)是有著不同程度的聽(tīng)覺(jué)反應(yīng)度的。人耳具有一種特性,這種特性可以使人耳在繽紛嘈雜的環(huán)境中仍可以正常地分辨出各種語(yǔ)音信號(hào),其中起到關(guān)鍵作用的是耳蝸。因此,基音頻率是歌唱評(píng)分方法中的一個(gè)很重要的參考特征參數(shù),它的高低變化反映了歌唱者歌聲的音高起伏和語(yǔ)調(diào)韻律特點(diǎn)。一般來(lái)說(shuō),重慶大學(xué)碩士學(xué)位論文 2 相關(guān)的理論知識(shí)和概念15女性的音高比男性的高,兒童的音高比成年人的高。一般來(lái)說(shuō),物體振動(dòng)的頻率越高,人耳感受到的音高也越高;物體振動(dòng)的頻率越低,人耳感受到的音高也越低。相應(yīng)地,它的振動(dòng)頻率被稱(chēng)為“ 基頻”,即基音頻率 [23,24]。當(dāng)空氣流通過(guò)聲門(mén)時(shí)聲帶會(huì)發(fā)生張馳性的振蕩式振動(dòng),產(chǎn)生出準(zhǔn)周期的空氣脈沖,這樣的脈沖就會(huì)激勵(lì)聲道從而產(chǎn)生語(yǔ)音中的濁音。因此,基音頻率就成為了我們考察歌唱者是否完整正確地將整首歌曲的音調(diào)演繹完美的參考特征參數(shù)。也就是基頻變化軌跡則可以反映出說(shuō)話(huà)人的音調(diào)起伏和說(shuō)話(huà)過(guò)程的韻律變化。一般來(lái)說(shuō),男性發(fā)音者聲音的基音頻率的范圍大概會(huì)在50250Hz之間,而女性發(fā)音者和小孩子聲音的基音頻率的范圍大概則會(huì)在200500Hz之間。基音頻率決定了聲音的音高,基音頻率的高低變化反映了人們聲音的音調(diào)的高低變化,還可以反映說(shuō)話(huà)人的聲帶振動(dòng)的周期性,而這種周期性又主要出現(xiàn)在語(yǔ)音的濁音段。人的聲音一般分為2類(lèi):一種是清音,一種是濁音。這些振動(dòng)中有一個(gè)頻率最低、振幅最大的振動(dòng),由它發(fā)出的音就是基音,其余為泛音。則周期(T)與頻率(f)之間的關(guān)系為:T = 1/f。發(fā)聲物體振動(dòng)得越快,其頻率就越高;發(fā)聲物體振動(dòng)得越慢,其頻率就越低。常用的倒頻譜系數(shù)有:線(xiàn)性預(yù)測(cè)倒頻譜系數(shù)(LPCC)和 Mel 倒頻譜系數(shù)(MFCC ) 。代表性的特征參數(shù)是倒頻譜和基音的重慶大學(xué)碩士學(xué)位論文 2 相關(guān)的理論知識(shí)和概念14線(xiàn)性回歸系數(shù)。另一類(lèi)是聲道運(yùn)動(dòng)的動(dòng)態(tài)特征,也就是發(fā)聲方式、發(fā)聲習(xí)慣等。按照參數(shù)的穩(wěn)定性,歌唱者特征參數(shù)可大致分為兩類(lèi):一類(lèi)是歌唱者生理決定的固有特性(例如,聲道構(gòu)造的個(gè)性差異等) ,主要表現(xiàn)在歌唱者聲音信號(hào)的頻率結(jié)構(gòu)上,代表性的特征參數(shù)有基音頻率和聲音的共振峰。人不能將一句歌詞或一個(gè)音調(diào)完全一致地重復(fù)兩次,兩者之間總是有差異的。歌唱者之間的差異是由歌唱者不同的聲道特性產(chǎn)生的,正是這種差異將不同的歌唱者區(qū)分開(kāi)來(lái)。? 右邊的“ —”表示前部分的音符時(shí)間增加 1 拍。每種音符及其耗時(shí)情況如下表所示: 音符與節(jié)拍對(duì)應(yīng)關(guān)系 correspondence between note and beat音符 5 5節(jié)拍 1 拍 1/2 拍 1/4 拍其中 ,上面的點(diǎn)表示音高在此基礎(chǔ)上上升一個(gè)音階;右邊的點(diǎn)表示此5?A音調(diào)要延長(zhǎng)之前所占音長(zhǎng)的二分之一(1/2) 。 “手臂抬放的時(shí)間 ”即開(kāi)始時(shí)手臂放在桌上做舉手狀,然后將手臂向前伸直直至平放在桌面,最后將手臂向上抬升,直到恢復(fù)到初始狀的動(dòng)作所經(jīng)歷的時(shí)間。以上僅僅是作為我們大多數(shù)人可以從此音樂(lè)簡(jiǎn)譜圖得到的一下關(guān)于此樂(lè)譜的信息,如果我們對(duì)于樂(lè)譜還有一些了解的話(huà),我們還可以從中得知:其中 1=D4/4 代表此歌曲的節(jié)奏為 4/4 拍。此外還有上低音譜表、女中音
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1