freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于特征參數(shù)在歌唱比賽評(píng)分方法中的研究-畢業(yè)論文(專業(yè)版)

2025-08-08 20:42上一頁面

下一頁面
  

【正文】 矩形窗和漢明窗函數(shù)的頻域特性 frequency domain characteristics of rectangular and hamming window functions窗函數(shù)名稱 旁瓣峰值 主瓣峰值矩形窗函數(shù) 13dB 4 /N?漢明窗函數(shù) 41dB 8 /N重慶大學(xué)碩士學(xué)位論文 3 聲音信號(hào)預(yù)處理26從表中可以看出,矩形窗的主瓣寬度比較小,聲音矩形窗具有較高的頻譜分辨率;但是矩形窗的旁瓣峰值較大,所以如果將矩形窗作為窗函數(shù)則會(huì)使聲音信號(hào)的頻譜泄漏比較嚴(yán)重。否則,如果采樣頻率不滿足恩奎斯特采樣定理,則會(huì)產(chǎn)生頻譜混疊的現(xiàn)象,而此時(shí)的聲音信號(hào)中的高頻成分將會(huì)產(chǎn)生失真。對(duì)于聲音信號(hào)的預(yù)加重處理我們可以通過一階高通數(shù)字濾波器進(jìn)行實(shí)現(xiàn): ( )1()Hz???其中 , 值設(shè)置越大對(duì)高頻分量幅度的提升就會(huì)越大。聲音強(qiáng)度是一個(gè)客觀的物理量,其常用單位為“分貝(db) ”。在此后的幾年中,線性預(yù)測(cè)(LP)被應(yīng)用到了許多科學(xué)研究和應(yīng)用工程領(lǐng)域。基音頻率體現(xiàn)了說話人在發(fā)音過程中,人的自身聲帶產(chǎn)生的有周期性振動(dòng)的特點(diǎn),基音頻率可以很好地刻畫出說話者的聲帶特性。其中濁音信號(hào)具有較強(qiáng)的周期特性。這種差異主要是由歌唱者的速率、歌唱者的情緒、歌唱者周圍的環(huán)境、錄音設(shè)備和傳輸信道的失真等因素引起的。譜號(hào)有三種:高音譜號(hào),又稱 G 譜號(hào),低音譜號(hào),又稱 F 譜號(hào),中音譜號(hào),又稱 C 譜號(hào)。加蘭、A樂譜的分類:中國(guó)古代就有“ 宮,商,角( jue) ,徵(zhi) ,羽”五音,對(duì)應(yīng)簡(jiǎn)譜中的 1 2 3 5 6,是樂譜的基本音符,在譜曲時(shí)古曲用這五個(gè)音。音色一般由3個(gè)因素重慶大學(xué)碩士學(xué)位論文 2 相關(guān)的理論知識(shí)和概念10決定:發(fā)聲體,由不同的發(fā)聲體產(chǎn)生的聲音顯然不會(huì)相同,比如笛子和簫,雖然兩者外表看起來比較相似,但是卻能產(chǎn)生的不同風(fēng)格的聲音;聲道的自身特點(diǎn),就好比笛子本身,我們可以通過手指來按放笛子上的氣孔(相當(dāng)于改變了笛子的聲道)從而產(chǎn)生不同的聲音;傳氣方式,又如口風(fēng)琴,雖然是同一個(gè)琴孔,但是分別采用吹氣和吸氣而產(chǎn)生的聲音也是不相同的。頻率較低時(shí),基膜振動(dòng)的幅度峰值出現(xiàn)在基膜的頂部附近。最后,在口腔旁邊的軟腭如前面所敘述的,是負(fù)責(zé)控制是否需要配合發(fā)出鼻音的閥門。在人們說話的時(shí)候,聲門處的氣流因?yàn)闆_激聲帶而產(chǎn)生振動(dòng),接下來氣流經(jīng)過聲道的一系列響應(yīng)而產(chǎn)生語音。相應(yīng)地,人類在講話的時(shí)侯在呼氣方面所耗費(fèi)的時(shí)間會(huì)比吸氣所耗費(fèi)的時(shí)間較長(zhǎng),一般來說大約可以占到人們整個(gè)呼吸周期時(shí)長(zhǎng)的 80%左右。這 3 種特性對(duì)應(yīng)著人耳對(duì)聲音信號(hào)的音調(diào)、音強(qiáng)和音色這三種主觀感覺的描述。本文具體的章節(jié)結(jié)構(gòu)如下:①第一章:闡述了本文所涉及領(lǐng)域的現(xiàn)狀以及現(xiàn)在所存在的問題,以及本文產(chǎn)生的背景及其本文所做研究的實(shí)際意義;②第二章:介紹了在本文中需要涉及到的一些基本概念知識(shí)。而本文提出的觀點(diǎn)就正是為了解決這個(gè)衡量參賽選手的唱功方面很有爭(zhēng)議的問題,分別從選手的音調(diào)、音準(zhǔn)、音律,音強(qiáng)方面給出一個(gè)具體的評(píng)價(jià)值,在根據(jù)這些具體得出的評(píng)價(jià)值按照事先制定好的評(píng)分方法給出一個(gè)最后的綜合分?jǐn)?shù),即選手的最終得分。由于歌唱難度受歌唱音量的影響,所以歌唱音量與歌唱得分成正比關(guān)系。本文通過對(duì)聲樂相關(guān)資料進(jìn)行研究和分析,并且還請(qǐng)教了若干音樂和歌唱方面的專業(yè)老師進(jìn)行交流和探討,選取音調(diào)、歌詞和音量等歌唱元素作為反映歌唱者唱功水平的評(píng)分指標(biāo)。人們現(xiàn)在對(duì)生活的需求已經(jīng)不僅僅體現(xiàn)在物質(zhì)上了。其選取的評(píng)分參數(shù)和給出的評(píng)價(jià)分?jǐn)?shù)并不能客觀準(zhǔn)確地反映出歌唱者的歌唱水平。聲波是聲音在物理學(xué)上的定義,在物理學(xué)上,聲音被定義為一種具有一定能量的波,它是由振動(dòng)物體所產(chǎn)生并且需要在一定的介質(zhì)中進(jìn)行傳播的。聲音主要是由從左右兩肺所呼出的氣流并且經(jīng)過位于咽喉直至嘴唇之間的重慶大學(xué)碩士學(xué)位論文 2 相關(guān)的理論知識(shí)和概念6所有的器官各種各樣的作用所產(chǎn)生的。我們把聲帶每次張開與閉合一次所耗費(fèi)的時(shí)間(即聲帶的振動(dòng)周期)稱為基音周期。咽腔與口腔一起共同發(fā)揮作用,這樣可以使我們聲道的形狀變化多種多樣,所以人類可以發(fā)出各種不同的聲音。中耳的主要作用是進(jìn)行聲音阻抗的變換,即將中耳兩端的聲音阻抗匹配起來,在一定的聲音強(qiáng)度范圍內(nèi),聽小骨對(duì)聲音進(jìn)行線性傳遞,而在聲音強(qiáng)度特別大的情況下,聽小骨則對(duì)聲音進(jìn)行非線性傳遞,這樣可以對(duì)內(nèi)耳起到保護(hù)的作用。② 清音清音主要是有位于聲道的某個(gè)收縮區(qū)的湍流(類似噪音)激勵(lì)而形成的。 樂譜在介紹人的歌唱聲音信號(hào)中所涉及到的特征參數(shù)之前,先需要了解一些有關(guān)音樂方面的樂譜知識(shí)。17 世紀(jì)時(shí)法國(guó)天主教方濟(jì)名會(huì)教士J而五線譜,通過以西方為中心的音樂教育體制,已基本通行于各個(gè)國(guó)家,在學(xué)校里已是必修項(xiàng)目之一,它為世界音樂統(tǒng)一于一種曲譜提供了基礎(chǔ)。每種音符及其耗時(shí)情況如下表所示: 音符與節(jié)拍對(duì)應(yīng)關(guān)系 correspondence between note and beat音符 5 5節(jié)拍 1 拍 1/2 拍 1/4 拍其中 ,上面的點(diǎn)表示音高在此基礎(chǔ)上上升一個(gè)音階;右邊的點(diǎn)表示此5?A音調(diào)要延長(zhǎng)之前所占音長(zhǎng)的二分之一(1/2) 。發(fā)聲物體振動(dòng)得越快,其頻率就越高;發(fā)聲物體振動(dòng)得越慢,其頻率就越低。當(dāng)空氣流通過聲門時(shí)聲帶會(huì)發(fā)生張馳性的振蕩式振動(dòng),產(chǎn)生出準(zhǔn)周期的空氣脈沖,這樣的脈沖就會(huì)激勵(lì)聲道從而產(chǎn)生語音中的濁音。通俗的說就是:人們可以在非常寧?kù)o的情況下聽見一個(gè)聲音信號(hào)強(qiáng)度比較弱的聲音;但是如果是換作在嘈雜的環(huán)境下,就不一定可以聽見之前相同聲音信號(hào)強(qiáng)度的聲音了;除非增強(qiáng)此聲音的信號(hào)強(qiáng)度。所以,只需要用激勵(lì)模型、聲道模型和輻射模型這三個(gè)數(shù)學(xué)子模型就可以聯(lián)合表示一個(gè)完整的聲音信號(hào)產(chǎn)生系統(tǒng)的數(shù)學(xué)模型。本文給出的歌唱評(píng)分方法主要技術(shù)流程如下圖所示:特征參數(shù)提取特征矢量匹配(DTW)評(píng)分機(jī)制聲音預(yù)處理特征參數(shù)提取聲音預(yù)處理評(píng)價(jià)分?jǐn)?shù)標(biāo)準(zhǔn)模板待測(cè)模板圖 評(píng)分方法技術(shù)路線圖 technical line of scoring method從上圖我們可以看出,在對(duì)聲音信號(hào)做特征參數(shù)提取、特征矢量匹配以及歌唱評(píng)分之前還需要對(duì)標(biāo)準(zhǔn)模板和待測(cè)模板進(jìn)行必要的預(yù)處理。分幀有兩種情況:連續(xù)分幀和交疊分幀。這兩種窗函數(shù)的定義分別為:①矩形窗: ( )101()nNn????????其 它其中N為每幀的采樣點(diǎn)數(shù)。而在我們對(duì)聲音信號(hào)進(jìn)行分析時(shí),最先觀察到的就是聲音信號(hào)的時(shí)域波形。此外,對(duì)聲音信號(hào)進(jìn)行加窗還有很多其它的原因,如減少噪聲干擾、限定測(cè)試的持續(xù)時(shí)間、從頻率接近的信號(hào)中分離出幅值不同的信號(hào)等等。于是我們可以把每個(gè)短時(shí)的語音段稱為一個(gè)分析幀,幀是進(jìn)行短時(shí)語音分析的長(zhǎng)度單位。音樂作品中的強(qiáng)弱變化叫做 力度 ,用文字或符號(hào)來標(biāo)明,如 f(強(qiáng))、p(弱)等。由此,我們可以知道聲音信號(hào)產(chǎn)生系統(tǒng)分為三部分:“聲門子系統(tǒng)” ,此系統(tǒng)主要分布在聲門(聲帶)以下的部位,“聲門子系統(tǒng) ”主要的功能是負(fù)責(zé)產(chǎn)生激勵(lì)振動(dòng),相當(dāng)于聲音信號(hào)產(chǎn)生系統(tǒng)中的“激勵(lì)系統(tǒng) ”;而“聲道系統(tǒng)”是指從聲門直到嘴唇之間的呼吸通道的這一部分組織;語音信號(hào)會(huì)從嘴唇輻射出去,所以嘴唇以外相當(dāng)于聲音信號(hào)產(chǎn)生系統(tǒng)中的“輻射系統(tǒng) ”。并且高頻率的聲音信號(hào)更加容易被低頻率的聲音信號(hào)所掩蔽,而高頻率的聲音信號(hào)對(duì)于低頻率的聲音信號(hào)的掩蔽效應(yīng)則不是那么明顯。因此,基音頻率就成為了我們考察歌唱者是否完整正確地將整首歌曲的音調(diào)演繹完美的參考特征參數(shù)。常用的倒頻譜系數(shù)有:線性預(yù)測(cè)倒頻譜系數(shù)(LPCC)和 Mel 倒頻譜系數(shù)(MFCC ) 。 “手臂抬放的時(shí)間 ”即開始時(shí)手臂放在桌上做舉手狀,然后將手臂向前伸直直至平放在桌面,最后將手臂向上抬升,直到恢復(fù)到初始狀的動(dòng)作所經(jīng)歷的時(shí)間。1904 年沈心工編著出版的《學(xué)校唱歌集》是中國(guó)最早自編的一本簡(jiǎn)譜歌集;之后逐步普及到各地的學(xué)校,30 年代隨著救亡歌詠運(yùn)動(dòng)的開展,簡(jiǎn)譜得以在群眾中廣泛流傳。每一個(gè)數(shù)字的時(shí)值名相當(dāng)于五線譜的 4 分音符。一般來說,聲波的幅度越大則聲音強(qiáng)度越大,聲音強(qiáng)度就越大;聲波的幅度越小,聲音強(qiáng)度就越小。當(dāng)聲帶開啟的時(shí)候,空氣流會(huì)從聲門處噴射出來,從而形成一個(gè)脈沖,聲門的閉合時(shí)相當(dāng)于脈沖序列之間的間隙。聽小骨(主要包含錘骨、砧骨和鐙骨)和咽鼓管組成了我們的中耳部分。與發(fā)聲有關(guān)的咽腔則是指連接喉嚨、食管與口腔、鼻腔之間的一段管狀組織。其中,我們把左右兩邊聲帶之間的部分稱為聲門,由兩個(gè)溝狀的軟骨組織負(fù)責(zé)控制聲門的開啟和關(guān)閉,它可以使聲門呈類似于“A”的形狀開啟或者關(guān)閉,在人們講話時(shí)聲帶會(huì)在合攏的狀態(tài)下因受到聲門之中傳來的氣流沖激而向兩邊張開,也可以根據(jù)聲帶自身固有的韌性并且加上兩肺之中的氣壓發(fā)生下降而又能迅速地閉合,接下來又可以不斷重復(fù)張開與閉合的動(dòng)作。 聲音信號(hào)產(chǎn)生的原理人類身體器官中負(fù)責(zé)發(fā)出聲音的器官主要有:口、鼻、聲帶、咽喉、氣管以及肺,這些器官相互有機(jī)地組合在一起,構(gòu)成了人類的發(fā)聲系統(tǒng)(如圖 ) 。重慶大學(xué)碩士學(xué)位論文 2 相關(guān)的理論知識(shí)和概念52 相關(guān)的理論知識(shí)和概念在明確了本文的基本思想路線和主要工作以后,首先就需要對(duì)一些聲音信號(hào)方面的基本原理、聲音信號(hào)的一些物理特性還有關(guān)于音樂和歌唱方面的基本概念以及本文的歌唱評(píng)分方法中所涉及到的一些特征參數(shù)進(jìn)行了解。這些軟件大多數(shù)都是為了提高其產(chǎn)品功能的多樣性,增加產(chǎn)品宣傳的噱頭??梢娺M(jìn)行語音處理技術(shù)的研究對(duì)于促進(jìn)整個(gè)社會(huì)的蓬勃發(fā)展具有非常重要的現(xiàn)實(shí)意義。另一方面,現(xiàn)在也有一些自娛自樂歌唱評(píng)分軟件,但是存在著歌唱參數(shù)選擇不合理的問題,使最后的評(píng)分結(jié)果不合理或者存在著一定的局限性。通過 MATLAB 仿真,實(shí)驗(yàn)表明:本文評(píng)分方法可以較好的反映出歌唱者對(duì)于歌曲音調(diào)、歌詞等方面的水平,所得出的評(píng)價(jià)結(jié)果與人們的主觀感覺保持一致。 已有的歌唱評(píng)分系統(tǒng)曾經(jīng)在 90 年代初國(guó)內(nèi)相繼出現(xiàn)來很多的歌唱比賽評(píng)分軟件,如卡拉蜂,是一個(gè)在線歌唱比賽評(píng)分軟件,需要上網(wǎng)下載特殊格式的播放文件,并在線使用該軟件,不過一般這類軟件的評(píng)分功能都是象征性的,分?jǐn)?shù)是按照你每首歌的完成度來算的。將上一章中分別提取的標(biāo)準(zhǔn)模板的特征參數(shù)和提取到的歌唱者聲音信號(hào)的特征參數(shù)通過使用動(dòng)態(tài)時(shí)間規(guī)整方法(DTW)進(jìn)行對(duì)比,并且根據(jù)對(duì)比的結(jié)果結(jié)合評(píng)分公式得出一個(gè)具體分?jǐn)?shù)。聲音以聲波的形式傳播。 “咽喉”則是由許多軟骨所構(gòu)成的。其中人們的聲道形狀以及固有的特點(diǎn)則主要是由人的嘴唇、舌頭和腭的大小和位置共同來決定的。綜上所述,在聲門和聲帶之后,聲道是人們發(fā)聲器官中最重要的,對(duì)發(fā)聲起到了決定性作用的器官。如果所接收到的聲音信號(hào)是一個(gè)多頻率的復(fù)合聲音信號(hào),則產(chǎn)生的聲波將沿著基膜在不同位置產(chǎn)生相應(yīng)大的振幅。音調(diào)一般與聲音的頻率有關(guān),頻率越高,聽到的聲音音調(diào)就越高;頻率越低,相應(yīng)地聽到的聲音音調(diào)就越低。如云南民歌《小河淌水》就是這樣譜曲的,整首歌里沒 47 兩種音出現(xiàn),是傳統(tǒng)民歌。J女高音譜表現(xiàn)已不常應(yīng)用,中音譜表僅用于中提琴,次中音譜表常用于大提琴、大管、長(zhǎng)號(hào)的較高音區(qū)。這類特征不易被模仿,但容易受健康的影響。此外,時(shí)變性和準(zhǔn)周期性也是基音頻率所具有的特性,通常來說,發(fā)音者聲帶的長(zhǎng)短、厚薄、韌性、發(fā)音習(xí)慣以及發(fā)音者的性別、年齡、發(fā)音時(shí)所用的力度及情感也與基音頻率的大小有關(guān)。 梅爾倒頻譜系數(shù)梅爾倒頻譜系數(shù)是一種從人耳對(duì)聲音頻率的非線性的心理感覺角度反映語音特征的特征參數(shù),它充分考慮了人耳的聽覺特性,它與普通的頻率成非線性對(duì)應(yīng)關(guān)系,并且具有較高的抗噪性和穩(wěn)定性等特點(diǎn),所以被廣泛地應(yīng)用于語音信號(hào)處理中。線性預(yù)測(cè)作為一種特征參數(shù)提取方法,到目前為止幾乎已經(jīng)被普遍地應(yīng)用到了語音信號(hào)處理的各個(gè)方面。例如:在夜深人靜時(shí),樹葉的碰撞聲、動(dòng)物的呼吸聲大約20dB聲壓級(jí);兩人正常的談話聲約60dB聲壓級(jí);大聲喊叫約85dB聲壓級(jí);汽車?guó)Q喇叭、火車通過聲約100dB聲壓級(jí);飛機(jī)起飛的聲音約120dB聲壓級(jí)。?用MATLAB進(jìn)行仿真,對(duì)實(shí)例音樂文件進(jìn)行預(yù)加重,其預(yù)加重之前和預(yù)加重之后的信號(hào)頻譜圖分別如下:圖 聲音原始信號(hào)圖 original signal of sound圖 聲音信號(hào)加重圖 aggravation of sound signal從以上兩幅圖像中,我們可以看出,在對(duì)聲音信號(hào)進(jìn)行加重處理以后,背景噪音被進(jìn)一步減弱,有效聲音信號(hào)變得更加清晰,主要的發(fā)聲片段也可以一目了然。對(duì)示例音樂文件進(jìn)行分幀后的結(jié)果如下圖所示:圖 分幀效果圖 effect of framing從上圖得到的聲音信號(hào)部分分幀效果圖中可以看到,一個(gè)連續(xù)的音樂文件被分成了許多個(gè)大小為幀長(zhǎng)(32ms)的片段。因而漢明窗具有更為平滑的低通特性,可以在較高程度上反映短時(shí)聲音信號(hào)的頻率特性。對(duì)于頻域分析,加窗相當(dāng)于語音信號(hào)的頻譜與窗函數(shù)頻譜的卷積,選擇的窗函數(shù)希望具有較窄的主瓣寬度以及較小的旁瓣峰值。而為了實(shí)現(xiàn)更加高質(zhì)量的語音合成結(jié)果或者需要使語音識(shí)別系統(tǒng)可以達(dá)到更高的語音識(shí)別成功率,某些現(xiàn)代語音處理系統(tǒng)的語音高端頻率甚至?xí)U(kuò)展到79kHz,所以相應(yīng)的采樣頻率也需要提高到1520kHz。 聲音信號(hào)預(yù)加重由于聲音信號(hào)在其產(chǎn)生以后,其平均功率譜會(huì)因?yàn)槭艿铰曢T激勵(lì)和發(fā)音者口、鼻輻射的影響,聲音信號(hào)的高頻部分大約會(huì)在800Hz以上按照6dB/ 倍頻程衰減,因此我們對(duì)于所接收到的聲音信號(hào),其頻率越高則其相應(yīng)的成分就會(huì)衰減得越多,所以會(huì)導(dǎo)致高頻部分的頻譜會(huì)比低頻部分的頻譜更弱,以至于影響我們對(duì)聲音信號(hào)中高頻部分頻譜的分析,所以我們需要在對(duì)聲音信號(hào)的預(yù)處理中對(duì)聲音信號(hào)進(jìn)行預(yù)加重處理。由于梅爾倒頻譜系數(shù)(MFCC)充分模擬了人的聽覺特性,并且
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1