【正文】
b 和其他高級語言也具有良好的接口,可以方便的實(shí)現(xiàn)與其他語言的混合編程 [3]。 人工神經(jīng)元網(wǎng)絡(luò)在語音識別中的應(yīng)用是現(xiàn)在研究的又一熱點(diǎn)。 模式匹配及模型訓(xùn)練技術(shù) 模型訓(xùn)練是指按照一定的準(zhǔn)則,從 大量已知模式中獲取表征該模式本質(zhì)特征的模型參數(shù),而模式匹配則是根據(jù)一定準(zhǔn)則,使未知模式與模型庫中的某一個模型獲得最佳匹配。語音識別單元有單詞(句)、音節(jié)和音素三種,具體選擇哪一種,由具體的研究任務(wù)決定 [4]。 可行性分析 語音識別有兩種特殊形式:說話人識別和語種辨別,它們和語音識別一樣,都是通過提取語音信號的特征和建立相應(yīng)的模型進(jìn)行分類判斷的 [12]。通過語音傳遞信息是人類最重要、最有效、最常用和最方便的信息交換形式 [12]。 在該項(xiàng)目中 綜合應(yīng)用傳感器技術(shù),數(shù)字仿真技術(shù),數(shù)據(jù)編碼與數(shù)據(jù)壓縮技術(shù), DSP 技術(shù),無線傳輸技術(shù)等,研究自然保護(hù)區(qū)視頻信號、聲音信號以及其他監(jiān)測信號的采集、傳送、處理方案,設(shè)備選型方案,二次開發(fā)技術(shù),為自然保護(hù)區(qū)信息系統(tǒng)建設(shè)。特定聲音是指因?yàn)檎Z音數(shù)據(jù)庫的不完善,只能正確的識別大象在特定情緒下的語音。原因在于漢語音節(jié)僅由聲母(包括零聲母有 22 個)和韻母(共有 28 個)構(gòu)成,且聲韻母聲學(xué)特性相差很大。因?yàn)閷τ谶B續(xù)西南林學(xué)院 2021屆本科畢業(yè)論文 5 語音識別系統(tǒng)來講,如果選擇詞,詞組,短語甚至整個句子作為識別單位,為每個詞條建立一個模板,那么隨著系統(tǒng)用詞量的增加,模板的數(shù)量將達(dá)到天文數(shù)字,而這在實(shí)際應(yīng)用中是不可能被允許出現(xiàn)的情況。輸入的模擬語音信號首先要經(jīng)過預(yù)處理,包括預(yù)濾波,采樣和量化,加窗,端點(diǎn)檢測,預(yù)加重等。距離函數(shù)處決于實(shí)際采用的距離度量,在 DTW 算法中通常采用歐氏距離。 DTW 算法實(shí)現(xiàn) 算法簡介 首先申請兩個 *nm的矩陣 D 和 d,分別為累計(jì)距離和幀匹配距離。 但在實(shí)際進(jìn)行的語音識別測試中,待測模板和參考模板語音幀長的最大差距不能到達(dá)理論的最大值。為了得到一個好的模板,往往需要有大量 的原始語音數(shù)據(jù)來訓(xùn)練語音模型。 例如,在對象群的追蹤中,就可以采取個別個體的特定語音識別的方法,重點(diǎn)就是要最大限度的搜集象群中頭象的聲音特征 數(shù)據(jù),以后一旦發(fā)現(xiàn)頭象的蹤跡,即可認(rèn)為是發(fā)現(xiàn)了象群的蹤跡。 if j1 D2 = D(i1,j1)。 % soundview(x)。正在計(jì)算匹配結(jié)果 ...39。 test(i).mfcc = m。,i)。 m = size(r,1)。 首先, 對人類的聽覺理解、知識積累和學(xué)習(xí)機(jī)制以及大腦神經(jīng)系統(tǒng)的控制機(jī)理等分面的認(rèn)識還很不清楚;其次,把這方面的現(xiàn)有成果用于語音識別,還有一個艱難的過程 [6]。然后,據(jù)此模板的定義,通過查表就可以給出計(jì)算機(jī)的識別結(jié)果。 DTW 算法的測試程序 代碼詳見附件。對于,其可達(dá)到該格點(diǎn)的前一個格點(diǎn)只可能是 ( 1in? , im )、 ( 1in? , 1im? )和 ( 1in? , 2im? ),那么 ( in , im )一定選擇這 3 個距離中的最小者所對應(yīng)的格點(diǎn)作為其前續(xù)格點(diǎn),若用( 1in? , 1im? )代表此格點(diǎn),并將通過該格點(diǎn)之路延伸而通過,這時此路徑的積累距離為: iD[(n , )]im = 11[ ( ) , ( ) ] [ ( , ) ]i i i id T n R m D n m??? 其中的 in1? = in1? , i 1m? 由下式?jīng)Q定 : 11[( , )]iiD n m??= i 1 1 1m in{D [ ( n , ) ] , [ ( , 1 ) ] , [ ( , 2 ) ] }i i i i im D n m D n m???? 這樣可以從出發(fā)搜索,在搜索,對每一個都存儲相應(yīng)的前一格點(diǎn)及相應(yīng)的幀匹配距離。 Matlab 是一種解釋性執(zhí)行語言,具有強(qiáng)大的計(jì)算、仿真、繪圖等功能,而且使用簡單,擴(kuò)充方便,同時因?yàn)橛胸S富的函數(shù)庫(工具箱)所以計(jì)算的功能實(shí)現(xiàn)也很簡單。于是,將語音識別專家提出的 “區(qū)別性特征 ”與來自 構(gòu)詞,句法,語義等語用約束相互結(jié)合,就可以構(gòu)成一個 “由底向上 ”或 “自頂向下 ”的交互作用的知識系統(tǒng),不同層次的知識可以用若干規(guī)則來描述。實(shí)驗(yàn)證明,采用這種技術(shù),語音識別系統(tǒng)的性能有一定提高。 語音識別單元的選取 選擇識別單元是語音識別研究的第一步。 該課題 的目標(biāo)是基于研究內(nèi)容的第一點(diǎn)實(shí)現(xiàn) 野生大象的語音識別。 關(guān)鍵詞: 語音識別 DTW MATLAB 動態(tài)規(guī)劃 VoiceIdentification Based on DTW Model Dan Peng (Dept. of Computer and Information Science, Southwest Forestry College, Kunming, Yunan, 650224, China) Abstract: Voiceidentification is a kind of technology that is using puter to transfer the voice signal to an associated text or mand by identification and understand. In this paper, DTW arithmetic is adapted to study and research the implement the identification of singleword, and Speech recognition for singleword is realized by using MATLAB. In the end, this paper gets a conclusion on the feature and the shortage of DTW. DTW arithmetic based on the method of DP has solved the problem that the voice has different time during the template matching. This paper also put forward so me advises about DP. Key words: VoiceIdentification DTW MATLAB DP 目 錄 引言 ............................................................................................................................................................................1 1 開發(fā)背景及可行性分析 ......................................................................................................................................1 開發(fā)背景 ........................................................................................................................................................1 可行性分析 ...................................................................................................................................................2 2 語音識別基礎(chǔ) .......................................................................................................................................................2 語音 識別概述 ...............................................................................................................................................2 語音識別系統(tǒng)分類 ................................................