freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語音識別dtw算法設(shè)計-免費閱讀

2025-07-12 17:13 上一頁面

下一頁面
  

【正文】 ,i,j)。catch breakendenddist=zeros(a1,b1)。,i)。 [x1 x2]=vad(x,fs)。global x2。[S,fs]=wavread(file)。39。guidata(hObject, handles)。guidata(hObject, handles)。168。*.wav39。% Executes on button press in pushbutton11.function pushbutton11_Callback(hObject, eventdata, handles)% hObject handle to pushbutton11 (see GCBO)% eventdata reserved to be defined in a future version of MATLAB% handles structure with handles and user data (see GUIDATA)global b。file=[L,fname]。Allfiles(*.*)39。global x2。str=strcat(pathname,filename)。39。axes()。 a=wavrecord(t*fs,fs)。end% End initialization code DO NOT EDIT% Executes just before GUI is made visible.function GUI_OpeningF(hObject, eventdata, handles, varargin)% This function has no output args, see OutputF.% hObject handle to figure% eventdata reserved to be defined in a future version of MATLAB% handles structure with handles and user data (see GUIDATA)% varargin mand line arguments to GUI (see VARARGIN)% Choose default mand line output for GUI = hObject。, [] , ... 39。, mfilename, ... 39。,hObject,eventData,handles,...) calls the local% function named CALLBACK in with the given input arguments.%% GUI(39。在本次設(shè)計中遇到的難題有很多。圖73運(yùn)行結(jié)果圖本設(shè)計采用端點檢測算法,再經(jīng)過特征提取,最后運(yùn)用DTW算法來實現(xiàn)語音的識別。待所有按鈕的功能的回調(diào)函數(shù)都編寫完畢后,點擊保存,然后點擊菜單欄中的三角形按鈕,則會彈出用戶開發(fā)界面,在該用戶開發(fā)界面中,用戶可以單擊按鈕以實現(xiàn)該按鈕所擁有的功能。它讓我們用戶自己定制MATLAB與用戶的交互方法,使命令窗口不是唯一與MATLAB的交互方式。接下來進(jìn)行動態(tài)規(guī)劃,為每個格點(i,j)都計算其三個可能的前續(xù)格點的累積距離1D,2D和3D。圖61 DTW原理圖由于在模板匹配過程中限定了彎折的斜率,因此平行四邊形之外的格點對應(yīng)的幀匹配距離是不需要計算的。若N=M則可以直接計算,否則要考慮將T(n)和R(m)對齊。不管是在測試和建立參考模塊還是在識別階段,語音的起點和終點都必須用端點檢測來確定。 n=0,1,…,N/21 M是濾波器的數(shù)目,通常取24;一幀語音信號的點數(shù)為N,通常取256,這樣計算FFT的方便。門限值的設(shè)置還沒有一個通用可靠的方法,需要根據(jù)經(jīng)驗和特定環(huán)境進(jìn)行調(diào)整。圖45 端點檢測結(jié)果雙門限端點檢測顧名思義需要兩級檢測,即短時能量檢測和短時過零率檢測。在本系統(tǒng)中經(jīng)多次試驗取定δ=。因此在許多場合會將En用下式來代替:這樣就不會因為取平方而造成信號的小取樣值的大取樣值出現(xiàn)較大差異。但是這種算法并不可靠,因為人的發(fā)音有濁音和清音之分,濁音為聲帶振動發(fā)出,幅度高,周期性明顯,而清音則不會有聲帶的震動,只是靠空氣在口腔中的摩擦和沖擊,其短時能量一般比較小。于是我們可以用信號的幅度作為特征來區(qū)分靜音和語音。圖41端點檢測算法流程圖(1)歸一化:為了后面處理方便,通常將讀取的語音信號進(jìn)行歸一化到[1,1](2)短時能量的作用: 可以較好地區(qū)分出濁音和靜音。圖31 語音信號波形 在MATLAB平臺處理語音信號時,可以通過wavplay函數(shù)回放錄制好了的語音,次函數(shù)具有快速檢驗數(shù)據(jù)和計算可靠性。y = wavrecord(n,Fs,ch)。從圖中可以看出語音識別系統(tǒng)的本質(zhì)就是一種模式識別系統(tǒng),它也包括特征提取、模式匹配、參考模式庫等基本單元。它帶有一個32,000詞的基本詞匯表,可以擴(kuò)展到65,000詞,還包括辦公常用詞條,具有“糾錯機(jī)制”,其平均識別率可以達(dá)到95%。20世紀(jì)90年代前期,許多著名的大公司如IBM、蘋果、ATamp。同時特定人語音識別系統(tǒng)具有廣闊的應(yīng)用前景,比如工業(yè)命令控制、計算機(jī)控制、家庭電器服務(wù)、個人移動通信呼叫等,尤其當(dāng)人手已被占用或無法使用的情況下必須進(jìn)行聲音控制時,更可以起到不可替代的作用,這項技術(shù)將給人們的日常生活帶來極大的便利。最后在用戶開發(fā)界面(GUI界面)直觀地呈現(xiàn)出來。本次設(shè)計錄制0~10的數(shù)字做為參考庫(model),測試庫(test)中為需要測試及識別的語音,0的序號為11,1~9的數(shù)字以相應(yīng)數(shù)字做為文件名的命名。國外的語音識別方面的研究工作可以追溯到20世紀(jì)50年代ATamp。T和NTT都對語音識別系統(tǒng)的實用化研究投以巨資。該系統(tǒng)對新聞?wù)Z音識別具有較高的精度,是目前具有代表性的漢語連續(xù)語音識別系統(tǒng)。清華大學(xué)電子工程系語音技術(shù)與專用芯片設(shè)計課題組,研發(fā)的非特定人漢語數(shù)碼串連續(xù)語音識別系統(tǒng)的識別精度,%(不定長數(shù)字串)%(定長數(shù)字串)。由于語音信號是一種典型的非平穩(wěn)信號,加之呼吸氣流、外部噪音、電流干擾等使得語音信號不能直接用于提取特征,而要進(jìn)行前期的預(yù)處理。其中n為樣本個數(shù),F(xiàn)s為頻率,默認(rèn)值為11025,本設(shè)計采用16000,ch為通道數(shù),默認(rèn)為1,若為2,則表示采樣為雙聲道立體聲數(shù)據(jù),本設(shè)計ch為1Audiorecorder函數(shù)也可以用來錄制音頻,但在本次設(shè)計的操作上,通常采用的語音格式以wav格式為主,在保存語音上,uiputfile能更好的與wavrecord相結(jié)合,所以用wavrecord比較好。但是在錄音的時候,wavrecord函數(shù)有很大的局限性,在錄制語音的時候必須事先制定語音的時間。(3)短時過零的作用:檢測清音。這樣只要設(shè)定一個門限,當(dāng)語音信號幅度超過這個門限時,就當(dāng)作語音開始,當(dāng)幅度降低到門限以下時就認(rèn)為語音結(jié)束。如聲母“s”、“c”等的幅度就很低。短時過零表示一幀語音信號波形穿過橫軸(零電平)的次數(shù)。圖43 數(shù)字“6”的過零率波形圖圖44 數(shù)字“4”的過零率波形圖完成計算短時能量及過零率后,并調(diào)整好能量門限,接下里進(jìn)入到最關(guān)鍵的一步,即變量status分析,status可以分為四種狀態(tài):(1)在靜音段,如果能量或過零率超越了低門限,就應(yīng)該開始標(biāo)記起始點,進(jìn)入過渡段。在開始檢測之前需要設(shè)定4個門限,即分別為短時能量和短時過零率各設(shè)置一個高門限和一個低門限:EHigh、ELow和ZHigh、ZLow。常見的方法有最大值乘上某個比率、中位值乘上某個比率、最小值乘上某個常數(shù)、前三幀平均值乘上某個常數(shù)等。濾波器是一個簡單的三角形的頻域濾波器的中心頻率,F(xiàn)M是均勻地分布在頻率軸。已存入模板庫的各個詞條稱為參考模板,一個參考模板可以表示為,m為訓(xùn)練語音幀的時序標(biāo)號,m=1為起點語音幀,m=M為終點語音幀,因此M為該模板所包含的語音幀總數(shù),R(m)為第m幀語音特征矢量。對齊可以采用線性擴(kuò)張的方法,如果NM可以將T線性映射為一個M幀的序列,再計算它與之間的距離。另外,因為每一列各格點上的匹配計算只用到了前一列的3個網(wǎng)格,所以沒有必要保存所有的幀匹配距離矩陣和累積距離矩陣。考慮到邊界問題,有些前續(xù)格點可能不存在,因此要加用一些判斷條件。其能夠使使用者的學(xué)習(xí)和使用更為方便、簡單。在MATLAB窗口中選擇自己弄好的GUI的路徑,打開GUI。采樣頻率為8kHz語音,語音幀長20ms,一幀分為256點,幀移為80,采用漢明窗的窗函數(shù)。比如:端點檢測算法的運(yùn)行DTW算法等等,最終通過論導(dǎo)師以及同學(xué)的解答,均解決了。Property39。gui_Singleton39。gui_Callback39。% Update handles structureguidata(hObject, handles)。=a。plot(a)。*.*39。save(str,39。[fname,L]=uigetfile({39。},39。[S,fs]=wavread(file)。fs=16000。,39。39。% Executes on button press in pushbutton14.function pushbutton14_Callback(hObject, eventdata, handles)% hObject handle to pushbutton14 (see GCBO)% eventdata reserved to be defined in a future version of MATLAB% handles structure with
點擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1