freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音智能識別論文初步定稿-在線瀏覽

2025-08-06 13:41本頁面
  

【正文】 行規(guī)整,比較適合與文本無關(guān)的說話人識別,方法三編碼程序太多太復(fù)雜,方法四訓(xùn)練時計算量較大,方法五訓(xùn)練時間長,動態(tài)時間規(guī)整能力弱,而方法五的網(wǎng)絡(luò)規(guī)模隨說話人數(shù)目增加時可能大到難以訓(xùn)練的程度。該算法基于動態(tài)規(guī)劃(DP) 的思想,解決了發(fā)音長短不一的模板匹配問題。 語音的采集和處理方案論證方法一:ARM TrustZone技術(shù)可識別系統(tǒng)的安全碼和數(shù)據(jù),硬件能清楚區(qū)分安全信息和非安全信息。方法二:DSP芯片制造商,目前有模擬器件(AD),德州儀器(TI),摩托羅拉(Motorola)等。在這些DSP廠商中以TI公司的市場份額最大,產(chǎn)品最全,目前,TI的DSP產(chǎn)品中,C2000系列主要有C24X和C28X。C6000系列有C62X,C64X,C67X子系列,其中C67X為浮點系列DSP。兩種方法都是語音采集和處理的方法,但是方法一成本太高,基于實際考慮選擇方法二。芯片利用開發(fā)軟件Max+plusII將各個模塊用VHDL語言描述并輸入,由軟件自動編譯、綜合、布局和布線,生成編程用的數(shù)據(jù)文件,加載到FPGA的配置存儲單元。方法二:AT89S51是一種帶4K字節(jié)閃爍可編程可擦除只讀存儲器(FPEROM一Flash Programmable and Erasable Read Only Memory)的低電壓,高性能CMOS8位微處理器,俗稱單片機。經(jīng)過對比,方法一硬件結(jié)構(gòu)和語言使用復(fù)雜,而AT89S51芯片卻可以為很多嵌入式控制系統(tǒng)提供了一種靈活性高且價廉的方案。 顯示部分方案論證方法一:LED數(shù)碼管的結(jié)構(gòu)簡單, 分為七段和八段兩種形式, 也有共陽和共陰之分。一般的顯示電路由多個數(shù)碼管構(gòu)成, N 個數(shù)碼管可以構(gòu)成N 位LED顯示器, 共有N 根位選線和8N 根段選線。也就是說,使用液晶顯示器,顯卡再也不需要像往常那樣把數(shù)字信號轉(zhuǎn)化成模擬信號再行輸出了。其功耗主要消耗在其內(nèi)部的電極和驅(qū)動IC上,因而耗電量比傳統(tǒng)顯示器也要小得多。而本設(shè)計中要顯示數(shù)字和字符,所以選擇方法二。方法二:利用MAX232芯片,次芯片是美信公司專門為電腦的RS232標(biāo)準(zhǔn)串口設(shè)計的接口電路,使用+5v單電源供電。由6腳和4只電容構(gòu)成。第二部分是數(shù)據(jù)轉(zhuǎn)換通道。其中13腳(R1IN)、12腳(R1OUT)、11腳(T1IN)、14腳(T1OUT)為第一數(shù)據(jù)通道。TTL/CMOS數(shù)據(jù)從T1IN、T2IN輸入轉(zhuǎn)換成RS232數(shù)據(jù)從T1OUT、T2OUT送到電腦DB9插頭;DB9插頭的RS232數(shù)據(jù)從R1IN、R2IN輸入轉(zhuǎn)換成TTL/CMOS數(shù)據(jù)后從R1OUT、R2OUT輸出。15腳DNG、16腳VCC(+5v)。基于方法一需要自己搭建電路,此過程可能會給電路帶來不穩(wěn)定因素的原因,選擇方案二。簡單框圖如下 圖2 系統(tǒng)總體框圖在DSP處理部分本系統(tǒng)采用合眾達(dá)公司的SEEDVPM642/(大學(xué)基本配置方案)開發(fā)板作為主處理器。由于DSP板無法提供結(jié)果顯示功能,本文自行開發(fā)了一個控制顯示板來實現(xiàn)控制和顯示功能??刂啤@示部分通過串口與DSP板通信。AD轉(zhuǎn)換后的數(shù)字語音數(shù)據(jù)以同步串行方式傳給DSP,在DSP內(nèi)部進(jìn)行相關(guān)的算法處理后,將計算即識別結(jié)果送至UART串口,UART將識別結(jié)果送至LCD顯示。 圖3 語音識別系統(tǒng)硬件框圖 語音采集部分語音的采集是系統(tǒng)運行的第一步,也是整個系統(tǒng)關(guān)鍵的一步。為了保證系統(tǒng)的輸入正常和便于檢測,本文在錄音的同時把語音通過語音輸出口回放出來。模擬語音通過DSP開發(fā)板上的音頻解碼芯片TLV320AIC23B進(jìn)行A/D、D/A轉(zhuǎn)換。AIC23B的模數(shù)轉(zhuǎn)換(ADC)和數(shù)模轉(zhuǎn)換(DAC)部件高度集成在芯片內(nèi)部,采用了先進(jìn)的Sigmadelta過采樣技術(shù),可以在8K到96K采樣率范圍內(nèi)提供16位、20位、24位、32位采樣,ADC和DAC的信噪比分別可以達(dá)到90dB和100dB。 DSP處理部分系統(tǒng)的處理部分選用合眾達(dá)公司的SEEDVPM642開發(fā)板作為主處理器。其上包含:專用于數(shù)字媒體應(yīng)用的高性能32位定點 DSPTMS320DM642,其工作主頻高達(dá)720MHZ,處理性能可達(dá)5760MIPS,可實時實現(xiàn)多路數(shù)字視頻/音頻的編碼運算,如:MPEG4;4路PAL/NTSC制標(biāo)準(zhǔn)復(fù)合或Y/C模擬視頻輸入,1路PAL/NTSC制標(biāo)準(zhǔn)復(fù)合或Y/C模擬視頻輸出,4路標(biāo)準(zhǔn)的Microphone輸入或 Audio Line In立體輸入,4路標(biāo)準(zhǔn)的Audio Line Out立體聲輸出;2路可編程切換的RS232/RS422/RS485異步接口,8路數(shù)字輸入、8路數(shù)字輸出,用于云臺控制和環(huán)境監(jiān)控;標(biāo)準(zhǔn)的ATA硬盤接口,實現(xiàn)數(shù)字視頻錄像機功能;高速數(shù)據(jù)傳輸接口;標(biāo)準(zhǔn)的32位、 33MHz、支持主/ 10/l00M以太網(wǎng)接口,方便實現(xiàn)數(shù)字視頻服務(wù)器功能;實時時鐘,為數(shù)字視頻/音頻提供實時基信號;軟/硬件加密功能,更好地保護(hù)產(chǎn)品開發(fā)者的知識產(chǎn)權(quán)。其框圖如下圖4 控制顯示框圖AT89S51是一個功能強大性價比很高的一款芯片,在嵌入式控制應(yīng)用中得到了廣泛的應(yīng)用,它的特點有:兼容MCS51微控制器。128xsbit片內(nèi)RAM。2個16位定時/計數(shù)器。低功耗支持Idle和Powerdown模式。在SEEDVPM642上配置有二個通用異步串口,接口標(biāo)準(zhǔn)可由軟件配置為RS232/RS422/RS485,它采用TL16C752B通用異步收發(fā)器UART,其上包含二路相互獨立的異步收發(fā)器,接收和發(fā)送各帶64字節(jié)FIF0,并各自帶有Modem接口信號。TL16C752B每個通道包含18個寄存器,通過地址A2A0及寄存器位對它們進(jìn)行尋址,A、B二通道分別由片選信號選通,本系統(tǒng)采用A通道。在本設(shè)計中,波特率設(shè)為9600,連接電路圖如下: 圖5 DSP接口電路如圖所示,TL16C752的X1與X2外接振蕩電路,TXA接轉(zhuǎn)換電路的TXD,RXA接轉(zhuǎn)換電路的RXD,D0~D7接DSP的D0~D7,A0~A2接DSP的A0~A2,與DSP的相連,與DSP的相連,與DSP的相連,INTB/A接DSP的INT1,兩個芯片的復(fù)位電路相連,至此電路連接完成。RS232是PC機與通信工業(yè)中應(yīng)用最廣泛一種串行接口,是低速率串行通信中增加通信距離的單端標(biāo)準(zhǔn)。當(dāng)無數(shù)據(jù)傳輸時,線上為TTL,從開始傳送數(shù)據(jù)到結(jié)束,線上電平從TTL電平到RS232電平再返回TTL電平。由于發(fā)送電平與接收電平的差僅為2~3V,所以其共模抑制能力差,再加上雙絞線上的分布電容,其傳送距離最大約15m,最高速率為20kbit/s。由于TTL電平與標(biāo)準(zhǔn)的RS232并不兼容,需要加上電平轉(zhuǎn)換IC(在本文中采用MAX232芯片)方可與RS232接口相連。1腳和3腳之間接一個10uF的電容,4腳和5腳之間接一個10uF的電容,2腳通過一個10uF的電容接5V電壓,6腳通過10uF電容接地,其11腳和12腳與單片機的10腳和11腳相連,至此完成電平轉(zhuǎn)換電路。SBUF是串口緩沖寄存器,包括發(fā)送寄存器和接收寄存器。單片機接口電路圖如下 圖7 單片機最小系統(tǒng)電路,9腳外接一個手動上電復(fù)位電路,使能端通過一個電阻接到5V電源上。 LCD電路設(shè)計液晶顯示器LCD體積小,重量輕,功耗極低,應(yīng)用十分廣泛。它由TN型液晶顯示器、CMOS驅(qū)動器和CMOS控制器組成,模塊內(nèi)集成有字符發(fā)生器和數(shù)據(jù)存貯器,采用單一 V電源供電。VDD:+5V電源輸入端。RS:寄存器選擇信號輸入線,低電平選通指令寄存器,高電平選通數(shù)據(jù)寄存器R/W:讀/寫信號輸入線,低電平為寫入,高電平為讀出。D0D7:數(shù)據(jù)總線。R/。在一個開放式的插件(pluin)結(jié)構(gòu)下,CCS內(nèi)部集成了以下軟件工具:C6000代碼產(chǎn)生工具(包括C6000的C編譯器、匯編優(yōu)化器、匯編器和連接器);軟件模擬器(Simulator);實時基礎(chǔ)軟件 DSP/BIOS;主機與目標(biāo)機之間的實時數(shù)據(jù)交換軟件RTDX;實時分析和數(shù)據(jù)可視化軟件。除此之外,它還提供了實時分析和數(shù)據(jù)可視化功能,大大降低了DSP系統(tǒng)的開發(fā)難度。從語音信號中排除無聲段,系統(tǒng)采用短時能量和過零率來實現(xiàn),前者描述了信號的幅度,后者描述了1 幀信號穿越0 電平的次數(shù)。然后對語音信號加漢明窗,再計算能量值進(jìn)行判斷。根據(jù)語音學(xué)的知識,清音的過零率大多要比濁音的過零率高,幅度小。圖9 語音信號的短時能量和過零率 語音特征提取語音信號的特征參數(shù)的提取是語音識別的關(guān)鍵,經(jīng)常使用的特征參數(shù)有能量、間距頻率、短時間頻率、倒頻線性預(yù)測系數(shù)等。一般情況下對特征參數(shù)的要求是能絕對有效的代表語音特征,包括聲道特征和聽覺特征,具有很好的區(qū)分性,各節(jié)參數(shù)之間有良好的獨立性, MFCC的抗噪聲能力優(yōu)于LPCC綜合考慮決定采用Mel頻率倒譜系數(shù)(MFCC)作為語音的特征參數(shù)MFCC的計算流程可以簡單的概括一下五個步驟: MFCC參數(shù)是目前大多數(shù)語音識別系統(tǒng)中廣泛使用的特征參數(shù),它是基于人耳的聽覺特性。而Mel倒譜尺寸,則更符合人耳的聽覺特性。語音的識別就是要將這個特征向量同模板庫中已經(jīng)存在的語音特征向量(參考模板)進(jìn)行模板匹配,尋找距離最短的模板,由于讀入的語音信號和參考模板語音長短不同,因此需要通過動態(tài)計算兩個長度不同的模板之間的相似程度,或者叫做失真距離。設(shè)n和m分別是T和R中任意選擇的幀號,d[T(n),R(m)]表示這兩幀特征矢量之間的距離。如果把測試模板的各個幀號n=1—N在一個二維坐標(biāo)系中的橫坐標(biāo)標(biāo)出,把參考模板的各幀號m=1—M在縱坐標(biāo)軸上標(biāo)出,通過這些表示幀號的整數(shù)坐標(biāo)畫出一些縱橫線即可形成一個網(wǎng)路,網(wǎng)格中的每一個交叉點(n,m)表示測試模板中的某一幀與訓(xùn)練模板中的某一幀的交匯點,DTW算法可以歸結(jié)為尋找一條通過此網(wǎng)格若干格點的路徑,路徑通過的格點即可測試和參考模板中進(jìn)行距離計算的幀號。為了使路徑不至于過分傾斜,—2的范圍內(nèi)。 圖11 DTW算法搜索路徑 圖12 系統(tǒng)軟件流程圖 圖13 識別模塊流程圖 整個系統(tǒng)工作在對串口的查詢方式下,如串口有輸入即根據(jù)輸入進(jìn)行處理。 FLASH引導(dǎo)的實現(xiàn)引導(dǎo)程序(也稱 Boot Loader程序)的設(shè)計是開發(fā)DSP應(yīng)用系統(tǒng)必須做的最后一步工作。這就需要給通過JTAG口調(diào)試通過的應(yīng)用程序添加一個引導(dǎo)代碼,然后將生成的目標(biāo)文件進(jìn)行格式轉(zhuǎn)換使其能在線燒寫,將轉(zhuǎn)換過的文件利用FLASH燒寫程序通過JTAG口在線燒寫到FLASH中。從而整個系統(tǒng)可脫機運行,實現(xiàn)了真正的嵌入式開發(fā)。而TMS320C64XDSP這個過程稍有不同,芯片上的ROM中的 Boot Loader程序會把FLASH中第一個lK字節(jié)的程序搬移到DSP內(nèi)部的RAM中,然后程序指針指向此lK字節(jié)的程序開始執(zhí)行。完成FLASH的自舉引導(dǎo),首先要修改一下工程中的命令文件(.cmd)。編寫命令文件時,有一點需要注意,那就是在很多情況下需要對某段說明兩個不同的地址:加載地址和運行地址。因此,當(dāng)用戶對某段分別說明了加載地址和運行地址時,只有將該段從加載地址復(fù)制到運行地址上,該段才可以被訪問。DSP加電復(fù)位后,片上的ROM程序從CEI空間(本工程中CEI空間映射到FLASH上,首地址為0x90000000)拷貝IK數(shù)據(jù)(用戶引導(dǎo)代碼)
點擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1