freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音智能識別論文初步定稿-展示頁

2025-06-28 13:41本頁面
  

【正文】 有限,本文采用了耳機上自帶的麥克風(fēng)來進行語音輸入,效果良好。從中可以看到,DSP承擔著三種任務(wù):語音的采集控制、同步信號提取、語音的分析和識別,而單片機主要完成對整個系統(tǒng)的控制以及處理結(jié)果的顯示??刂埔伙@示板向DSP板發(fā)送控制信息,控制DSP板的動作(識別、訓(xùn)練和模板擦除)。控制——顯示板上需配置一片單片機,LCD液晶顯示器,RS232串口。核心部分是DSP,采用TI公司的TMS320DM642,模數(shù)和數(shù)模裝換芯片采用TI公司的TLV320AIC23B,里面含有A/D、D/A轉(zhuǎn)換,以及低通濾波器和采樣保持電路,異步通信串口(UART,符合RS232標準)采用TL16C752B和MAX232實現(xiàn),與顯示器LCD相連,此開發(fā)板配置了四路語音輸入和四路語音輸出的接口,利用其中的一路語音輸入,外接一個無源麥克風(fēng)作為語音采集設(shè)備,通過DSP的編程實現(xiàn)語音采樣率的設(shè)定,數(shù)據(jù)緩沖區(qū)的管理,最終對語音數(shù)據(jù)進行處理和分析輸出識別結(jié)果。3 硬件系統(tǒng)設(shè)計 系統(tǒng)概述整個系統(tǒng)分為3大部分:語音采集部分、DSP處理部分、控制一顯示部分。用法簡單快捷。第三部分是供電。8腳(R2IN)、9腳(R2OUT)、10腳(T2IN)、7腳(T2OUT)為第二數(shù)據(jù)通道。由11114腳構(gòu)成兩個數(shù)據(jù)通道。功能是產(chǎn)生+12v和12v兩個電源,提供給RS232串口電平的需要。內(nèi)部結(jié)構(gòu)基本可分三個部分:第一部分是電荷泵電路。 接口部分方案論證方法一:利用NPN、發(fā)光二極管電感等,自己搭建電路,其方法簡單,器件容易購買到。在單片機系統(tǒng)中, 常用LED數(shù)碼管來顯示各種數(shù)字或符號。晶顯示器通過顯示屏上的電極控制液晶分子狀態(tài)來達到顯示目的,即使屏幕加大,它的體積也不會成正比的增加,而且在重量上比相同顯示面積的傳統(tǒng)顯示器要輕得多。方法二:液晶顯示器都是數(shù)字式的,不像陰極射線管彩顯采用模擬接口。以八段共陰管為例, 它有8個發(fā)光二極管(比七段多一個發(fā)光二極管, 用來顯示SP, 即點) , 每個發(fā)光二極管的陰極連在一起,這樣, 一個LED 數(shù)碼管就有1根位選線和8 根段選線, 要想顯示一個數(shù)值, 就要分別對它們的高低電平來加以控制。因此,選擇方法二。該器件采用ATMEL高密度非易失存儲器制造技術(shù)制造,與工業(yè)標準的MCS51指令集和輸出管腳相兼容,由于將多功能8位CPU和閃爍存儲器組合在單個芯片中,ATMEL的AT89S51是一種高效微控制器。對FPGA芯片進行配置可有多種模式,當系統(tǒng)上電時,單片機自動將存在其內(nèi)部的配置數(shù)據(jù)送到FPGA內(nèi)部存儲單元中。 控制部分方案論證方法一:FPGA采用Altera公司的Flex10k系列芯片。在C64X子系列中TMS320DM642為多媒體處理平臺,可實現(xiàn)多路音頻、視頻的同時采集和處理。C5000系列主要C54X和C55X兩個子系列。目前,國內(nèi)自主研發(fā)了DSP漢芯二號、漢芯三號,依賴國外進口的局面被打破了。該區(qū)分能力可令安全碼和數(shù)據(jù)在操作系統(tǒng)中安全而有效地同時運行,并不需要犧牲任何系統(tǒng)性能,也不會受病毒侵害。所以選擇方法二??紤]到DSP 系統(tǒng)資源的有限性,本系統(tǒng)采用了計算相對簡單而有效的DTW 算法。方法五:人工神經(jīng)網(wǎng)絡(luò)方法(ANN)人工神經(jīng)網(wǎng)絡(luò)在某種程度上模擬了生物的感知特性,它是一種分布式并行處理結(jié)構(gòu)的網(wǎng)絡(luò)模型,具有自組織和自學(xué)習(xí)能力、很強的復(fù)雜分類邊界區(qū)分能力以及對不完全信息的魯棒性,其性能近似理想的分類器。對于與文本無關(guān)的語音識別一般采用各態(tài)歷經(jīng)型HMM;對于與文本有關(guān)的說話人識別一般采用從左到右型HMM。在使用隱馬爾可夫模型識別時,為每個說話人建立發(fā)聲模型,通過訓(xùn)練得到狀態(tài)轉(zhuǎn)移概率矩陣和符號輸出概率矩陣。方法四:馬爾可夫模型方法(HMM),隱馬爾可夫模型是一種基于轉(zhuǎn)移概率和輸出概率的隨機模型,最早在CMU和IBM被用于語音識別。Helms首次將其用于說話人識別,他把每個人的特定文本訓(xùn)練成碼本,識別時將測試文本按此碼本進行編碼,以量化產(chǎn)生的失真度作為判決標準。常用的方法是基于最近鄰原則的動態(tài)時間規(guī)整(DTW)。方法二:動態(tài)時間規(guī)整方法(DTW)說話人信息不僅有穩(wěn)定因素(發(fā)聲器宮的結(jié)構(gòu)和發(fā)聲習(xí)慣),而且有時變因素(語速、語調(diào)、重音和韻律)。DSP 的發(fā)展可以說是日新月異, 它是未來數(shù)字化世界的源泉。對于某些運算(如濾波),這意味著每當接收到一次新的輸入采樣點時,就能產(chǎn)生一個新的輸出。DSP運算的速度和計算能力,已經(jīng)達到實時信號處理的要求。語音信號處理的算法盡管能在任何處理器上實現(xiàn),然而并不是所有處理器都能夠快速有效的完成這些任務(wù),只有在專門的DSP才能獲得最大的速度和效率。 DSP的應(yīng)用前景隨著信息和計算機技術(shù)的飛速發(fā)展,信號處理理論和方法的不斷更新、完善,通信、工業(yè)過程控制、軍事、圖形/圖像處理等需要處理的數(shù)據(jù)量越來越大,對實時性和精度的要求越來越高。語音識別與其它模式識別相比所具有的優(yōu)勢:獲取方便;獲取成本低,使用簡單;適合遠程登陸;辨認和確認的算法復(fù)雜度低;配合其它措施可提高識別準確率;不涉及隱私。示意圖如下所示圖1 語音識別的原理框圖語音識別有其廣泛的應(yīng)用領(lǐng)域并具有與其它模式識別方式相比獨特的優(yōu)勢。因此,若要實現(xiàn)語音的識別,需解決以下幾個基本問題:對語音信號的預(yù)處理和特征提??;語音模型的建立和模型參數(shù)的訓(xùn)練;測試音與語音模型的匹配距離計算。在進行語音辨認時,取與測試音匹配距離最小的語音模型所對應(yīng)的語音作為語音辨認的結(jié)果,在進行說話人確認時,用測試音的模型與所聲稱的語音的模型進行比較,若匹配距離小于一個規(guī)定的域值,則該說話人得到確認。無論是與文本有關(guān)的語音識別還是與文本無關(guān)的語音識別,其基本原理都是為每一說話人建立一個能夠描述這一說話人個性特征的模型。在分析語音信號時,可以提取說話人的個人特征,從而有可能識別說話人是誰。語音信號既載有說話人的語言信息,同時也載有說話人本身的特征信息。語音識別就是從說話人的一段語音中提取出說話人的個性特征,通過對個人特征的分析和識別,從而達到對說話人進行辨認或者確認的目的。而證券業(yè)方面,若是采用電話語音識別聲訊系統(tǒng)的話,用戶想查詢行情便可以直接講出股票名稱或代碼,而系統(tǒng)確認用戶的要求后,會自動讀出最新的股票價,這將大大方便用戶。語音識別技術(shù)的另一個發(fā)展分支就是電話語音識別技術(shù)的發(fā)展,貝爾實驗室是這方面的先驅(qū),電話語音識別技術(shù)將能夠?qū)崿F(xiàn)電話查詢、自動接線以及一些專門業(yè)務(wù)如旅游信息等的操作。它可以克服手工分揀單純依靠分揀員記憶力的不足,解決人員成本過高的問題,提高郵件處理的效率和效益。語音識別技術(shù)在人工郵件分揀中的作用也日益顯現(xiàn),發(fā)展前景誘人。調(diào)查統(tǒng)計表明,多達85%以上的人對語音識別的信息查詢服務(wù)系統(tǒng)的性能表示滿意。一些用戶交換機、電話機、手機已經(jīng)包含了語音識別撥號功能、語音記事本、語音智能玩具等產(chǎn)品,同時也包括語音識別與語音合成功能。由于大規(guī)模集成電路技術(shù)的發(fā)展,這些復(fù)雜的語音識別系統(tǒng)已經(jīng)完全可以制成專用芯片,大量生產(chǎn)。目 錄 1 緒論 2 3 3 4 DSP的應(yīng)用前景 42 方案論證與比較 4 語音識別方案的論證 4 語音的采集和處理方案論證 5 控制部分方案論證 6 顯示部分方案論證 6 接口部分方案論證 73 硬件系統(tǒng)設(shè)計 7 系統(tǒng)概述 7 語音采集部分 8 DSP處理部分 8 控制——顯示部分 9 硬件電路設(shè)計 10 DSP接口電路設(shè)計 10 串行接口電路設(shè)計 11 單片機串行通信接口設(shè)計 12 LCD電路設(shè)計 124 軟件實現(xiàn) 13 DSP的軟件實現(xiàn) 13 端點檢測 13 語音特征提取 14 模式識別——動態(tài)時間規(guī)整(DTW) 15 FLASH引導(dǎo)的實現(xiàn) 17 17 17 17 18 FLASH的燒寫 18——顯示板軟件設(shè)計 18 19 LCD程序設(shè)計 205 總結(jié)與展望 21 21 22致謝 23參考文獻 24附錄一 26附錄二 281 緒論語音識別技術(shù)發(fā)展到今天,特別是中小詞匯量非特定人語音識別系統(tǒng)識別精度已經(jīng)大于98%,對特定人語音識別系統(tǒng)的識別精度就更高。這些技術(shù)已經(jīng)能夠滿足通常應(yīng)用的要求。在西方經(jīng)濟發(fā)達國家,大量的語音識別產(chǎn)品已經(jīng)進入市場和服務(wù)領(lǐng)域。人們可以通過電話網(wǎng)絡(luò)用語音識別口語對話系統(tǒng)查詢有關(guān)的機票、旅游、銀行信息??梢灶A(yù)測,在近5年內(nèi),語音識別系統(tǒng)的應(yīng)用將更加廣泛,各種各樣的語音識別系統(tǒng)產(chǎn)品將不斷出現(xiàn)在市場上。一些發(fā)達國家的郵政部門已經(jīng)使用了這一系統(tǒng),語音識別技術(shù)逐漸成為郵件分揀的新技術(shù)。就教育領(lǐng)域來講,語音識別技術(shù)的最直接的應(yīng)用就是幫助用戶更好地練習(xí)語言技巧。銀行應(yīng)用了語音理解技術(shù)的聲訊查詢系統(tǒng)后,可不分晝夜地為客戶提供二十四小時的電話銀行理財服務(wù)。目前在114查號臺還有大量的人工服務(wù),如果采用語音技術(shù),就可讓計算機自動接聽用戶的需要,然后回放查詢的電話號碼,從而節(jié)約了人力資源。語音識別并不注意語音信號的語義內(nèi)容,而是希望從語音信號中提取出個人的特征,即根據(jù)語音判別說話人是誰。每個人發(fā)音器官都有自己的特征,說話時也都有自己的特殊語言習(xí)慣。語音識別分為與文本相關(guān)的語音識別和與文本無關(guān)的語音識別。在目前語音特征與說話人個性特征還未很好地從語音特征中得到分離的情況下,為每一說話人建立的語音模型實際是說話人的語音特征的模型。由此可以看出,說話人辨認和說話人確認在本質(zhì)上并沒有什么差別。為了對語音個性特征描述的一致起見,常將每一說話人的模型結(jié)構(gòu)取得相同,不同的只是模型中的參數(shù),通過用訓(xùn)練語音對模型進行訓(xùn)練得到。它的應(yīng)用領(lǐng)域包括以下幾個方面:考勤系統(tǒng);語音電話撥號,提供主叫方的身份信息;電話銀行,進行身份確認;安全控制;司法系統(tǒng);軍隊和國防。也正是因為語音識別廣泛的應(yīng)用領(lǐng)域和獨特的優(yōu)勢,所以語音識別具有很高的研究價值。低檔的微處理器已經(jīng)不能滿足要求,高性能的數(shù)字信號處理器(DSP)的出現(xiàn),軟件和開發(fā)工具的完善,價格的大幅度下降,使得DSP的應(yīng)用前景越來越廣闊。自80年代以來, DSP發(fā)展突飛猛進。實時是指在實際運算中,輸出的速度跟得上采樣點輸入的速度。目前在語音信號處理的實際應(yīng)用中,例如,語音信箱、聲碼器、語音識別、說話人識別、語音增強、語音綜合以及文本轉(zhuǎn)換等都可以應(yīng)用數(shù)字信號處理器DSP實現(xiàn),DSP也可以實現(xiàn)對視頻和音樂的實時檢測、處理。2 方案論證與比較 語音識別方案的論證方法一:概率統(tǒng)計方法語音中說話人信息在短時間內(nèi)較為平穩(wěn),通過對穩(wěn)態(tài)特征如基音、聲門增益、低階反射系數(shù)的統(tǒng)計分析,可以利用均值、方差等統(tǒng)計量和概率密度函數(shù)進行分類判決。將識別模板與參考模板進行時間對比,按照某種距離測度得出兩模板間相似程度。方法三:矢量量化方法(VQ)矢量量化最早是用于聚類分析的數(shù)據(jù)壓縮編碼技術(shù)。Bell實驗室的Rosenberg和Soong用矢量量化進行了孤立數(shù)字文本的語音識別研究,得到了較好的識別結(jié)果。它把語音看成由可觀察到的符合序列組成的隨機過程,符號序列則是發(fā)聲系統(tǒng)狀態(tài)序列的輸出。識別時計算未知語音在狀態(tài)轉(zhuǎn)移過程中的最大概率,根據(jù)最大概率對應(yīng)的模型進行判決。HMM不需要時間規(guī)整,可節(jié)約判決時的計算時間和存儲量,在目前被廣泛應(yīng)用。將五種方法進行對比,方法一不用對特征參量在時域上進
點擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1