freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

dsp的嵌入式語音識別-開題報告(編輯修改稿)

2025-04-20 04:51 本頁面
 

【文章內(nèi)容簡介】 所謂的語音識別在我看來其實就是讓機器通過某種方式準確地解析出人所說的信息。而從不同的角度出發(fā)的語音識別所針對的群體、場合也有所不同。常見的語音信號分類為以下幾種:1)從識別的說話方式來講 有孤立詞識別、連接詞識別、連續(xù)語音識別等。孤立詞識別是之說話人每次只說一個詞或短語,每個詞或短語在詞匯表中都算作一個獨立的詞條。因此常用來實現(xiàn)簡單的家用電器控制。例如:一個用語音進行家電控制的孤立詞識別系統(tǒng),可以識別用戶發(fā)出的諸如“開”、“關”、“升溫”等詞條。連接詞識別一般特指十個數(shù)字(0~9)連接而成的多位數(shù)字識別或有少數(shù)指令構成的連接詞條的識別。連接詞識別在電話、數(shù)據(jù)庫查詢以及控制操作系統(tǒng)中運用甚廣。連續(xù)語音識別是指對說話人以日常自然的方式發(fā)音,通常指用于語音錄入的聽寫機。顯然無論從復雜度還是成本,連續(xù)語音識別都高人一等,所以它并不是所有應用的首選方式,試想在一個利用語音進行命令控制的操作系統(tǒng)中,命令詞組簡單而又固定,連續(xù)詞識別除了給人“殺雞焉用牛刀”的感覺別無其他。2)從識別的詞匯量來講有小詞匯量(1~20)、中詞匯量(20~1000)、大詞匯量(≥1000)。隨著詞匯量的增大,對于系統(tǒng)的方方面面的要求也會越來越高。3)從說話人的范圍來講有特定人識別系統(tǒng)和非特定人兩大類。特定人指只針對一個用戶的語音進行識別,結構較為簡單,能得到較高的識別率,但在使用前必須有特定人的用戶輸入大量的發(fā)音數(shù)據(jù)對其進行訓練。相較而言非特定人則顯得有些包羅萬象,這種識別系統(tǒng)的通用性好、應用面廣,但難度也較大,不易得到高識別率,它的實用化會有著客觀的經(jīng)濟價值和深遠的社會意義。而建立一個非特定的語音識系統(tǒng)必須要從大量的樣本中提煉出每個人的發(fā)音速度、語音強度、發(fā)音方式等特征,并加以歸納,尋找中出不同語音的中的“相似”。綜上所述:由于考慮到C5416的計算速度、存儲空間等因素,本文旨在針對于小詞匯量特定人的孤立詞的語音進行識別。六、基本原理1. 系統(tǒng)基本流程:語音識別系統(tǒng)的典型實現(xiàn)方案如圖1所示。輸入的模擬語音信號首先要進行預處理,包括預濾波、采樣和量化、加窗、斷點檢測、預加重等。語音信號經(jīng)過預處理后,接下來重要的一環(huán)便是對于特征參數(shù)的提取,其目的是從語音波形中提取出隨時間變化的語音特征序列。然后建立聲學模型,在識別的時候?qū)⑤斎氲恼Z音特征同聲學模型進行比較,從而獲得最佳的識別結果。 自動增益控制 AGC(Auto Gain Control)是限幅輸出的一種,它利用線性放大和壓縮放大的有效組合對輸入的語音信號進行調(diào)整。當弱信號輸入時,線性放大電路工作,保證輸出信號的強度。當輸入信號達到一定強度時,啟動壓縮放大電路,使輸出幅度降低。也就是說,AGC 功能可以通過改變輸入輸出壓縮比例自動控制增益的幅度。AGC 還可以細分為 AGC(輸入自動增益控制)和 AGC(輸出自動增益控制)。預濾波又稱之為反濾波,是語音前端處理必須的,它的目的有兩個:1) 由于輸入模擬聲音信號頻域內(nèi)的帶寬是無窮的,由乃奎斯特準則需要抑制輸入信號的各頻域分量中超出采樣頻率一半的所有分量,以防止混疊干擾。2) 避免 50Hz 的電源干擾。系統(tǒng)上電后,會有一個固定的 50Hz 的電源干擾,這對于系統(tǒng)來講是不需要的輸入信號,因此預濾波是一個帶通濾波器,其下截止頻率大于等于50Hz,上截止頻率根據(jù)需要來定義??紤]到絕大多數(shù)語音編譯碼的上限頻率不大于 3400Hz,系統(tǒng)使用的采樣頻率為8000Hz。這樣,預濾波器的帶寬為下截止頻率 100Hz,上截止頻率 8000Hz,語音信號經(jīng)過預濾波和采樣后,由 A/D 變換器變換為二進制數(shù)字碼。 預加重為什么采取預加重?預加重是為了提升高頻的“質(zhì)量”。由于語音信號的平均功率受到聲門激勵和口鼻輻射的影響,超過800Hz 的高頻段會以 6dB/倍頻的態(tài)勢呈現(xiàn)跌落,也就是說:頻率越高所包含的成分就越小。因此,高頻部分的頻譜比低頻部分更加難以分辨,為此需要在預處理中通過預加重這樣一個手段來提升高頻部分,使信號的頻譜總體趨于平坦。這樣處理可以使低頻到高頻的整個頻帶中都能用相同的信噪比來求頻譜。而且預加重零點與輻射零點將抵消聲門波的影響,使語音信號中只包括聲道部分,以便于頻譜分析。 分幀與加窗從整體的角度來看,具有時變的特性的語音信號的確是千變?nèi)f化,但慶幸的是在一個短時間范圍內(nèi)(10ms30ms),其特性基本保持不變即相對地穩(wěn)定,因而能進行“短時分析”處理:將語音劃分成一個一個這樣的小時段,這就叫分幀,而劃分的小時段稱為1幀。加窗則是分幀的一種實現(xiàn)手段:從時域來看,分幀等效于離散語音信號與窗寬為幀長的矩形窗相乘;而在頻域,這等效于將語音信號的頻譜與矩形窗的傅立葉變換卷積。加窗時,不同的窗口選擇將影響語音信號的分析結果。選擇窗函數(shù)主要考慮以下三點:窗函數(shù)的形狀、窗函數(shù)長度和幀移的引入。加窗時,不同的窗口選擇將影響語音信號的分析結果。選擇窗函數(shù)主要考慮以下三點:1)窗函數(shù)形狀:常用的窗函數(shù)有矩形窗和漢明窗。矩形窗為:
點擊復制文檔內(nèi)容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1