正文內(nèi)容

語音識別設(shè)計(更新版)

2025-09-06 12:05上一頁面

下一頁面

　　

【正文】。它帶有一個32,000詞的基本詞匯表，可以擴展到65,000詞,還包括辦公常用詞條，具有“糾錯機制”，其平均識別率可以達到95%。在聲學(xué)模型方面，以Markov鏈為基礎(chǔ)的語音序列建模方法HMM（隱式Markov鏈）比較有效地解決了語音信號短時穩(wěn)定、長時時變的特性，并且能根據(jù)一些基本建模單元構(gòu)造成連續(xù)語音的句子模型，達到了比較高的建模精度和建模靈活性。這一時期的語音識別主要基于模板匹配原理，研究的領(lǐng)域局限在特定人，小詞匯表的孤立詞識別，實現(xiàn)了基于線性預(yù)測倒譜和DTW技術(shù)的特定人孤立詞語音識別系統(tǒng)；同時提出了矢量量化(VQ)和隱馬爾可夫模型(HMM)理論。　　清華大學(xué)電子工程系語音技術(shù)與專用芯片設(shè)計課題組，研發(fā)的非特定人漢語數(shù)碼串連續(xù)語音識別系統(tǒng)的識別精度，%（不定長數(shù)字串）%（定長數(shù)字串）。關(guān)鍵詞：語音識別；語音芯片；開發(fā)流程；技術(shù)難點； Abstract Abstract: Review the history of voice recognition technology, the investigation of several speech recognition chip products, to understand the development process for speech recognition, and voice recognition technology problems and development prospects were discussed.Key words: speech recognition。 technical difficulties第一章緒論 (1)國內(nèi)研究歷史　　我國語音識別研究工作起步于五十年代，但近年來發(fā)展很快。中科院自動化所及其所屬模式科技(Pattek)公司2002年發(fā)布了他們共同推出的面向不同計算平臺和應(yīng)用的“天語”中文語音系列產(chǎn)品——PattekASR，結(jié)束了中文語音識別產(chǎn)品自1998年以來一直由國外公司壟斷的歷史。　　實驗室語音識別研究的巨大突破產(chǎn)生于20世紀80年代末：人們終于在實驗室突破了大詞匯量、連續(xù)語音和非特定人這三大障礙，第一次把這三個特性都集成在一個系統(tǒng)中，比較典型的是卡耐基梅隆大學(xué)(CarnegieMellonUniversity)的Sphinx系統(tǒng)，它是第一個高性能的非特定人、大詞匯量連續(xù)語音識別系統(tǒng)。　　20世紀90年代前期，許多著名的大公司如IBM、蘋果、AT＆T和NTT都對語音識別系統(tǒng)的實用化研究投以巨資。語音識別正逐步成為信息技術(shù)中人機接口的關(guān)鍵技術(shù)，語音識別技術(shù)與語音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤，通過語音命令進行操作。調(diào)查統(tǒng)計表明多達85%以上的人對語音識別的信息查詢服務(wù)系統(tǒng)的性能表示滿意。在語音合成算法上也作了改進，“SX?”壓縮技術(shù)使得語音的壓縮率可以達到3K－8K bps（bitspersecond），是原來的1/101/4，大大減少了存儲空間，節(jié)約了成本。RSC系列:無論您的產(chǎn)品是只說幾個字還是要說上幾分鐘，該系列產(chǎn)品都可以滿足您的要求，因為它可以提供從幾秒到幾小時的語音播放功能。Extreme消費類電子行業(yè)的很多巨子如Hasbro, 產(chǎn)品線有兩種通用目的的微處理器（RSC系列） 1. RSC100/164T—低成本的版本（） 2. RSC300/364（），它有更快的響應(yīng)時間、先進和附加的技術(shù)（包括數(shù)字撥號，固定單詞觸發(fā)，同時產(chǎn)生數(shù)字記錄和識別模板） 3. RSC164/364產(chǎn)品的特性 a) 有64k內(nèi)置ROM的8位微處理器； b) 集成有A/D和D/A轉(zhuǎn)換器； c) DAC或PWM（Pulse Width Modulation）； d) 可實現(xiàn)DTMF 撥號； e) 音源的AGC功能； f) 16個通用I/O端口； g) 片上有輸出放大器； h) 省電模式最小的功耗（小于5UA）。新增的T2SI技術(shù)使得制作SI模版節(jié)省了時間和資金投入。與說話者無關(guān)的語音識別 (Speaker Independent, SI) ——不需要訓(xùn)練 SI技術(shù)是為一種指定的語系而設(shè)計的（如英語、漢語、德語），它最多能識別14條命令（識別數(shù)量由ROM的容量決定）。 WORD SPOTTING是持續(xù)監(jiān)聽的升級版本，它可以從正常的談話中“捕捉”并響應(yīng)某個關(guān)鍵詞語，這種技術(shù)提供了更為自然、友好的人機界面。語音合成 (Speech Synthesis) ——創(chuàng)建一個自然的使用界面。 SPCE061A芯片SPCE061A 是繼μ’nSP?（Microcontroller and Signal Processor）系列產(chǎn)品SPCE500A等之后凌陽科技推出的又一款16位結(jié)構(gòu)的微控制器。PROBE工作于凌陽IDE集成開發(fā)環(huán)境軟件包下，其5芯的仿真頭直接連接到目標電路板上SPCE061A相應(yīng)管腳，直接在目標電路板上的CPUSPCE061A調(diào)試、運行用戶編制的程序?！痭SP?微處理器；工作電壓(CPU) ~ (I/O) ~5VCPU時鐘：~ ；內(nèi)置2K字SRAM內(nèi)置32K FLASH；可編程音頻處理；　晶體振蕩器。WS300 ~ ~，較高的工作速度使其應(yīng)用領(lǐng)域更加拓寬。構(gòu)建參考模塊：詞表中每個詞對應(yīng)一個參考模式，它由這個詞重復(fù)發(fā)音多遍，再經(jīng)特征提取和某種訓(xùn)練中得到。故語音信號分析常分段或分幀來處理。針對說話人識別在汽車應(yīng)用中的不同的要求，訓(xùn)練單元也分為2部分:對說話人識別的訓(xùn)練和對待識別詞的訓(xùn)練。但是當噪聲的能量和語音信號的能量接近時就可能造成端點檢測的誤差從而導(dǎo)致識別結(jié)果錯誤(4) 詞與詞的特征空間混疊語音識別的常規(guī)方法是利用語音信號的短時周期特性將語音時域采樣信號分為若干段，計算出每一段的特征矢量序列作為識別參數(shù)?！　‘斍埃S著第三代移動通信技術(shù)（3rdgeneration，3G）成熟和商業(yè)的廣泛應(yīng)用，智能家居借助這個平臺也在尋求更快速

點擊復(fù)制文檔內(nèi)容

物理相關(guān)推薦

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

語音識別設(shè)計(更新版)

基于語音識別的機車防帶電過分相系統(tǒng)的研制畢業(yè)設(shè)計報告-資料下載頁

孤立詞語音識別系統(tǒng)的dsp實現(xiàn)-資料下載頁

基于dsp芯片tms320c5410實現(xiàn)語音識別-資料下載頁

特定人孤立詞語音識別的研究畢業(yè)論文-資料下載頁

基于語音信號的說話人識別實驗報告-資料下載頁

基于凌陽單片機的語音識別系統(tǒng)-資料下載頁

特定人孤立詞語音識別的研究畢業(yè)論文-資料下載頁

20xx新編機器人的語音識別技術(shù)-資料下載頁

[英語學(xué)習(xí)]劉韌——新托福強化聽力語音識別訓(xùn)練答案-資料下載頁

語音識別設(shè)計(參考版)

語音識別設(shè)計-文庫吧資料

語音識別設(shè)計-展示頁

語音識別設(shè)計-在線瀏覽

語音識別設(shè)計-閱讀頁