正文內(nèi)容

語音識別是機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄?展示頁

2024-09-16 18:42本頁面

　　

【正文】變?yōu)橄鄳?yīng)的文本文件或命令的高技術(shù)。作為專門的研究領(lǐng)域，語音識別又是一門交叉學科，它與聲學、語音學、語言學、數(shù)字信號處理理論、信息論、計算機科學等眾多學科緊密相連。南山高科語音技術(shù)事業(yè)部主要致力于語音識別和語音合成及編碼技術(shù)的開發(fā)和應(yīng)用。南山高科憑借多年來在語音技術(shù)的研究和產(chǎn)品開發(fā)方面的深厚積累，推出了多種涵蓋語音識別、說話人識別、語音合成以及語音壓縮等方面的豐富的產(chǎn)品。南山高科的核心技術(shù)是具有自主知識產(chǎn)權(quán)的 V9?輸入法和語音識別技術(shù)，秉承了三十多年來中科院聲學所相關(guān)領(lǐng)域的研究經(jīng)驗，目前在國際上處于領(lǐng)先地位，并已申請多項國家專利。鑒定委員會聽取和審查了技術(shù)總結(jié)報告、專家組測試報告、科技查新報告等鑒定文件，并觀看了現(xiàn)場演示，考察了公司的開發(fā)環(huán)境。在漢語全音節(jié)與詞組混合的語音識別任務(wù)中，得到的初步實驗結(jié)果為： PC微機浮點算法條件下正確覆蓋率不低于 98%，定點算法的正確覆蓋率不低于97%。系統(tǒng)的響應(yīng)時間滿足實時識別的要求。 2 該成果在手機等移動（便攜式）電子設(shè)備上實現(xiàn)漢語全音節(jié)和詞組混合的語音漢字輸入方法、在漢語語音識別詞庫的處理方法和在具有精簡鍵盤設(shè)備上語音輸入漢字的方法和裝置上，具有創(chuàng)新性，處于國際領(lǐng)先地位。） V9 手機輸入法的突出優(yōu)勢是進行了獨到的系統(tǒng)和交互設(shè)計，使得整個系統(tǒng)模型的大小僅有 100～ 300KB，非常適合象手機這樣的嵌入式系統(tǒng)的實現(xiàn)。二、 V9?漢語語音識別系統(tǒng)的設(shè)計 V9?漢語語音識別系統(tǒng)是一個非特定人的、孤立音語音識別系統(tǒng)。識別系統(tǒng)主要用于手持設(shè)備，如手機、掌上電腦。那么，對系統(tǒng)各個部分的設(shè)計首要考慮的是系統(tǒng) 對硬件資源的開銷必須盡量的小，不能超過這些設(shè)備的限制。一般的語音處理流程圖如圖 1 所示：預(yù)處理模型庫測度估計特征提取語音輸入?yún)⒖寄Ｐ蜏y試特征后處理識別結(jié)果模型庫圖語音識別系統(tǒng)的處理流圖在語音識別系統(tǒng)中 , 模擬的語音信號在完成 A/D轉(zhuǎn)換后成為數(shù)字信號 , 但時域上的語音信號很難直接用于識別 , 因此我們需要從語音信號中提取語音的特征，一方面可以獲得語音的本質(zhì)特征 , 另一方面也起到數(shù)據(jù)壓縮的作用。語音識別系統(tǒng)的模型通常由聲學模型和語言模型兩部分組成，分別對應(yīng)于語音到半音節(jié)概率的計算和半音節(jié)到字概率的計算。由于 V9 技術(shù)方案采用的語音庫采樣率為 8kHz，因此我們采用的幀長為 256 個采樣點 (即 32ms)，幀步長或幀移（即每一幀語音與上一幀語音不重疊的長度）為 80 個采樣點 (即 10ms)。該特征是基于語音信號為自回歸信號的假設(shè)，利用線性預(yù)測分析獲得倒譜參數(shù)。 Mel 頻標倒譜參數(shù) (Mel Frequency Cepstrum Coefficient， MFCC)。由于充分模擬了人的聽覺特性，而且沒有任何前提假設(shè)， MFCC 參數(shù)具有識別性能和抗噪能力，實驗證明在漢語數(shù)碼語音識別中 MFCC 參數(shù)的性能明顯優(yōu)于 LPCC 參數(shù)，因此本技術(shù)方

點擊復制文檔內(nèi)容

公司管理相關(guān)推薦

語音識別綜述-展示頁

【摘要】8/20/20221語音識別綜述8/20/20222提綱?語音識別簡介?主流方法?技術(shù)現(xiàn)狀8/20/20223提綱?語音識別簡介?主流方法?技術(shù)現(xiàn)狀8/20/20224語音識別簡介──分類?根據(jù)處理的語音數(shù)據(jù)和識別結(jié)果分類–連續(xù)語音識別（Continuous

2024-08-16 17:55

基于matlab語音信號處理-展示頁

【摘要】1畢業(yè)設(shè)計（論文）設(shè)計（論文）題目：基于Matlab語音信號處理單位（系別）：電子信息工程系學生姓名：何謹西(何赟)專

2024-11-22 03:33

基于matlab的語音信號分析和處理-展示頁

【摘要】基于MATLAB的語音信號分析和處理福建師范大學協(xié)和學院信息技術(shù)系電子信息科學與技術(shù)專124122006028王禎飛指導老師黃小芬【摘要】本設(shè)計用微軟錄音機采集了一段語音，對其進行了時域分析，頻譜分析,分析語音信號的特性。并應(yīng)用matlab平臺對語

2025-06-27 16:34

論文基于微軟語音引擎的語音識別-展示頁

【摘要】本科畢業(yè)論文（設(shè)計）題目：基于微軟語音引擎的語音識別學生：劉歡學號：201040620228學院：物理與電子科學學院專

2024-08-11 13:20

語音信號的時域分析-展示頁

【摘要】第4章語音信號的時域分析語音信號的數(shù)字化與預(yù)處理概述短時平均過零率和上升過零間隔短時平均能量和短時平均幅度短時自相關(guān)函數(shù)和短時平均幅度差函數(shù)短時時域處理技術(shù)的應(yīng)用中值濾波在語音短時時域處理中的應(yīng)用第4章語音信號的時域分析概述?語音信號攜帶各種信息：男聲、女聲，喜、

2025-05-11 03:55

matlab的語音信號處理分析-展示頁

【摘要】數(shù)字信號處理結(jié)業(yè)論文語音信號分析與處理系統(tǒng)設(shè)計語音信號分析與處理系統(tǒng)設(shè)計摘要語音信號處理是研究用數(shù)字信號處理技術(shù)和語音學知識對語音信號進行處理的新興的學科，是目前發(fā)展最為迅速的信息科學研究領(lǐng)域的核心技術(shù)之一。通過語音傳遞信息是人類最重要、最有效、最常用和最方便的交換信息形式。Matlab語言是一種數(shù)據(jù)分析和處理功能十分強大的計算機應(yīng)用軟件，

2025-07-04 21:43

智能控制課語音識別-展示頁

【摘要】語音控制設(shè)計報告智能控制課程設(shè)計論文　　　　　題目：基于機器人的語音信號識別系統(tǒng)設(shè)計院（系）：專業(yè)：學生姓名：學號：指導教師：2011年9月23日目錄 1

2024-07-22 14:12

語音識別控制小車設(shè)計-展示頁

【摘要】基于語音識別的智能小車摘　要隨著計算機技術(shù)、模式識別和信號處理技術(shù)及聲學技術(shù)等的發(fā)展，使得能滿足各種需要的語音識別系統(tǒng)的實現(xiàn)成為可能。近二三十年來，語音識別在計算機、信息處理、通信與電子系統(tǒng)、自動控制等領(lǐng)域中有著越來越廣泛的應(yīng)用。本設(shè)計是語音識別在控制領(lǐng)域的一個很好實現(xiàn)，它將原本需要手工操作的工作用語音來方便地完成。語音識別按說話人的講話方式可分為孤立詞(Isolated

2024-07-22 15:51

語音信號畢業(yè)設(shè)計論文-展示頁

【摘要】1緒論綜述語音是人類信息活動的重要手段之一，語音不僅是人與人之間進行信息交流的最直接﹑最方便的和最有效的工具。人機對話意味著計算機應(yīng)該具有語音輸入和語音識別的功能，即計算機具有聽覺，能夠“聽懂”人話，這就是語音識別的功能。無論，人與人之間，還是人與計算機之間的語音通信，語音信號處理，特別是語音信號處理的理論和技術(shù)，都具有特別重要的作用。數(shù)字語音

2024-12-18 04:18

基于matlab語音信號處理設(shè)計-展示頁

【摘要】Matlab語音信號處理摘要語音信號處理是研究用數(shù)字信號處理技術(shù)和語音學知識對語音信號進行處理的新興的學科，是目前發(fā)展最為迅速的信息科學研究領(lǐng)域的核心技術(shù)之一。通過語音傳遞信息是人類最重要、最有效、最常用和最方便的交換信息形式。Matlab語言是一種數(shù)據(jù)分析和處理功能十分強大的計算機應(yīng)用軟件，它可以將聲音文件變換為離散的數(shù)據(jù)文件，然后利用其強大的矩陣運算能力

2024-11-24 15:26

基于matlab的語音信號的采集和處理-展示頁

【摘要】電子科技大學課程設(shè)計報告課程名稱：信號與系統(tǒng)設(shè)計名稱：語音信號的采集和處理姓名：肖燕平學號:2011019090028班級：

2025-06-27 16:08

20xx新編機器人的語音識別技術(shù)-展示頁

【摘要】-1-機器人的語音識別技術(shù)摘要1897年，M·G·馬可尼所完成的無線通信試驗就是在固定站與一艘拖船之間進行的，距離為18海里。標志著通信進入了一個新的時代，隨著社會的進步，科技發(fā)展也日益興盛起來。電子技術(shù)和智能自動化的發(fā)展更是為人們的日常生活和工業(yè)生產(chǎn)提供了極大的方便。人們可以通過一系列的信息傳遞來直接或間接的控制機械

2024-10-25 12:38

語音識別輸入系統(tǒng)設(shè)計-展示頁

【摘要】畢業(yè)設(shè)計（論文）報告紙共50頁第1頁┊┊┊┊┊┊┊┊┊┊┊┊┊裝┊┊┊┊┊訂┊┊┊┊┊

2025-05-19 21:03

畢業(yè)設(shè)計-語音信號處理技術(shù)-展示頁

【摘要】語音信號處理技術(shù)目錄目錄..................................................................................................................................1摘要............................

2024-12-15 18:23

nuance語音識別ppt課件-展示頁

【摘要】Nuance語音識別技術(shù)2022/6/22語音識別業(yè)務(wù)背景語音識別技術(shù)，AutomaticSpeechRecognition，簡稱ASR，是一種讓機器聽懂人類語言的技術(shù)。語言是人類進行信息交流的最主要、最長用、最直接的方式。語音識別技術(shù)是實現(xiàn)人機對話的一項重大突破，在國外近年來發(fā)展十分迅速

2025-05-14 18:18