freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音識別設計(編輯修改稿)

2024-08-25 12:05 本頁面
 

【文章內(nèi)容簡介】 :VoiceExtreme和VoiceDirect是用來更方便和快速的執(zhí)行語音識別和語音合成的語音程序處理器。是低成本、簡單易用的產(chǎn)品開發(fā)包。 Sensory是嵌入式語音技術領域世界級的領導者。它的語音技術包括:語音識別、說話者確認、語音及音樂合成和動畫語音。Sensory的IC和嵌入式軟件被廣泛用于消費者電子產(chǎn)品包括電話、家居自動化、玩具、遠程控制、汽車、安全裝置、學習輔助工具以及其他需要語音輸入和輸出的產(chǎn)品。消費類電子行業(yè)的很多巨子如Hasbro,JVC,Kenwood,Mattel,Mitsubishi,Toshiba,Uniden,Sony等等都是Sensory的客戶應用于消費類電子產(chǎn)品上的交互式語音集成芯片(RSC100/164T,RSC300/364,RSC4XX)是一種高性能、低成本的8位MCU,所有這類芯片內(nèi)部集成有ADC、DAC、ROM(除了RSC100/300)、RAM和麥克風的預放大電路,并擁有以下多種功能:與說話者無關/有關的語音識別、語音確認(PASSWORD)、語音和音樂合成,錄音和回放、快速數(shù)字撥號(只有RSC300/364)、持續(xù)監(jiān)聽。 產(chǎn)品線有兩種通用目的的微處理器(RSC系列) 1. RSC100/164T—低成本的版本() 2. RSC300/364(),它有更快的響應時間、先進和附加的技術(包括數(shù)字撥號,固定單詞觸發(fā),同時產(chǎn)生數(shù)字記錄和識別模板) 3. RSC164/364產(chǎn)品的特性 a) 有64k內(nèi)置ROM的8位微處理器; b) 集成有A/D和D/A轉(zhuǎn)換器; c) DAC或PWM(Pulse Width Modulation); d) 可實現(xiàn)DTMF 撥號; e) 音源的AGC功能; f) 16個通用I/O端口; g) 片上有輸出放大器; h) 省電模式最小的功耗(小于5UA)。 RSC300/364產(chǎn)品特性 RSC300/364是專門為消費類電子產(chǎn)品應用而設計的,擁有高度集成和高識別率的系統(tǒng)化芯片。RSC300/364有額外的SDAM和硬件加速器去支持SENSORY的最新技術()。這種特別設計的8位微處理器在擁有靈活的編程時支持一系列語音技術:與說話者無關/有關的識別、語音和音樂的合成、語音確認、語音提示、持續(xù)監(jiān)聽、快速數(shù)字撥號、錄音和回放。RSC300/364允許在片上存儲最多6個與說話者有關的短句。RSC300與RSC364的區(qū)別就是少一個64K的ROM,根據(jù)封裝和版本的不同,RSC300/~。 RSC4x產(chǎn)品特性 RSC4x是Sensory ,它具有所有RSC300/364的所有特性之外,還增加了不少功能。RSC-4x支持Sensory Speech? 7技術,改進的算法使識別準確率得到提高。新增的T2SI技術使得制作SI模版節(jié)省了時間和資金投入。在語音合成算法上也作了改進,“SX?”壓縮技術使得語音的壓縮率可以達到3K-8K bps(bitspersecond),是原來的1/101/4,大大減少了存儲空間,節(jié)約了成本。RSC4x有三種型號,RSC4000不含程序存儲空間,RSC4128 內(nèi)部含128K程序存儲空間,RSC4256內(nèi)部含256K程序存儲空間,供用戶靈活選用。 VOICE DAILER特性(ASSP) VOICE DAILER364是為了增加語音撥號而設計的,它可應用在非手持的車載電話、手持電話、PDA、答錄機和其它個人電子設備。使用者只需說出名字便可撥出相關的電話;VOICE DAILER364芯片可管理一整套電話目錄,包括名字、電話號碼和語音識別模板。 SENSORY技術 與說話者有關的語音識別 (Speaker Dependent, SD) 在識別時,每個識別詞語需要使用者訓練兩次來創(chuàng)建語音模板,一個模板需要占用128個字節(jié)的 存儲量。由于練習的原因,一般把需識別的詞匯量限制在60個以內(nèi),但超過100個也是完全可以的。通過正常設計, SENSORY的SD技術能達到99%的準確率。 與說話者無關的語音識別 (Speaker Independent, SI) ——不需要訓練 SI技術是為一種指定的語系而設計的(如英語、漢語、德語),它最多能識別14條命令(識別數(shù)量由ROM的容量決定)。通過正常設計,SENSORY的SI技術能達到97%的準確率 語音確認 (Speaker Verification, SV) 同SD技術有點相似,SV能辨別出現(xiàn)在的一句話與原來說的是否相同。使用者可以訓練1~4級密碼(密碼級數(shù)越多越安全)來開啟設備。誤識率大概在1~6%。根據(jù)環(huán)境、使用者數(shù)量、要求的安全程度的不同可設定五級訓練難度。 語音自適應技術 (Speaker Adaptive, SA) 對于單用戶來說,SA通過一段時間對環(huán)境和說話者聲音的適應,改進相關的語音模板,從而提高識別準確率。 持續(xù)監(jiān)聽 (Continuous Listening, CL) 持續(xù)監(jiān)聽技術不需按鍵便可對某個特別、非連續(xù)的命令(在這之前需要靜音)產(chǎn)生響應, SENSORY提供SI和SD兩種持續(xù)監(jiān)聽技術。 WORD SPOTTING ——在一句話中響應某個指定詞語。 WORD SPOTTING是持續(xù)監(jiān)聽的升級版本,它可以從正常的談話中“捕捉”并響應某個關鍵詞語,這種技術提供了更為自然、友好的人機界面。 快速數(shù)字撥號 (Fast Digit) ——輸入電話號碼和數(shù)字串 快速數(shù)字撥號采用了優(yōu)化的識別算法來實現(xiàn)快速數(shù)字串輸入,這種技術對語音撥號應用是非常理想的,辟如用在手持通信設備、個人撥號器,手機、非手持設備。 錄音和回放 (Record amp。 Playback) ——壓縮的數(shù)字聲音再現(xiàn)。 SENSORY的交互式語音處理器可以14Kbit/s的數(shù)據(jù)率來存儲聲音在外置的RAM上。它可用在答錄機、變音器、手持錄音設備上。根據(jù)回放的質(zhì)量和數(shù)量要求,也可以改變片上的壓縮率。錄音過程中出現(xiàn)完全靜音時,微處理器會自動去掉靜音這一段來改善聲音質(zhì)
點擊復制文檔內(nèi)容
物理相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1