freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音識別設(shè)計(jì)(編輯修改稿)

2025-08-25 12:05 本頁面
 

【文章內(nèi)容簡介】 :VoiceExtreme和VoiceDirect是用來更方便和快速的執(zhí)行語音識別和語音合成的語音程序處理器。是低成本、簡單易用的產(chǎn)品開發(fā)包。 Sensory是嵌入式語音技術(shù)領(lǐng)域世界級的領(lǐng)導(dǎo)者。它的語音技術(shù)包括:語音識別、說話者確認(rèn)、語音及音樂合成和動畫語音。Sensory的IC和嵌入式軟件被廣泛用于消費(fèi)者電子產(chǎn)品包括電話、家居自動化、玩具、遠(yuǎn)程控制、汽車、安全裝置、學(xué)習(xí)輔助工具以及其他需要語音輸入和輸出的產(chǎn)品。消費(fèi)類電子行業(yè)的很多巨子如Hasbro,JVC,Kenwood,Mattel,Mitsubishi,Toshiba,Uniden,Sony等等都是Sensory的客戶應(yīng)用于消費(fèi)類電子產(chǎn)品上的交互式語音集成芯片(RSC100/164T,RSC300/364,RSC4XX)是一種高性能、低成本的8位MCU,所有這類芯片內(nèi)部集成有ADC、DAC、ROM(除了RSC100/300)、RAM和麥克風(fēng)的預(yù)放大電路,并擁有以下多種功能:與說話者無關(guān)/有關(guān)的語音識別、語音確認(rèn)(PASSWORD)、語音和音樂合成,錄音和回放、快速數(shù)字撥號(只有RSC300/364)、持續(xù)監(jiān)聽。 產(chǎn)品線有兩種通用目的的微處理器(RSC系列) 1. RSC100/164T—低成本的版本() 2. RSC300/364(),它有更快的響應(yīng)時間、先進(jìn)和附加的技術(shù)(包括數(shù)字撥號,固定單詞觸發(fā),同時產(chǎn)生數(shù)字記錄和識別模板) 3. RSC164/364產(chǎn)品的特性 a) 有64k內(nèi)置ROM的8位微處理器; b) 集成有A/D和D/A轉(zhuǎn)換器; c) DAC或PWM(Pulse Width Modulation); d) 可實(shí)現(xiàn)DTMF 撥號; e) 音源的AGC功能; f) 16個通用I/O端口; g) 片上有輸出放大器; h) 省電模式最小的功耗(小于5UA)。 RSC300/364產(chǎn)品特性 RSC300/364是專門為消費(fèi)類電子產(chǎn)品應(yīng)用而設(shè)計(jì)的,擁有高度集成和高識別率的系統(tǒng)化芯片。RSC300/364有額外的SDAM和硬件加速器去支持SENSORY的最新技術(shù)()。這種特別設(shè)計(jì)的8位微處理器在擁有靈活的編程時支持一系列語音技術(shù):與說話者無關(guān)/有關(guān)的識別、語音和音樂的合成、語音確認(rèn)、語音提示、持續(xù)監(jiān)聽、快速數(shù)字撥號、錄音和回放。RSC300/364允許在片上存儲最多6個與說話者有關(guān)的短句。RSC300與RSC364的區(qū)別就是少一個64K的ROM,根據(jù)封裝和版本的不同,RSC300/~。 RSC4x產(chǎn)品特性 RSC4x是Sensory ,它具有所有RSC300/364的所有特性之外,還增加了不少功能。RSC-4x支持Sensory Speech? 7技術(shù),改進(jìn)的算法使識別準(zhǔn)確率得到提高。新增的T2SI技術(shù)使得制作SI模版節(jié)省了時間和資金投入。在語音合成算法上也作了改進(jìn),“SX?”壓縮技術(shù)使得語音的壓縮率可以達(dá)到3K-8K bps(bitspersecond),是原來的1/101/4,大大減少了存儲空間,節(jié)約了成本。RSC4x有三種型號,RSC4000不含程序存儲空間,RSC4128 內(nèi)部含128K程序存儲空間,RSC4256內(nèi)部含256K程序存儲空間,供用戶靈活選用。 VOICE DAILER特性(ASSP) VOICE DAILER364是為了增加語音撥號而設(shè)計(jì)的,它可應(yīng)用在非手持的車載電話、手持電話、PDA、答錄機(jī)和其它個人電子設(shè)備。使用者只需說出名字便可撥出相關(guān)的電話;VOICE DAILER364芯片可管理一整套電話目錄,包括名字、電話號碼和語音識別模板。 SENSORY技術(shù) 與說話者有關(guān)的語音識別 (Speaker Dependent, SD) 在識別時,每個識別詞語需要使用者訓(xùn)練兩次來創(chuàng)建語音模板,一個模板需要占用128個字節(jié)的 存儲量。由于練習(xí)的原因,一般把需識別的詞匯量限制在60個以內(nèi),但超過100個也是完全可以的。通過正常設(shè)計(jì), SENSORY的SD技術(shù)能達(dá)到99%的準(zhǔn)確率。 與說話者無關(guān)的語音識別 (Speaker Independent, SI) ——不需要訓(xùn)練 SI技術(shù)是為一種指定的語系而設(shè)計(jì)的(如英語、漢語、德語),它最多能識別14條命令(識別數(shù)量由ROM的容量決定)。通過正常設(shè)計(jì),SENSORY的SI技術(shù)能達(dá)到97%的準(zhǔn)確率 語音確認(rèn) (Speaker Verification, SV) 同SD技術(shù)有點(diǎn)相似,SV能辨別出現(xiàn)在的一句話與原來說的是否相同。使用者可以訓(xùn)練1~4級密碼(密碼級數(shù)越多越安全)來開啟設(shè)備。誤識率大概在1~6%。根據(jù)環(huán)境、使用者數(shù)量、要求的安全程度的不同可設(shè)定五級訓(xùn)練難度。 語音自適應(yīng)技術(shù) (Speaker Adaptive, SA) 對于單用戶來說,SA通過一段時間對環(huán)境和說話者聲音的適應(yīng),改進(jìn)相關(guān)的語音模板,從而提高識別準(zhǔn)確率。 持續(xù)監(jiān)聽 (Continuous Listening, CL) 持續(xù)監(jiān)聽技術(shù)不需按鍵便可對某個特別、非連續(xù)的命令(在這之前需要靜音)產(chǎn)生響應(yīng), SENSORY提供SI和SD兩種持續(xù)監(jiān)聽技術(shù)。 WORD SPOTTING ——在一句話中響應(yīng)某個指定詞語。 WORD SPOTTING是持續(xù)監(jiān)聽的升級版本,它可以從正常的談話中“捕捉”并響應(yīng)某個關(guān)鍵詞語,這種技術(shù)提供了更為自然、友好的人機(jī)界面。 快速數(shù)字撥號 (Fast Digit) ——輸入電話號碼和數(shù)字串 快速數(shù)字撥號采用了優(yōu)化的識別算法來實(shí)現(xiàn)快速數(shù)字串輸入,這種技術(shù)對語音撥號應(yīng)用是非常理想的,辟如用在手持通信設(shè)備、個人撥號器,手機(jī)、非手持設(shè)備。 錄音和回放 (Record amp。 Playback) ——壓縮的數(shù)字聲音再現(xiàn)。 SENSORY的交互式語音處理器可以14Kbit/s的數(shù)據(jù)率來存儲聲音在外置的RAM上。它可用在答錄機(jī)、變音器、手持錄音設(shè)備上。根據(jù)回放的質(zhì)量和數(shù)量要求,也可以改變片上的壓縮率。錄音過程中出現(xiàn)完全靜音時,微處理器會自動去掉靜音這一段來改善聲音質(zhì)
點(diǎn)擊復(fù)制文檔內(nèi)容
物理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1