freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語(yǔ)音識(shí)別外文文獻(xiàn)翻譯-其他專(zhuān)業(yè)-資料下載頁(yè)

2025-01-19 02:11本頁(yè)面

【導(dǎo)讀】context-sensitivegrammar.

  

【正文】 些語(yǔ)音的變異性正好由音素的聲學(xué)差異做出了驗(yàn)證 。在詞語(yǔ)的范圍里,語(yǔ)境的變化會(huì)相 當(dāng)富有戲劇性 使得美國(guó)英語(yǔ)里的 gas shortage 聽(tīng)起來(lái)很像 gash shortage, 而意大利語(yǔ)中的 devo andare 聽(tīng)起來(lái)會(huì)很像 devandare。 其次,聲變異可能由環(huán)境變化,以及傳輸介質(zhì)的位置和特征引起。 第三, 說(shuō)話(huà)人的 不同,演講者身體和情緒上的差異可能導(dǎo)致演講速度,質(zhì)量和話(huà)音質(zhì)量的差異。最后,社 會(huì)語(yǔ)言學(xué)背景,方言的差異和聲道的大小和形狀更進(jìn)一步促進(jìn)了演講者的差異性 。 數(shù)字圖形展示了語(yǔ)音識(shí)別系統(tǒng)的主要組成部分。數(shù)字化語(yǔ)音信號(hào)先轉(zhuǎn)換 成一系列有用 的測(cè)量值或有特定速率的特征,通常每次間隔 10 20毫秒(見(jiàn)第 章節(jié),分別描述了模 擬信號(hào)和數(shù)字信號(hào)的處理)。然后這些測(cè)量被用來(lái)尋找最有可能的備選詞匯,使用被聲學(xué) 模型、詞匯模型、和語(yǔ)言模型強(qiáng)加的限制因素。 整個(gè)過(guò)程中,訓(xùn)練數(shù)據(jù)是用來(lái)確定模型 參數(shù)值的。 語(yǔ)音識(shí)別系統(tǒng)嘗試在上述變異的來(lái)源的某些方面做模型。在信號(hào)描述的層面上,研究 人員已經(jīng)開(kāi)發(fā)出了感性地強(qiáng)調(diào)重要發(fā)言者獨(dú)立語(yǔ)音信號(hào)的特征,以及忽略發(fā)言者依賴(lài)環(huán)境 的語(yǔ)音信號(hào)特征。在聲學(xué)語(yǔ)音層面上,說(shuō)話(huà)人差異變化通常是參照使用大量的數(shù)據(jù)來(lái)做 模 型。語(yǔ)音改編法則還開(kāi)發(fā)出適應(yīng)說(shuō)話(huà)人獨(dú)立聲學(xué)模型 以適應(yīng)那些目前在系統(tǒng)中使用的說(shuō) 話(huà)人語(yǔ)音樣本(參見(jiàn)文章)。在語(yǔ)言方面語(yǔ)境影響的聲學(xué)語(yǔ)音處理,通常情況下被不同的 訓(xùn)練模式分隔為單獨(dú)的音素,這就是所謂的上下文相關(guān)聲學(xué)模型。 字級(jí)差異可以由發(fā)音網(wǎng)絡(luò)中可描述的字詞的候選發(fā)音來(lái)處理。對(duì)于象聲詞的替代,考 慮到方言以及口音的影響,通過(guò)搜索算法在網(wǎng)絡(luò)上尋找音素的替代方法。統(tǒng)計(jì)語(yǔ)言的模型 基于對(duì)字序列的發(fā)生頻率的估計(jì),常常通過(guò)可能的詞序來(lái)引導(dǎo)搜索。 眾所周知在過(guò)去的 15 年中占主導(dǎo)地位的識(shí)別范例是隱馬爾可夫模型( HMM)。基于 HMM 是一種雙隨機(jī)模型,基本音素字符串和框架的生成,表面聲波的變現(xiàn)都作為馬氏過(guò) 程來(lái)表述,在本章節(jié)中所討論的和 節(jié)中的神經(jīng)網(wǎng)絡(luò)也被用來(lái)估算框架的基本性能,然 后將這些性能集成到基于 HMM 的系統(tǒng)架構(gòu)中,即現(xiàn)在被稱(chēng)為的混合系統(tǒng)所述的,參見(jiàn)第 節(jié)。 基于 HMM 系統(tǒng)框架的一種有趣的特點(diǎn),就是相比明確的定義而言,語(yǔ)音片段是在搜 索過(guò)程中被定義的。另一種方法,是先找出語(yǔ)音片段,然后將這些片段分類(lèi)并使用片段性 能來(lái)識(shí)別文字。這種做法已經(jīng)產(chǎn)生在一些生產(chǎn)任務(wù)的競(jìng)爭(zhēng)識(shí)別性能上了。 二 目前發(fā)展現(xiàn)狀 討論目前的發(fā)展?fàn)顩r ,需要聯(lián)系到具體應(yīng)用的環(huán)境 ,他影響到了任務(wù)的制約性。此外, 有時(shí)不同的技術(shù)適合于不同的任務(wù)。 例如,當(dāng)詞匯量小,整個(gè)單詞可以建模為一個(gè)單元。 但這種做法對(duì)大詞匯量來(lái)說(shuō)是不實(shí)際的,如字詞模式必須由單一字詞單元建立。 過(guò)去十年目睹識(shí)別技術(shù)在語(yǔ)音方面取得重大進(jìn)展。字錯(cuò)誤率持續(xù)每?jī)赡晗陆? 50%?;? 礎(chǔ)技術(shù)已取得了重大的進(jìn)展,從而降低了說(shuō)話(huà)人獨(dú)立語(yǔ)音,連續(xù)語(yǔ)音及大詞匯量語(yǔ)音識(shí)別的障礙。有幾個(gè)因素促成了這種迅速的進(jìn)展。 首先, HMM 時(shí)代即將到來(lái)。 HMM 模型 規(guī)模強(qiáng)大,以及 具有有效地訓(xùn)練數(shù)據(jù),可以自動(dòng)訓(xùn)練出模型的最佳的性能。 第二,很大的努力已經(jīng)投入到語(yǔ)音系統(tǒng)大量詞匯識(shí)別的發(fā)展、訓(xùn)練和測(cè)試上。 語(yǔ)料 庫(kù)其中一些是專(zhuān)為語(yǔ)音聲學(xué)研究的,也有非常具體的任務(wù)。 如今,這并非罕見(jiàn)有成千上 萬(wàn)可行的句子提供給系統(tǒng)來(lái)訓(xùn)練及測(cè)試。 這些語(yǔ)料庫(kù)允許研究人員量化語(yǔ)音聲學(xué)的重要 內(nèi)容,以確定識(shí)別參數(shù)在統(tǒng)計(jì)上是有意義的方式。盡管許多語(yǔ)料(如論文利用 TIMIT,馬 幣,車(chē)號(hào)自動(dòng)識(shí)別等,參見(jiàn) 節(jié))原本是在美國(guó)國(guó)防部高級(jí)研究計(jì)劃局的贊助下收集的 人類(lèi)的語(yǔ)言來(lái)刺激其承辦商的技術(shù)發(fā)展,然而他們獲 得了世界的廣泛認(rèn)可(例如,英國(guó), 加拿大,法國(guó),德國(guó),日本,)作為評(píng)價(jià)標(biāo)準(zhǔn)來(lái)建立語(yǔ)音識(shí)別。 第三,取得的進(jìn)展所帶來(lái)的性能評(píng)價(jià)標(biāo)準(zhǔn)的建立。 十年前,研究人員僅測(cè)試他們的 系統(tǒng)培訓(xùn)和利用當(dāng)?shù)厥占臄?shù)據(jù),并沒(méi)有很仔細(xì)劃分培訓(xùn)和測(cè)試。 因此,這樣便很難比 較系統(tǒng)的全面性能,以及它所給出的數(shù)據(jù)在之前未出現(xiàn)時(shí),系統(tǒng)的性能便逐漸退化。公共 領(lǐng)域最近提供的數(shù)據(jù)按照評(píng)價(jià)標(biāo)準(zhǔn)的規(guī)范,致使試驗(yàn)結(jié)果相同,從而有助于提高監(jiān)測(cè)的可 靠性(語(yǔ)料庫(kù)發(fā)展活動(dòng)的主體和評(píng)價(jià)方法,分別在 12 和 13 章作了總結(jié))。 最后,計(jì)算機(jī)技術(shù)的進(jìn)步,也 間接影響了人類(lèi)的進(jìn)展。 提供大容量存儲(chǔ)能力的快速 且低廉的電腦,使研究人員能夠短時(shí)間運(yùn)行許多大型規(guī)模的實(shí)驗(yàn)。 這意味著經(jīng)過(guò)實(shí)踐和 評(píng)價(jià)后的想法,它所花費(fèi)的時(shí)間大大減少。 事實(shí)上,合理性能的語(yǔ)音識(shí)別系統(tǒng)現(xiàn)在可以 在無(wú)附加設(shè)備的高端工作站隨時(shí)運(yùn)行 這在幾年之前仍是個(gè)不可思議的想象。 其中最普遍的,最有用的和困惑最低最有潛在的任務(wù)是數(shù)字識(shí)別。對(duì)于美國(guó)英語(yǔ),獨(dú) 立演講者的連續(xù)數(shù)字串識(shí)別和電話(huà)寬帶限制的語(yǔ)音可以達(dá)到 %的誤碼率,前提是字符 串的長(zhǎng)度已知。 其中最著名的中等難度的任務(wù)是 1000 字的所謂 資源管理( RM)的任務(wù),其用來(lái)查詢(xún) 各種有關(guān)太平洋海軍艦艇的研究。最好的獨(dú)立執(zhí)行任務(wù)的語(yǔ)音設(shè)備執(zhí)行 RM 任務(wù)不超過(guò) 4%,用文字語(yǔ)言模型約束給定的單詞。 最近,研究人員已經(jīng)開(kāi)始處理自發(fā)語(yǔ)音識(shí)別的問(wèn) 題了。例如,在航空旅游信息服務(wù)( ATIS)域,超過(guò) 3%的誤碼誤率少報(bào)了近 2021 字的詞 匯和二元語(yǔ)言模型大約 15 的混亂度。 數(shù)千字詞匯任務(wù)的高混亂度主要產(chǎn)生于聽(tīng)寫(xiě)任務(wù)中。語(yǔ)音系統(tǒng)成立多年,使用鼓勵(lì)詞 后,研究機(jī)構(gòu)從 1992 年開(kāi)始向超大詞匯( 20210 字以上),高混亂度( P≈200),獨(dú)立連 續(xù) 語(yǔ)音識(shí)別發(fā)展。 1994 年的最好的語(yǔ)音系統(tǒng)實(shí)現(xiàn)了從北美商業(yè)新聞中讀取句子并描述僅率 %的誤碼率的成績(jī)。 隨著語(yǔ)音識(shí)別性能的不斷改善,系統(tǒng)現(xiàn)正部署在電話(huà)和許多國(guó)家的蜂窩網(wǎng)絡(luò)。統(tǒng)現(xiàn)正 部署在電話(huà)和許多國(guó)家的蜂窩網(wǎng)絡(luò)。在未來(lái)幾年中,語(yǔ)音識(shí)別的電話(huà)網(wǎng)絡(luò)將在世界各地普 遍存在。有巨大的力量推動(dòng)這項(xiàng)技術(shù)的發(fā)展,在許多國(guó)家,觸摸音普及率低,聲音是自動(dòng) 控制服務(wù)的唯一選擇。在語(yǔ)音撥號(hào),例如,用戶(hù)可以撥打 10 20 語(yǔ)音電話(huà)號(hào)碼(例如,打 電話(huà)回家后)登記,說(shuō)他們的聲音與電話(huà)號(hào)碼相關(guān)的話(huà)。 AT& T 公司,另一 方面,安裝 了呼叫路由系統(tǒng)使用揚(yáng)聲器獨(dú)立字研配技術(shù),可檢測(cè)數(shù)(例如,個(gè)人對(duì)個(gè)人的關(guān)鍵短語(yǔ), 要求在諸如句子卡):我想給它充電我電話(huà)卡。 目前,一些非常大的詞匯聽(tīng)寫(xiě)系統(tǒng)可用于文檔生成。這些系統(tǒng)通常需要對(duì)詞與詞之間 暫停發(fā)言。他們的表現(xiàn)可以得到進(jìn)一步加強(qiáng),如果可以報(bào)考,如支配的具體領(lǐng)域限制的醫(yī) 療報(bào)告。 盡管正在取得很大進(jìn)展,機(jī)器是從認(rèn)識(shí)到對(duì)話(huà)的講話(huà)很長(zhǎng)的路。在語(yǔ)料庫(kù)的總機(jī)電話(huà) 交談字識(shí)別率是 50%左右。這將是許多年以前無(wú)限的詞匯,非特定人連續(xù)聽(tīng)寫(xiě)能力得以實(shí) 現(xiàn)。 三 未來(lái)發(fā)展方向 1992 年,美國(guó)國(guó) 家科學(xué)基金會(huì)主辦的研討會(huì),以確定人類(lèi)語(yǔ)言技術(shù)領(lǐng)域重點(diǎn)研究的 挑戰(zhàn),以及工作需要的基礎(chǔ)設(shè)施支持。研究的主要挑戰(zhàn)歸納為語(yǔ)音識(shí)別技術(shù)的以下幾個(gè)方 面: 濾波性 : 在一個(gè)強(qiáng)大的系統(tǒng),性能緩慢下降(而不是災(zāi)難性的)作為條件使得所與訓(xùn)練的數(shù)據(jù)更為不符。在信道特征的差異和聲學(xué)環(huán)境上應(yīng)受到特別重視。 可攜性: 便攜性是指目標(biāo)的快速設(shè)計(jì),開(kāi)發(fā)和部署新的應(yīng)用系統(tǒng)。目前,當(dāng)系統(tǒng)時(shí)常遭受重大 退化時(shí),它便移動(dòng)到一個(gè)新的任務(wù)上。 為了返回到峰值性能,他們必須接受培訓(xùn)的具體 例子來(lái)完成新的任務(wù),這樣即費(fèi)時(shí)又昂貴。 適應(yīng): 如何能 適應(yīng)系統(tǒng)不斷變化的條件(新?lián)P聲器,麥克風(fēng),任務(wù)等)和使用,通過(guò)使用改 進(jìn)?這種適應(yīng)可能發(fā)生在多層次的系統(tǒng),模型子字,詞的發(fā)音,語(yǔ)言模型等。 語(yǔ)言模型: 當(dāng)前系統(tǒng)使用統(tǒng)計(jì)語(yǔ)言模型,是為了幫助減少搜索空間和解決聲音的含糊問(wèn)題。隨著 詞匯量的增長(zhǎng)和其他方面的限制放寬,創(chuàng)造更適合人類(lèi)居住的系統(tǒng),這將使越來(lái)越重要的 語(yǔ)言模型可以得到盡可能多的約束,也許結(jié)合句法,并不能由純粹的統(tǒng)計(jì)模型捕獲語(yǔ)義約 束。 確保措施: 大多數(shù)語(yǔ)音識(shí)別系統(tǒng)分配分?jǐn)?shù)來(lái)假設(shè)為基層來(lái)行使目的。這些分?jǐn)?shù)不提供或不充分表 明他們是否有一個(gè)假設(shè)是 正確的,只是因?yàn)檫@些假設(shè)優(yōu)于其他。當(dāng)我們按任務(wù)要求開(kāi)始行 動(dòng)時(shí),我們需要更好的方法來(lái)評(píng)估假設(shè)的絕對(duì)正確性。 超綱詞匯: 系統(tǒng)設(shè)計(jì)使用一套特定的單詞,但系統(tǒng)的用戶(hù)可能不知道哪些詞是屬于詞匯系統(tǒng)中 的。這導(dǎo)致了某些自然條件下,超綱詞匯占據(jù)了一定的百分比。系統(tǒng)必須有一些方法來(lái)檢 測(cè)超綱的詞匯,否則最終將會(huì)從詞匯單詞映射到未知的單詞,導(dǎo)致發(fā)生錯(cuò)誤。 自發(fā)演講: 系統(tǒng)部署的行為是一個(gè)真正處理各種常見(jiàn)的自發(fā)講話(huà)的現(xiàn)象,如填充停頓,錯(cuò)誤的開(kāi) 始,猶豫,在講話(huà)中的不合語(yǔ)法的結(jié)構(gòu)和其他沒(méi)有發(fā)現(xiàn)的行為。 在飛機(jī)任務(wù)上的發(fā)展, 意味著在這一領(lǐng)域中的進(jìn)展,但仍有許多工作要做。 韻律: 韻律是指在一些片段或字組上加以擴(kuò)大的聲學(xué)結(jié)構(gòu)。通過(guò)音量、語(yǔ)調(diào)和節(jié)奏來(lái)表達(dá)文 字識(shí)別和用戶(hù)意圖的重要信息(例如,諷刺、憤怒)。目前的系統(tǒng)并不能識(shí)別韻律的結(jié)構(gòu)。 如何把韻律信息整合到識(shí)別系統(tǒng)中來(lái)是一個(gè)尚未解決的關(guān)鍵性問(wèn)題。 建模動(dòng)態(tài): 假設(shè)一個(gè)系統(tǒng)的輸入,他們一般被視為獨(dú)立的被幀序列。但據(jù)了解,對(duì)于文字和音素 知覺(jué)線(xiàn)索的性質(zhì),其所需要整合的功能,反映了音節(jié)的動(dòng)態(tài),這是動(dòng)態(tài)性的變動(dòng)整合。如 何做動(dòng)態(tài)模型識(shí)別系統(tǒng),并將其納入到語(yǔ)音識(shí)別系統(tǒng)中來(lái)仍是個(gè)未解 決的問(wèn)題。
點(diǎn)擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1