freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

htk語音建模使用方法經(jīng)驗總結(jié)(編輯修改稿)

2024-12-14 16:34 本頁面
 

【文章內(nèi)容簡介】 表,這里我們采用LMTutorial文件夾下的 ,里面包含了五千個常用字 (可以將總的 MLF文件進行高級排序,選中刪除重復(fù)項那個選項,在排序的結(jié)果上去掉除了字以外的信息,比如說帶有 lab的行和句號 ),接下來我們利用 LGCopy過濾掉字表外的字,講訓(xùn)練文本中所有字表外的字歸納到一類,這個類的標(biāo)記為 !!UNK LGCopy T 1 o m lm_5k/ b 202000 d lm_5k w * o表示所有帶字表外的字的文法都會被提取出來存放在 lm_5k目錄下,生成data.*, 同時產(chǎn)生一個新的字圖 ,這個字圖只包含在字表中出現(xiàn)的字和符號 !!UNK。 接下來 生成一元文法語言學(xué)模型: LBuild T 1 n 1 lm_5k/ lm_5k/ug 生成的一元文法模型 ug存放在 lm_5k目錄下 生成二元文法模型: LBuild T 1 c 2 1 –n 2 l lm_5k/ug lm_5k/ lm_5k/bg1 * lm_5k/data.* c 2 1表示舍棄出現(xiàn)不超 過一次的二元文法, n 2表示生成二元文法語言學(xué)模型, l lm_5k/ug表示更新已經(jīng)存在的 ug來產(chǎn)生新的模型。 生成三元文法模型: LBuild T 1 c 3 1 n 3 l lm_5k/bg1 lm_5k/ lm_5k/tg1_1 * lm_5k/data.* c 3 1表示舍棄出現(xiàn)不超過一次的三元文法。 也可以不通過一元二元文法模型直接生成三元文法: LBuild T 1 c 2 1 c 3 1 n 3 lm_5k/ lm_5k/tg21_1 * lm_5k/data.* 講二元文法語言模型轉(zhuǎn)換成 lattice形式。 HBuild n bg1 s s /s n bg1表示輸入語言學(xué)模型 bg1, s s /s表示設(shè)定起始點和終點分別為 s /s,設(shè)置這個之后在后續(xù)的處理中需要修改相應(yīng)的字典, 表, lattice形式的語言學(xué)模型, 這個可以直接被 HVite所用。 類 的語言學(xué)模型訓(xùn)練 首先建立一個 classes map,用來指定哪個字在哪個類,同時需要定義類的數(shù)量,類的數(shù)量定義的越多,分類越細,計算時間也越長,利用 Cluster來完成這一步聚類 Cluster T 1 c 150 i 1 k o * lm_5k/data.* c 150表示定義 150個不同的類; i 1表示進行一次迭代計算,實驗表明迭代多 次并不能講識別率提高多少,花費時間也比較多; k表示將字表外的字歸納在一個類; o ,并將其保存在,這條命令會在 ,其中用來訓(xùn)練模型的文件為 ,這個文件稱為 class map,列出了分類的詳細情況。、 接下來利用 LGCopy生成 classes ngram,這個與前面所生成的文法文件不同的是原來的文法文件包含的是字的序列, classes ngram則是講字替換成其所在的類的名稱: LGCopy T 1 d m lm_5k/ * lm_5k/data.* d , m 圖,這個字圖包含了每個類的名字,在這里稱其為字圖的原因是它的用法跟前面的字圖是一樣的,生成的 classes ngram保存在 , 文件名 為 data.*。 基于類的語言學(xué)模型共有兩個成分組成,一個是 classes ngram的模型形式,一個是 wordgivenclass,這個文件 可以給出 分類之后 某個 字 出現(xiàn) 的 次數(shù) 除以字所在的類的 出現(xiàn)次 數(shù)的 概率值,也可以只給出出現(xiàn)的次數(shù)。 首先生成 classes ngram的模型形式: LBuild T 1 c 2 1 c 3 1 n 3 * 生成的文件保存在 lm_5k目錄下,文件名為 。 然后生成 wordgivenclass: Cluster l lm_5k/ * lm_5k/data.* q表示給出出現(xiàn)的次數(shù),如果用 p,則給出概率,生成的文件 保存在 lm_5k目錄下,文件名為 。 可以通過 LLink講兩個文件連接起來: LLink lm_5k/ lm_5k/ lm_5k/cl150tg_1_1 生成的文件保存在 lm_5k目錄下,文件名為 cl150tg_1_1。 也可以生成一個總的模型: LLink s lm_5k/ lm_5k/ lm_5k/ 生成的文件保存在 lm_5k目錄下,文件名為 。 這個文件不能直接被 Hvite所用,但是能直接被 HDecode所用 。 四 補充 HLRescore可以利用三元文法語言學(xué)模型 將 HVite生成的 二元文法的 lattice重新判分,對 lattice中語言學(xué)模型的得分進行更新,聲學(xué)模型的分值不變,同時搜索出一條最優(yōu)路徑。 HLRescore C S f i n tg_lm L lat_bg
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1