【導(dǎo)讀】網(wǎng)路的搜尋得到資訊。面臨資料量與耗費(fèi)時(shí)間比率的問(wèn)題。如何在許多文章中尋找符合範(fàn)圍的文章。利用資訊萃取及其相關(guān)技術(shù),減少判斷的時(shí)間及。俞士汶段慧明朱學(xué)鋒在基於現(xiàn)代漢語(yǔ)語(yǔ)。近年來(lái)短語(yǔ)辨識(shí)是以語(yǔ)料庫(kù)的標(biāo)注作為判斷基礎(chǔ)。Church進(jìn)一步把HMM用於識(shí)別英語(yǔ)中。標(biāo)注詞性的語(yǔ)料中人工或半自動(dòng)標(biāo)注NP邊界,間出現(xiàn)以上5種狀態(tài)的概率。成為短語(yǔ)邊界標(biāo)注根據(jù)。孫宏林俞士汶層句法分析方法概述,《當(dāng)代語(yǔ)言學(xué)》中提到詞類(lèi)序列看成隨機(jī)事件,互資訊值越高,X和Y組成短語(yǔ)的可能性越大,隱藏式馬可夫模型:。林千翔、張嘉惠在基於特製隱藏式馬可夫。,計(jì)算某一特定輸出序列的機(jī)率,,尋找最可能可以產(chǎn)生某一特定。林一中、洪鵬翔Probabilisticnamed. 在中文裡每個(gè)最小的單位是「字」,因此在中文。等標(biāo)示出來(lái),將會(huì)。HMM是一個(gè)雙重隨機(jī)過(guò)程,兩個(gè)組成部分︰。馬爾可夫鏈︰表示狀態(tài)的轉(zhuǎn)移,用轉(zhuǎn)移機(jī)率描述。[1]林千翔、張嘉惠,民93「基於特製隱藏式馬可夫模型之中文。斷詞研究」,國(guó)立中央大學(xué)資訊工程學(xué)系碩士論文。