freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于信息理論的鑒別信息測量_畢業(yè)論文(留存版)

2025-09-13 23:41上一頁面

下一頁面
  

【正文】 ?? ? 中提取的,且 )|()()( 21 ?? ??? HtPtPtPP AA ?? 。 因此, 0)()}(),(m a x {212112* ??? tif dtif dtif d III?,且 ):(s up 12 HHtJ ? ,因此與第二點(diǎn)比較, 0)( ?tifdJ 表明 t支持 2H 比 ?H 更多一些。 ??? ittVt ,則有 ),(),( 139。 TM的實(shí)例 TM 通常指的是提取新的、以前并不知道的知識(shí)的過程 ,它是通過從文本信息源中自動(dòng)提取關(guān)鍵詞, TM 的一個(gè)典型例子發(fā)生在基因組學(xué)領(lǐng)域:蛋白質(zhì)與其他蛋白質(zhì)相互作用,為預(yù)測它們的相互作用,現(xiàn)有一些統(tǒng)計(jì)模型學(xué)習(xí)方法可以在討論蛋白質(zhì)文件中確定詞共 現(xiàn)模型。 IR的實(shí)例 在 IR中,用戶提供的問題(作為主體)對于用戶的信息需求來說,通常是不夠的、不準(zhǔn)確的或是不完全的描述,一個(gè)恢復(fù)的系統(tǒng)僅通過用戶的查詢是不能 25 被期望產(chǎn)生理想的結(jié)果。 ● ),( 1* ?trelI 和 ),( 21* ?? ?trelJ 應(yīng)用在查詢的不同部分時(shí),它們顯示的性能很相似,在所有的評估點(diǎn)上,它們都幾乎優(yōu)于 ),( 21* ?? ?trelK 。 —— ),( 211 ?? ?trelD 和 ),( 212 ?? ?trelD 具有正值,并不表示 21 tt和 (其中121, Vtt ? )是相互緊密聯(lián)系的。從本文研究 中可以看出,這直觀的概念與本文中所介紹的其他概念是有區(qū)別的:詞和對象的關(guān)聯(lián)性。從 TREC 相關(guān)評估提供 的 有關(guān)文件 ,使用的標(biāo)準(zhǔn)評價(jià)措施是: PK(在排名 前 K文件的平均精度,其中 K=5,10) ,AP(50 個(gè)查詢中的評價(jià)精度 ) , RP(RP 精度 —— 文件 R 號的精度 )。在我們的系統(tǒng)中,所有文件都是有來源的,所有的禁用詞都被刪除了。 2. ),( 21 ?? ?trelJ 是 ),( 1?trelJ 和 ),( 2?trelJ 的代數(shù)加權(quán)和 ,因此0),( 211 ?? ??trel J 和 0),( 212 ?? ??trel J 這 兩個(gè)值并不能保證 21 tt和 兩個(gè)密切相關(guān),為鑒定 1V 中的詞互相密切相關(guān), 則可通過式 (15)為每個(gè)選定詞的查證。 在定義 ,根據(jù)式 (9)(14)給出的鑒別測量方法,我們可以寫出關(guān)聯(lián)性測定的一系列定義,很顯然下面三個(gè)定義是定義 : 定義 設(shè)每個(gè) Vt? 都有 )()( tPtP AA ?? ,在每個(gè) Vt? 中, t與對象 1? 之間的關(guān)聯(lián)性可以由下式規(guī)定: )( )(l og)()()()(),( 111 tP tPtPttif dttr e l AAAII ???? ??? (17) 定義 設(shè)每個(gè) Vt? 都有 )()( tPtP AA ?? 且 )()( tPtP AA ?? ,在每個(gè) Vt? 中, t與對象 1? 之間的關(guān)聯(lián)性可以由下式規(guī)定: ),()()(),( 11112 ??? tre ltif dttre l IIJ ??? 上式在式( 17)已給出; t與對象 2? 之間的關(guān)聯(lián)性可以由下式規(guī)定: )( )(l og)()()()(),( 222 21 tP tPtPttif dttr e l AAAIJ ???? ??? (18) t與對象 21 ??? 之間的剩余關(guān)聯(lián)性可以由 下式規(guī)定: ),(),(),( 2121 ???? tr eltr eltr el JJJ ??? (19) 20 定義 對每個(gè) Vt? 設(shè) )()()( 21 tPtPtP AA ?? ??? ,在每個(gè) Vt? 中, t與對象 1? 之間的關(guān)聯(lián)性可以由下式規(guī)定: )()(),(111 tifdttrel IK ??? ?? (20) )()( )(l og)()( 211 tPtP tPtPt AA AA ??? ??? t與對象 2? 之間的剩余關(guān)聯(lián)性可以由下式規(guī)定: )()(),(222 tif dttr e l IK ??? ?? (21) )()( )(l og)()( 212 tPtP tPtPt AA AA ??? ??? t與對象 21 ??? 之間的剩余關(guān)聯(lián)性 可以由下式規(guī)定: ),(),(),( 221121 ?????? tr e ltr e ltr e l KKK ??? (22) 特別是,如果我們只考慮鑒別信息而沒將對象的權(quán)重合并到關(guān)聯(lián)值中, 上面所說的個(gè)別關(guān)聯(lián)性測量方法的相應(yīng)的關(guān)聯(lián)性測定法可以寫出,例如: )(),( 1* tifdtrel II ?? (23) )()()(),(211221* tif dtif dtif dtr e l IIJJ ???? ?? (24) )()()(),(21 2121* tif dtif dtif dtr e l IIKK ?? ???? ???? (25) 它能夠讓我們了解詞的鑒別信息是如何為系統(tǒng)性能發(fā)揮作用的。 b. 0)|:( 21 ?tHHi , t也傳達(dá)支持 2H 反對 1H 的信息,且它有助于支持 2H 反對 1H 的 )(2121 tifdifd II ??。 鑒別測量 方法 設(shè) 21 HH和 是分別從 AA和 中取的詞 t,設(shè) )|()( 1HtPtP A ? 和 )|()( 2HtPtPA ?分別從 AA和 中取出,為深入了解鑒別信息和它的屬性,我們需要引入 一個(gè)符號—— 將這個(gè)符號定義為鑒別因子。,( 2121 ?? ?? PPIPPIPPK AAAA ???? (8) ?? ???? Vt AA AAAA AAAA tPtP tPtPtPtP tPtP tPtP ))()( )(l og)()()( )(l og)( )(l og)(( 2122111 ??????? 在散度測量中對數(shù)的底數(shù)是不重要的,在整個(gè)文中,對數(shù)都是取底數(shù)為 2,除非有特殊說明。因而關(guān)聯(lián)性 的 測量應(yīng)該是一個(gè)由 )()( )()( tifdt iDii 和、 ??決定的復(fù)合函數(shù);在先驗(yàn)概率 },...,{ 21 MP ???? ? 下, 剩余的關(guān)聯(lián)性測量應(yīng)該是個(gè)別 C 中 si)(? 的加權(quán)代數(shù)和,則我們下列形式定義得到一些聲明: 定義 設(shè) D是式( 1)中給出的散度測量,對于已知 Vt? , t和 i? 的關(guān)聯(lián)性由下式?jīng)Q定 : ))(),((),( )()( tif dttrel iDiiiD ?? ?? , (4) 則余下的 t與 M??? ??? ...21 的關(guān)聯(lián)性由下式?jīng)Q定: ),()...,(121 iDMi iMD tr e ltr e l ????? ????? ?? (5) ))(),(( )()(1 tifdtiDiiMi i ?? ??? ??, 其中鑒別測量 ), . . . ,2,1(),()( Mitifd iD ? 在式( 2 )中給出了,所有). . .,(), . . . ,2,1)(,( 21 MDiD tr e lMitr e l ???? ???? 和都成為關(guān)聯(lián)性測量。 注意已知詞的 ssc 的概念是在 C 上而非 V 上, 且在 )(tsscD 的所有類別都接收相 同的最強(qiáng)支持度 *? ,根據(jù)統(tǒng)計(jì)特性分類, 0*?? 跟詞之間很大的不同。 以上的討論已經(jīng)回答了第一個(gè)問題。 擁有最大可觀量的類別稱為這個(gè)類別中詞的最強(qiáng)支持類( ssc) 。 接著,我們通過 正式 判讀 集中于 MDI 和按照從分類測量中得到的鑒別 措施 而對第一個(gè)概念進(jìn)行定量表達(dá)。詞可能貢獻(xiàn)的程度被當(dāng)作是詞的信息量測量策略, 用于計(jì)算程度的公式稱為識(shí)別 力測量。我們試圖回答兩個(gè)重要問題: 1)鑒別信息中詞所所傳達(dá)的信息是什么以及我們?nèi)绾螠y量它? 2)什么是詞之間 的關(guān)聯(lián)性以及怎樣去判斷? 我們專注于第一個(gè)問題的研究,基于多種信息測量我們對鑒別測量進(jìn)行了深入地調(diào)查研究,這個(gè) 研究如今 已經(jīng)在很多領(lǐng)域得到 了應(yīng)用。 詞 t’比其他詞含有更多的信息量,這個(gè)觀點(diǎn)很含糊。 我們努力地提出了多種 相關(guān)性 測定方法 :一些是應(yīng)用了詞典(手動(dòng)建立詞庫)[14][15],一些是應(yīng)用了共現(xiàn)統(tǒng)計(jì) (非監(jiān)督學(xué)習(xí)語料庫 )[16][17][18][19][20][21][22][23][24][25][26][27],和一些是應(yīng)用了混合技術(shù) (結(jié)合統(tǒng)計(jì)和詞匯的綜合信息 )[28][29][30][25][31]。通常??ji VV? ,其中 Mji ???1 。({ jjVtjjPDPD ?? ???? (1) ? ?? ? ?? Vt jjiMi i PD } ) ){}。 我們也將通過下列 表達(dá)引出聲明“與其他的假設(shè)相比, t 更是支持假設(shè)的0iH ”。一般,當(dāng) VVVt ii ??? ?, 則 0)( ?ti? ,其中iV?是)(ti? 中詞的集合。 散度測量 方法 設(shè) )()( 1 tPtPA ? 和 )()( 2 tPtPA ? 都是分別從類 A和類 A 中提取的離散詞分布。,( 21 ?AA PPK ?? ,這個(gè) 性質(zhì)表明從所有詞中所得到的信息期望都是非負(fù)的,如果詞的分布信息是相同的,則將沒有信息期望,也就是說他們都滿足分類標(biāo)準(zhǔn)。 )(tifdJ 的闡述 在給出定量表示之前,首先讓我們通過下列的定 理 [42]考慮 )(tifdJ 的屬性: 定量 對任意 Vt? ,若滿足 0)()( ?? tPtP AA ,則我們 通常有 0)( ?tifdJ 且 )()( tPtP AA ? ,則 0)(12 ?tifdI,也就是 0)(21 ?tifdI; 2. 有且只有當(dāng) )()( tPtP AA ? ,則 0)(12 ?tifdI,也就是 0)(21 ?tifdI。 因此, 0)()}(),(m a x {221* ??? ??? tif dtif dtif d III?,且 ):(s u p 2 ?? HHtK ,因此 與第二點(diǎn)比較 , 0)( ?tifdK 表明 t支持 2H 比 ?H 更多一些。注意當(dāng) )(11 ?VVt ??而 0)(1 ?t? 時(shí), 0),( 21 ?? ??trelD 表明 0)( ?tifdD ,但是 0),( 21 ?? ??trelD 并不能保證 A是 t的 ssc,這是因?yàn)橛啥ɡ?,僅因?yàn)?0)( ?tifdD 而推出 ):(sup 21 HHtD ?是不夠的,因此理解 0),( 211 ?? ??trelD 和 0),( 212 ?? ??trelD 這兩個(gè)值并不代表 21 tt和 兩個(gè)密切相關(guān)是非常重要的。 樹基是我們使用的語料庫之一,它是系統(tǒng)進(jìn)化的關(guān)系型數(shù)據(jù)庫。第二組是 ),( 1* ?trelI ,),( 21* ?? ?trelJ 和 ),( 21* ?? ?trelK ,它們分別在式 (23)(25)給出了。通過散度措施 D中詞 )(tifdD 和子項(xiàng) )()( tifdiD ,我們定量表示了它。 28 參考文獻(xiàn) [1] C. Fellbaum, 詞匯網(wǎng)絡(luò):一個(gè)電子詞匯數(shù)據(jù)庫 . The MIT Press, 1998. [2] G. Miller, “詞匯網(wǎng)絡(luò):一個(gè)在線詞匯數(shù)據(jù)庫 ,” Int’l , Special Issue, vol. 3, no. 4, pp. 235244, 1990. [3] . Turney, “相似的語義關(guān)系 ,” 計(jì)算機(jī)語言學(xué) ,vol. 32, ,pp. 379410, 20xx. [4] I. Dagan, “上下文的詞語相似度 ,” 自然語言處理手冊 , pp. 459475, Marcel Dekker, Inc., 20xx. [5] A. Budanitsky and G. Hirst, “基于 WordNet的詞匯語義相關(guān)措施 的 評價(jià) ,” 計(jì)算機(jī)語言學(xué) ,vol. 4, no. 1, pp. 149, 20xx. [6] A. Budanitsky and G. Hirst, “在 WordNet的語義距離:五項(xiàng)面向應(yīng)用的評價(jià)實(shí)驗(yàn) ,”Proc. Workshop WordNe
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1