正文內(nèi)容

ir-lab胡曉光-資料下載頁

2025-09-18 23:57本頁面

【導讀】檢索模型是一個四元組[D,Q,F,R]. 把索引中的每個詞作為空間的一個維度。把每一個查詢也作為空間中的一個向量。通過計算文檔和查詢的內(nèi)積或余弦等來表。根據(jù)詞項在文檔和文檔集中的頻率。其中tfi,j可以先歸一化處理。TermQuery為Lucene支持的最簡單的查詢方式。其中的idf和boost值與文檔無關不影響排名。fieldboost人為賦予的經(jīng)驗值默認值都為。此時lucene按照單位長度的文檔包含的關鍵詞個數(shù)。BooleanQuery是一種復合式的Query支持多。＋俄羅斯恐怖事件－美國?？梢詫Σ煌膓uery賦予不同的boost值表示。整理可得計算公式如下。Lucene支持的邏輯操作例子。對于強制符號+和－會首先對匹配結果進行。有三篇文本內(nèi)容如下。按照缺省方式建索引fieldboost=. 首先可算得fieldnorm分別為，，注意norm在實現(xiàn)時只用了1個字節(jié)表示故誤差較大。輸入多個關鍵詞studentchina

　　

【正文】 Lee is a es from China. ? 按照缺省方式建索引 fieldboost = ? 根據(jù)公式 fieldnorm = fieldboost / sqrt(fieldlength) ? 首先可算得 fieldnorm分別為，， ? 注意 norm在實現(xiàn)時只用了 1個字節(jié)表示故誤差較大信息檢索實驗室 Lucene檢索實例 ? 現(xiàn)在輸入查詢 student 計算每篇文檔分值 ? score = sqrt(freq) * idf * boost * norm ? idf = ln(maxDoc/(docFreq + 1) )+ ? 可得計算結果如下文檔 docFreq idf freq norm score aaa 3 2 bbb 3 1 ccc 3 1 信息檢索實驗室 Lucene檢索實例 ? 輸入多個關鍵詞 student china ? scorej = coordj*∑i(boost i*idf i*tfi,j*idfi*fieldnorm) / sqrt(∑i (idf i *idf i *boost i *boost i)) ? 可得計算結果如下文檔 queryNorm student china coord score aaa bbb ccc 信息檢索實驗室 Any Question?

點擊復制文檔內(nèi)容

教學課件相關推薦

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

ir-lab胡曉光-資料下載頁

lab通道調(diào)色-資料下載頁

ir感覺系統(tǒng)精講-資料下載頁

ir2530ioffice365郵件服務器設置-資料下載頁

lab-6血清抗體的分離與純化-資料下載頁

lab367-oracle-資料下載頁

canon-佳能-ir-資料下載頁

ir熱釋紅外報警器電子狗的制作-資料下載頁

labequipment-champaign實驗室設備-香檳分校-資料下載頁

lab02_相關信息檢索分析與項目目標-資料下載頁

lab1[1]李巖-資料下載頁

lab1[1]張瀟瀟-資料下載頁

lab2趙小娜-資料下載頁

王衛(wèi)華-lab-資料下載頁

lab02董學艷-資料下載頁

教你用ps和ir打造非主流多樣閃動頭-資料下載頁

ir-lab胡曉光-文庫吧在線文庫

ir-lab胡曉光(完整版)

ir-lab胡曉光(更新版)

ir-lab胡曉光(專業(yè)版)

ir-lab胡曉光(留存版)