【正文】
為所有指向它的頁面的 Hub值之和。在 O步驟中每個頁面的 Hub值為所有指向它的頁面的 Authority值之和。定義如下: I 步驟 : O 步驟 ? 初始時 : h(v)= a(u)= 1 HITS算法迭代計算這兩個步驟,直到兩個數(shù)值最后收斂為止。 HITS算法是在線計算的,算法的開銷比較大,對每次的查詢都需要臨時的計算。 HITS算法的評價 ? 若一個網(wǎng)頁由很多好的 Hub指向,則其權(quán)威值會相應增加 (即權(quán)威值增加為所有指向它的網(wǎng)頁的現(xiàn)有 Hub值之和 ) ? 若一個網(wǎng)頁指向許多好的權(quán)威頁,則 Hub值也會相應增加 (即 Hub值增加為該網(wǎng)頁鏈接的所有網(wǎng)頁的權(quán)威值之和 ) ? HITS算法輸出一組具有較大 Hub值的網(wǎng)頁和具有較大權(quán)威值的網(wǎng)頁。 Learning to rank ? is a type of supervised or semisupervised machine learning problem in which the goal is to automatically construct a ranking model from training data. Training data consists of lists of items with some partial order specified between items in each list. This order is typically induced by giving a numerical or ordinal score or a binary judgment (. relevant or not relevant) for each item. Ranking model39。s purpose is to rank, . produce a permutation of items in new. Learning to rank ? 考慮到文檔的各種可利用的特征,如 tf, idf, BM25, pagerank(google), 等 ? 利用各種組合方法形成排序函數(shù),如利用遺傳算法等。 利用 querylog ? 利用用戶的瀏覽信息,對鏈接網(wǎng)頁的點擊,被稱為是從用戶的角度的鏈接分析。建立瀏覽圖 G(V,E), u,v ∈ E, 若用戶從網(wǎng)頁 u的鏈接,點擊進入網(wǎng)頁 v。一個網(wǎng)頁 v被點擊的次數(shù)越多,停留的時間越長,說明該網(wǎng)頁重要。 結(jié)論 ? Page Rank 計算是信息檢索中的最具挑戰(zhàn)性的研究之一,目前研究的重點。 ? 目前有許多研究結(jié)果, softrank, BankRank,…,