freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

google搜索引擎工作原理簡介-資料下載頁

2025-08-12 01:27本頁面

【導(dǎo)讀】翻譯整理簡化而成。盡管Google一直在修正不同因素對網(wǎng)頁的權(quán)重影響以期排。除作弊網(wǎng)站對搜索結(jié)果的干擾和獲得最好的搜索結(jié)果,但其核心思路并沒有改。比較重要或者質(zhì)量較高。除了考慮網(wǎng)頁鏈接數(shù)量之外,Google還要參考鏈接網(wǎng)。頁本身的級別,以及這個網(wǎng)頁有多少正向鏈接到其它網(wǎng)頁。d:阻尼系數(shù),0<d<1,通常設(shè)為。的深入分析,我在方便的時候會另外寫一篇文章介紹)。PageRank可以被理解為用戶的一個行為模型。隨機訪問的概率。Google對連接描述文字進行了特殊的處理。以誤導(dǎo)搜索引擎。系列的關(guān)鍵字排序,稱為命中hits。離出網(wǎng)頁中的所有鏈接,將重要的信息存放在Anchors文件之中。置出現(xiàn)的關(guān)鍵字均為plainhits。對每一個有效的wordID,詞庫lexicon中包含了指針指向具體的barrel。它指向由docID組成的doclist列表,以及他們的所對應(yīng)的命中列表hitlists。hits,另一組則包含所有的hits。這樣,google先檢查第一組shortbarrels,

  

【正文】 每一個 hit list 包含了位置,字體,大小寫信息。另為 Google 還參考了 anchor text 以及網(wǎng)頁的 PageRank。 沒有一個單一的因素會對搜索結(jié)果的排序產(chǎn)生太大的影響。 讓我們來看一下單個關(guān)鍵字的查詢: Google 先查看對應(yīng)于這 個單詞的網(wǎng)頁的命中列表 hit list。 Google 區(qū)分每個 hit 由幾種不同的類型 (標(biāo)題 , anchor, URL, 大字體 , 小字體等等) , 每一種類型都有自己的類型權(quán)重 typeweight。 這些typeweights 組成一個由類型向量。 Google 計算每一種類型的命中記數(shù),然后這些命中記數(shù)又轉(zhuǎn)換為計數(shù)權(quán)重 Countweights。計數(shù)權(quán)重開始以線性增加,然后很快就逐漸停止,這樣太多的命中記數(shù)就會沒有作用。 Google 在將Countweights和 typeweight相乘計算出網(wǎng)頁的 IR score。 最后這個 IR score與 PageRank 相結(jié)合得到最終的搜索排序結(jié)果。 對于多關(guān)鍵詞的搜索,計算方法就比較復(fù)雜一些?,F(xiàn)在多個命中列表必須要全部掃描,這樣對那些出現(xiàn)在文章中靠近的 hits 就比那些分開較遠的 hits 有更高的權(quán)重。 那些相接近的 hits 被匹配到一起,然后計算出這些相匹配的 hits 的相關(guān)度 proximity。相關(guān)度是基于這些 hits 出現(xiàn)在文章中的距離決定的,并被分為 10 個不同的值,分別表示為短語匹配( phrase match)到根本不匹配( not even close)。命中計數(shù)不 僅計算每種類型,而且還計算每個類型和他們的相關(guān)度匹配。 每個類型和相關(guān)度配對有一個 typeproxweight 權(quán)重。這個記數(shù)器被轉(zhuǎn)換為計數(shù)權(quán)重。然后這個計數(shù)權(quán)重于與類型相關(guān)權(quán)重 typeproxweights 相乘得到文章的 IR score。當(dāng)然最后是 IR score 與 PageRank 相結(jié)合得到最終的搜索排序結(jié)果。
點擊復(fù)制文檔內(nèi)容
黨政相關(guān)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1