freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

[農(nóng)學(xué)]搜索引擎技術(shù)基礎(chǔ)-資料下載頁

2025-10-09 22:39本頁面
  

【正文】 ” 為 1024,然后找到這兩個詞各自的網(wǎng)頁 ID隊列,如下圖所示兩個隊列為“網(wǎng)頁 ID隊列 2”和“網(wǎng)頁 ID隊列 4”。 北大 256 256 北京 …… …… 北大 網(wǎng)頁 ID序列 1 網(wǎng)頁 ID序列 2 …… 搜索引擎 1024 1024 搜索 搜索引擎 網(wǎng)頁 ID序列 3 網(wǎng)頁 ID序列 4 …… …… 四、查詢 /存儲技術(shù)、 Cache Server介紹 (一 ) 查詢 /存儲技術(shù): 搜索引擎常規(guī)存儲 /查詢步驟如下: (3)對步驟 (2)中找到個各個網(wǎng)頁 ID隊列做“與”、“或”、“非”的邏輯運(yùn) 算; (4)獲得最后的搜索結(jié)果網(wǎng)頁 ID隊列。 舉例說明: “北大”和“搜索引擎” 對應(yīng)隊列為“網(wǎng)頁 ID隊列 2”和“網(wǎng)頁 ID隊列 4”,對這兩個隊列做“與”運(yùn)算。 北大 網(wǎng)頁 ID序列 2 1,3,5,9,11 搜索引擎 網(wǎng)頁 ID序列 4 1,2,5,8,11 與運(yùn)算 1, 5, 11 網(wǎng)頁 ID序列 四、查詢 /存儲技術(shù)、 Cache Server介紹 (一 ) 查詢 /存儲技術(shù): 搜索引擎常規(guī)存儲 /查詢步驟如下: (5)完成分頁顯示處理,計算出最后要顯示的各個網(wǎng)頁 ID隊列 (互聯(lián)網(wǎng)搜索網(wǎng)頁時一般每頁顯示 10條 ,所以 ,這個數(shù)目最多為 10),通過這些網(wǎng)頁 ID,查找到相關(guān)的網(wǎng)頁結(jié)構(gòu)體存儲內(nèi)容,顯示搜索結(jié)果給用戶。 舉例說明: “北大”和“搜索引擎” 是用戶查詢詞進(jìn)行分詞出來的兩個詞,在具體的網(wǎng)頁標(biāo)題和網(wǎng)頁內(nèi)容摘要中,分別對這兩個詞做紅色醒目標(biāo)記。 四、查詢 /存儲技術(shù)、 Cache Server介紹 (二 ) Cache Server: WebServer在接受到搜索請求后,對搜索結(jié)果完成查詢時分詞處理,然后向“索引服務(wù)器”發(fā)出查詢請求, “索引服務(wù)器”返回結(jié)果;WebServer對結(jié)果進(jìn)行必要處理,然后向“網(wǎng)頁內(nèi)容”服務(wù)器通信,獲得各個網(wǎng)頁內(nèi)容;最后 WebServer給用戶顯示搜索結(jié)果。 WebServer 索引服務(wù)器 Index Server 網(wǎng)頁內(nèi)容服務(wù)器 Page Content Server 用戶 四、查詢 /存儲技術(shù)、 Cache Server介紹 (二 ) Cache Server: 在對用戶行為進(jìn)行分析后發(fā)現(xiàn),非常多的查詢詞經(jīng)常被用戶查詢,這些詞被稱為“搜索高頻詞”。為此,設(shè)計出來 Cache Server(CS)用于存儲這些高頻詞的搜索結(jié)果,每當(dāng)后臺系統(tǒng)更新后,這些高頻詞先進(jìn)行查詢,然后把查詢結(jié)果放到 CS中,從而減少系統(tǒng)后臺壓力。 WebServer 用戶 CS 索引服務(wù)器 Index Server 網(wǎng)頁內(nèi)容服務(wù)器 Page Content Server 四、查詢 /存儲技術(shù)、 Cache Server介紹 (二 ) Cache Server: CS還可以部署在“索引服務(wù)器”、“網(wǎng)頁內(nèi)容服務(wù)器”和WebServer之間,提高這兩個后臺服務(wù)器的效率。 WebServer CS CS 索引服務(wù)器 Index Server 網(wǎng)頁內(nèi)容服務(wù)器 Page Content Server 四、查詢 /存儲技術(shù)、 Cache Server介紹 (二 ) Cache Server: CS自我定期更新策略 : CS在其設(shè)計中,重點(diǎn)考慮其攔截率,所以, CS的自我定期更新策略就特別重要。 CS在其初始化階段,其存儲數(shù)據(jù)主要來源于原來的日志統(tǒng)計結(jié)果;在 CS運(yùn)行后, CS要實(shí)時監(jiān)控當(dāng)前數(shù)據(jù)流,并定期進(jìn)行自我更新,把那些沒有被訪問過或低訪問率的數(shù)據(jù)刪除,增加新增數(shù)據(jù)。 CS雖然可以提高數(shù)據(jù)訪問時的速度,但如果設(shè)計出來的 CS命中率過低的話,對整個系統(tǒng)效率還反而帶來降低,所以 CS不能濫用,要結(jié)合系統(tǒng)實(shí)際負(fù)荷來設(shè)計和部署 CS系統(tǒng)。
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1