freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

農(nóng)業(yè)信息垂直搜索引擎研究報(bào)告(編輯修改稿)

2024-11-13 04:32 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 的設(shè)計(jì)和實(shí)現(xiàn)使用人機(jī)交互的理論和方法 , 以充分適應(yīng)人 類的思維習(xí)慣 。 從搜索引擎的工作流程來(lái)看看 , 可以看做三步 : 從互聯(lián)網(wǎng)上抓取網(wǎng)頁(yè)一建立 索引數(shù)據(jù)庫(kù)一在索引數(shù)據(jù)庫(kù)中搜索排序 。 從互聯(lián)網(wǎng)上抓取網(wǎng)頁(yè) 利用能夠從互聯(lián)網(wǎng)上自動(dòng)收集網(wǎng)頁(yè)的 Spider系統(tǒng)程序 , 自動(dòng)訪問(wèn)互聯(lián)網(wǎng) , 并沿著任何網(wǎng)頁(yè)中的所有 URL 爬到其它網(wǎng)頁(yè) , 重復(fù)這過(guò)程 , 并把爬過(guò)的所有網(wǎng) 5 頁(yè)收集存放到 URL庫(kù)中 。 建立索引數(shù)據(jù)庫(kù) 由分析索引系統(tǒng)程序?qū)κ占貋?lái)的網(wǎng)頁(yè)進(jìn)行分析 , 提取相關(guān)網(wǎng)頁(yè)信息 (包括 網(wǎng)頁(yè)所在 URL、 編碼類型 、 頁(yè)面內(nèi)容包含的關(guān)鍵詞 、 關(guān)鍵詞位置 、 生成時(shí)間 、大小 、 與其它網(wǎng)頁(yè)的鏈接關(guān)系等 ), 根據(jù)一定的相關(guān)度算法進(jìn)行大量復(fù)雜計(jì)算 , ,得到每一個(gè)網(wǎng)頁(yè)針對(duì)頁(yè)面內(nèi)容中及超鏈中每一個(gè)關(guān)鍵詞的相關(guān)度 (或重要性 ), 然 后用這些相關(guān)信息建立網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù) 。 在索引數(shù)據(jù)庫(kù)中搜索排序 當(dāng)用戶輸入關(guān)鍵詞搜索后 , 由搜索系統(tǒng)程序從網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁(yè) 。 因?yàn)樗邢嚓P(guān)網(wǎng)頁(yè)針對(duì)該關(guān)鍵詞的相關(guān)度早己算好 ,所以只需按照現(xiàn) 成的相關(guān)度數(shù)值排序 , 相關(guān)度越高 , 排名越靠前 。 最后 , 由頁(yè)面生成系統(tǒng)將搜索結(jié)果的鏈接地址和頁(yè)面內(nèi)容摘要等內(nèi)容組織起來(lái)返回給用戶 。 垂直搜索引擎概念的提出 , 就是相對(duì)前面介紹的通用搜索引擎的信息量大 、 查詢不準(zhǔn)確 、 深度不夠等提出來(lái)的新的搜索引擎服務(wù)模式 , 通過(guò)針對(duì)性的為某一特定領(lǐng)域 、 某一特定人群或某一特定需求提供的有一定價(jià)值的信息和相關(guān)服務(wù) 。 可以簡(jiǎn)單的說(shuō)成是搜索引擎領(lǐng)域的行業(yè)化分工 。 垂直搜索引擎本身的特點(diǎn)是 “ 專 、 精 、 深 ”, 且具有行業(yè)色彩 , 相比較通用 搜索引擎的海量信息無(wú)序化 , 垂直搜素引擎則 顯得更加專注 、 具體和深入 。 垂直搜索引擎已成為新的研究 、 開(kāi)發(fā)領(lǐng)域 , 并將向智能化 、 個(gè)性化 、 精確化 、 專業(yè)化 、交叉語(yǔ)言檢索 、 多媒體檢索等適應(yīng)不同用戶需求的方向發(fā)展 , 目前已經(jīng)引起了世界各國(guó)計(jì)算機(jī)科學(xué)界和信息產(chǎn)業(yè)界的高度關(guān)注 。 垂直搜索引擎為用戶提供的并不是上百甚至上千萬(wàn)相關(guān)網(wǎng)頁(yè) , 而是范圍極為縮小 、 極具針對(duì)性的具體信息 。 因此 ,特定行業(yè)的用戶更加青睞垂直搜索引擎 , 是垂直搜索引擎的長(zhǎng)期 、 穩(wěn)定的群體 。 由于垂直搜索引擎專注于服務(wù)行業(yè)用戶 , 擁有廣泛 !精深的行業(yè)資源 , 所以 具有很好的經(jīng)濟(jì)價(jià)值和廣泛發(fā)展前景 。 在應(yīng)用上 , 垂直搜索引擎呈 現(xiàn)出面向主題 垂直搜索引擎發(fā)展趨勢(shì) , 特點(diǎn)是 : 分類細(xì)致明確 、 數(shù)據(jù)全面深入 、 更新及時(shí) 。 針對(duì)某一特定行業(yè)或某一主題進(jìn)行目錄的細(xì)化分類 , 結(jié)合機(jī)器抓取只與行業(yè) 相關(guān)的信息 、 力求做到本行業(yè)信息多而精 。 從采集方式看 , 通用搜索引擎以被動(dòng)方式為主 , 搜索引擎和被采集的網(wǎng)頁(yè)沒(méi)有約定的 、 標(biāo)準(zhǔn)的格式 。 企業(yè)搜索則以主動(dòng)方式為主 , 被采集的各種數(shù)據(jù)等都 6 和企業(yè)搜索引擎有著約定好的采集接口和安全接口 ; 垂直搜索引擎采用被動(dòng)和主動(dòng)相結(jié)合的方式 , 通過(guò)主動(dòng)方式 , 有效采集網(wǎng)頁(yè)中標(biāo)引的元數(shù)據(jù) , 整合上下游網(wǎng)頁(yè)資源或者商業(yè)數(shù)據(jù)庫(kù) , 提供更加準(zhǔn)確的搜索服務(wù) 。 從采集深度 , 動(dòng)態(tài)網(wǎng)頁(yè)采集的優(yōu)先級(jí)數(shù)據(jù)庫(kù)信息采集來(lái)看 , 通用搜索引擎采用廣度優(yōu)先的策略 , 所以采集深度要求不高 , 而垂直搜索和企業(yè)搜索需要挖掘出 行業(yè)內(nèi)所有相關(guān)的網(wǎng)頁(yè)信息 , 所以往往采用深度優(yōu)先的策略 , 同時(shí)由于行業(yè)內(nèi)的一些有商業(yè)價(jià)值的信息采用動(dòng)態(tài)發(fā)布的方式 , 如供求信息等 , 所以垂直搜索對(duì)動(dòng)態(tài)網(wǎng)頁(yè)的采集優(yōu)先級(jí)較高 。 由于信息在互聯(lián)網(wǎng)是海量的 ,非結(jié)構(gòu)化的信息需要經(jīng)過(guò)結(jié)構(gòu)化的梳理后才 能更好的展現(xiàn) 。 而垂直搜索引擎和普通的網(wǎng)頁(yè)搜索引擎最大的區(qū)別是對(duì)網(wǎng)頁(yè)信息進(jìn)行了結(jié)構(gòu)化信息抽取 , 也就是將網(wǎng)頁(yè)的非結(jié)構(gòu)化數(shù)據(jù) 抽取成特定的結(jié)構(gòu)化信息數(shù)據(jù) , 例如網(wǎng)頁(yè)搜索是以網(wǎng)頁(yè)為最小單位 , 視頻搜索則是以視頻為最小單位 , 而垂直搜索是以結(jié)構(gòu)化數(shù)據(jù)為最小單位 。 然后將這些數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù) , 進(jìn)行進(jìn)一步的加工處理 , 例如 ; 去重 、 分類 、 合并等 , 最后分詞 、 索引再以搜索的方式滿足用戶的需求 。 整個(gè)過(guò)程 , 數(shù)據(jù)由非結(jié)構(gòu)化數(shù)據(jù)抽取成結(jié)構(gòu)化數(shù)據(jù) , 經(jīng)過(guò)深度加工處理后以非結(jié)構(gòu)化的方式和結(jié)構(gòu)化的方式返回給用戶 。 從信息檢索看 , 垂直搜索引擎不但能對(duì)網(wǎng)頁(yè)信息中結(jié)構(gòu)化信息進(jìn)行檢索 ,而且能提供結(jié)構(gòu)化和非結(jié)構(gòu)化信息結(jié)合的檢索方式 。 從檢索結(jié)果的排序方式看 ,通用搜索主要通過(guò) PageRank算法來(lái)實(shí)現(xiàn) 。企業(yè)搜索大多采用檢索內(nèi)容和檢索詞的 相關(guān)度來(lái)實(shí)現(xiàn) ; 而垂直搜索的排序要求更加多樣化 , 例如 : 按時(shí)間排序 、 按相關(guān) 度排序等 。 垂直搜索引擎是專門(mén)用來(lái)檢索某一主題范圍或某一類型信息 , 追求專業(yè)性與 服務(wù)深度是它的特點(diǎn) 。 這種高度目標(biāo)化 、 專業(yè)化的搜索引擎的優(yōu)勢(shì)在于針對(duì)性強(qiáng) , 對(duì)特定范圍的網(wǎng)絡(luò)信息的覆蓋率相對(duì)較高 , 有明確的檢索目標(biāo)定位 , 有效地彌補(bǔ) 了綜合性搜索引擎對(duì)專門(mén)領(lǐng)域及特定主題信息覆蓋率過(guò)低的問(wèn)題 。 同時(shí) , 能夠把 具有相同興趣點(diǎn)的人們集中在一個(gè)主題內(nèi) , 不僅集中提供各種專業(yè)資源 , 而且給 大家提供一個(gè)相 互交流 、 共享經(jīng)驗(yàn)和教訓(xùn)的場(chǎng)所 , 展望行業(yè)發(fā)展前景的機(jī)會(huì)和場(chǎng) 合。相比較綜合搜索引擎的海量信息無(wú)序化,垂直搜索引擎則顯得更加專注、具體和深入。 ( 1) 愛(ài)看圖標(biāo)網(wǎng),中文圖標(biāo)搜索引擎( 目前收錄了 10000多個(gè)圖標(biāo), 功能還不錯(cuò),可以按照?qǐng)D標(biāo)系列、分類、色系、關(guān)鍵字、圖標(biāo)標(biāo)題等搜索;你可以查看每一個(gè)圖標(biāo)的作者信息、尺寸大小、圖像文件格式、色系、所屬分類等信息。每一張圖標(biāo)都提供 png格式下載,大多數(shù)圖 7 標(biāo)同時(shí)還提供 ico格式下載。 ( 2) 網(wǎng),中文文檔搜索引擎( 網(wǎng)號(hào)稱收錄了一億多文檔,是最大的中文文檔庫(kù),提供針對(duì)文檔標(biāo)題、簡(jiǎn)介、內(nèi)容的關(guān)鍵字檢索功能,并且支持 Word、 PDF、 PPT、 Jpg等 30多種 文件格式。 8 第二章 農(nóng)業(yè) 信息垂直 搜索引擎 國(guó)內(nèi)外發(fā)展現(xiàn)狀 隨著信息高速的發(fā)展 , 搜索引擎成為人們獲取信息的重要途徑。隨著農(nóng)業(yè)信息化進(jìn)程的推進(jìn) , 農(nóng)業(yè)信息資源開(kāi)發(fā)日顯重要 。 作為國(guó)家信息資源的重要組成部分 , 農(nóng)業(yè)信息資源是一種基礎(chǔ)行、戰(zhàn)略性的資源 , 對(duì)推動(dòng)我國(guó)農(nóng)業(yè)信息發(fā)展尤 為重要。要從眾多農(nóng)業(yè)信息中尋找自己所需要的信息部分 , 最便捷的方式就是提供一個(gè)搜索引擎 , 農(nóng)業(yè)搜索引擎便應(yīng)運(yùn)而生 。 谷歌、百度等綜合搜索引擎經(jīng)過(guò) 20 多年的發(fā)展已經(jīng)達(dá)到了很高的水平 , 其搜索結(jié)果基本上可以滿足用戶需求 , 且這些搜索引擎的性能仍在根據(jù)用戶的需要在進(jìn)行不斷優(yōu)化。對(duì)于農(nóng)業(yè)方面的信息 , 這 2種搜索引擎都能提供海量的信息 ,供農(nóng)業(yè)領(lǐng)域查詢。但這 2種搜索引擎在搜索時(shí)的信息量大、查詢不準(zhǔn)確、深度不夠以及專業(yè)化、智能化等方面存在弊端。針對(duì)這種情況 , 一些人提出了垂直搜索引擎的新概念 , 垂直搜索引擎是搜索
點(diǎn)擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1