freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

搜索引擎使用技巧(參考版)

2025-07-01 14:26本頁面
  

【正文】 另外象IEEE主辦的國際萬維網(wǎng)會議、人機交互會議已有越來越多關(guān)于搜索引擎技術(shù)研究的文章發(fā)表。著名的信息檢索會議TREC也從1998年開始增加了Web Track課題,以考察Web文檔與其它類型文檔在檢索性質(zhì)上的不同之處,并將測試在大規(guī)模的Web庫(如100G字節(jié))上進行信息檢索的算法性能。如Stanford大學(xué)在其數(shù)字圖書館項目中開發(fā)了Google搜索引擎,在Web信息的高效搜索、文檔的相關(guān)度評價、大規(guī)模索引等方面作了深入的研究,取得了很好的成果。 學(xué)術(shù)研究目前搜索引擎領(lǐng)域的商業(yè)開發(fā)非?;钴S,各大搜索引擎公司都在投巨資研制搜索引擎系統(tǒng),同時也不斷地涌現(xiàn)出新的具有鮮明特色的搜索引擎產(chǎn)品,搜索引擎已經(jīng)成為信息領(lǐng)域的產(chǎn)業(yè)之一。但對于經(jīng)濟全球化、互聯(lián)網(wǎng)跨越國界的今天,無疑具有很重要的意義。如果再加上機器翻譯,返回結(jié)果可以用母語顯示。搜索引擎的各個組成部分,除了用戶接口之外,都可以進行分布:搜索器可以在多臺機器上相互合作、相互分工進行信息發(fā)現(xiàn),以提高信息發(fā)現(xiàn)和更新速度;索引器可以將索引分布在不同的機器上,以減小索引對機器的要求;檢索器可以在不同的機器上進行文檔的并行檢索,以提高檢索的速度和性能。搜索引擎的實現(xiàn)可以采用集中式體系結(jié)構(gòu)和分布式體系結(jié)構(gòu),兩種方法各有千秋。智能代理具有不斷學(xué)習(xí)、適應(yīng)信息和用戶興趣動態(tài)變化的能力,從而提供個性化的服務(wù)。 信息智能代理是另外一種利用互聯(lián)網(wǎng)信息的機制。二是用正文分類(Text Categorization)技術(shù)將結(jié)果分類,使用可視化技術(shù)顯示分類結(jié)構(gòu),用戶可以只瀏覽自己感興趣的類別。對于一個查詢,傳統(tǒng)的搜索引擎動輒返回幾十萬、幾百萬篇文檔,用戶不得不在結(jié)果中篩選。又由于搜索引擎有大量的用戶,有很好的經(jīng)濟價值,所以引起了世界各國計算機科學(xué)界和信息產(chǎn)業(yè)界的高度關(guān)注,目前的研究、開發(fā)十分活躍,并出現(xiàn)了很多值得注意的動向。 未來動向搜索引擎已成為一個新的研究、開發(fā)領(lǐng)域。目前一些公司和機構(gòu)正在考慮制定查詢選項的標(biāo)準(zhǔn)。用戶輸入接口可以分為簡單接口和復(fù)雜接口兩種。主要的目的是方便用戶使用搜索引擎,高效率、多方式地從搜索引擎中得到有效、及時的信息。檢索器常用的信息檢索模型有集合理論模型、代數(shù)模型、概率模型和混合模型四種。一個搜索引擎的有效性在很大程度上取決于索引的質(zhì)量。當(dāng)數(shù)據(jù)量很大時,必須實現(xiàn)即時索引(Instant Indexing),否則不能夠跟上信息量急劇增加的速度。索引表也可能要記錄索引項在文檔中出現(xiàn)的位置,以便檢索器計算索引項之間的相鄰或接近關(guān)系(proximity)。短語索引項的提取方法有統(tǒng)計法、概率法和語言學(xué)法。在搜索引擎中,一般要給單索引項賦與一個權(quán)值,以表示該索引項對文檔的區(qū)分度,同時用來計算查詢結(jié)果的相關(guān)度。內(nèi)容索引項可以分為單索引項和多索引項(或稱短語索引項)兩種。索引器的功能是理解搜索器所搜索的信息,從中抽取出索引項,用于表示文檔以及生成文檔庫的索引表。 搜索器的實現(xiàn)常常用分布式、并行計算技術(shù),以提高信息發(fā)現(xiàn)和更新的速度。 、IP地址或國家域名劃分,每個搜索器負責(zé)一個子空間的窮盡搜索。目前有兩種搜集信息的策略: a. 從一個起始URL集合開始,順著這些URL中的超鏈(Hyperlink),以寬度優(yōu)先、深度優(yōu)先或啟發(fā)式方式循環(huán)地在互聯(lián)網(wǎng)中發(fā)現(xiàn)信息。它常常是一個計算機程序,日夜不停地運行。 主要技術(shù)一個搜索引擎由搜索器、索引器、檢索器和用戶接口等四個部分組成。影響一個搜索引擎系統(tǒng)的性能有很多因素,最主要的是信息檢索模型,包括文檔和查詢的表示方法、評價文檔和用戶查詢相關(guān)性的匹配策略、查詢結(jié)果的排序方法和用戶進行相關(guān)度反饋的機制。對于搜索引擎系統(tǒng)來講,因為沒有一個搜索引擎系統(tǒng)能夠搜集到所有的WEB網(wǎng)頁,所以召回率很難計算。對于一個檢索系統(tǒng)來講,召回率和精度不可能兩全其美:召回率高時,精度低,精度高時,召回率低。所以我們可以用衡量傳統(tǒng)信息檢索系統(tǒng)的性能參數(shù)召回率(Recall)和精度(Pricision)衡量一個搜索引擎的性能。 這類搜索引擎的優(yōu)點是返回結(jié)果的信息量更大、更全,缺點是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。 3.元搜索引擎:這類搜索引擎沒有自己的數(shù)據(jù),而是將用戶的查詢請求同時向多個搜索引擎遞交,將返回的結(jié)果進行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用戶。該類搜索引擎的優(yōu)點是信息量大、更新及時、毋需人工干預(yù),缺點是返回信息過多,有很多無關(guān)信息,用戶必須從結(jié)果中進行篩選。 2.機器人搜索引擎:由一個稱為蜘蛛(Spider)的機器人程序以某種策略自動地在互聯(lián)網(wǎng)中搜集和發(fā)現(xiàn)信息,由索引器為搜集到的信息建立索引,由檢索器根據(jù)用戶的查詢輸入檢索索引庫,并將查詢結(jié)果返回給用戶。該類搜索引擎因為加入了人的智能,所以信息準(zhǔn)確、導(dǎo)航質(zhì)量高,缺點是需要人工介入、維護量大、信息量少、信息更新不及時。 分類按照信息搜集方法和服務(wù)提供方式的不同,搜索引擎系統(tǒng)可以分為三大類: 1.目錄式搜索引擎:以人工方式或半自動方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中。本文旨在對搜索引擎的關(guān)鍵技術(shù)進行簡單的介紹,以起到拋磚引玉的作用。搜索引擎提供的導(dǎo)航服務(wù)已經(jīng)成為互聯(lián)網(wǎng)上非常重要的網(wǎng)絡(luò)服務(wù),搜索引擎站點也被美譽為“網(wǎng)絡(luò)門戶”。搜索引擎正是為了解決這個“迷航”問題而出現(xiàn)的技術(shù)。據(jù)發(fā)表在《科學(xué)》雜志1999年7月的文章《WEB信息的可訪問性》估計,全球目前的網(wǎng)頁超過8億,有效數(shù)據(jù)超過9T,并且仍以每4個月翻一番的速度增長。目前,搜索引擎技術(shù)正成為計算機工業(yè)界和學(xué)術(shù)界爭相研究、開發(fā)的對象。如果希望對于RSS有更系統(tǒng)的了解,下面介紹部分有關(guān)RSS的資源:(1)網(wǎng)絡(luò)營銷教學(xué)網(wǎng)站轉(zhuǎn)引平文勝為時代營銷電子雜志撰寫的“RSS簡介”:什么是RSS?RSS及其發(fā)展歷程 (2)維基百科對于RSS的定義、RSS規(guī)范、RSS專用閱讀器和RSS在線閱讀器、中文RSS搜索引擎等內(nèi)容的介紹()我們無法離開搜索引擎,我們希望在未來搜索引擎的發(fā)展進程中,能夠看到更加“智能”的引擎工具——別說你對此不屑,我知道你轉(zhuǎn)眼就會反擊我的觀點,但你同樣得上網(wǎng)去搜索資料;就象張藝謀的電影《英雄》,不管你罵得再兇,照樣還是乖乖地坐進了電影院;你打心眼里看不起“F4”,《流行花園》演播的時候,電視機前也還是同樣看見了你的身影。[RSS訂閱URL: ] 這里對于RSS的概念并沒有給予確切的描述,對于大多數(shù)讀者而言,如果不是從技術(shù)角度來了解RSS,那么簡單這么理解也就夠了,重要的是,我們自己要知道如何利用RSS閱讀器訂閱RSS內(nèi)容,以及如何獲取和閱讀RSS新聞。例如,通過一個RSS閱讀器,可以同時瀏覽新浪新聞,也可以瀏覽搜狐或者百度的新聞(如果你采用了RSS訂閱的話)。什么是RSS?什么是RSS?簡單來說,RSS就是一種簡單的信息發(fā)布和傳遞方式,使得一個網(wǎng)站可以方便地調(diào)用其他提供RSS訂閱服務(wù)的網(wǎng)站的內(nèi)容,從而形成“新聞聚合”,讓網(wǎng)站發(fā)布的內(nèi)容在更大的范圍內(nèi)傳播。提供更方便用戶織網(wǎng)的工具,鼓勵提供內(nèi)容。從這個角度看,互聯(lián)網(wǎng)是在變得更有序,每個用戶都在貢獻:要么貢獻內(nèi)容,要么貢獻內(nèi)容的次序.  對下一代互聯(lián)網(wǎng)的看法,還會有很多的討論?;ヂ?lián)網(wǎng)逐漸從以關(guān)鍵字為核心的組織方式和閱讀方式,到以互聯(lián)網(wǎng)用戶的個人portal(SNS)為線索,或者以個人的思想脈絡(luò)(blog/rss)為線索的閱讀方式。 (blog/podcasting),但是通過用戶自發(fā)的(blog)或者系統(tǒng)自動以人為核心(SNS)的互相鏈接給這些看似凌亂的內(nèi)容提供索引。  那么,和Tim BernersLee的語義網(wǎng),有什么不同呢?語義網(wǎng)的出發(fā)點是數(shù)據(jù)的規(guī)整及可重復(fù)被機器調(diào)用,提出使用語義化的內(nèi)容發(fā)布工具, 試圖從規(guī)則和技術(shù)標(biāo)準(zhǔn)上使互聯(lián)網(wǎng)更加有序。  我們看到,用戶在互聯(lián)網(wǎng)上的作用越來越大;他們貢獻內(nèi)容,傳播內(nèi)容,而且提供了這些內(nèi)容之間的鏈接關(guān)系和瀏覽路徑?! 募夹g(shù)上看,WEB客戶端化,工作效率越來越高。  RSS: 用戶產(chǎn)生內(nèi)容自動分發(fā),定閱  Podcasting: 個人視頻/聲頻的發(fā)布/定閱  SNS: blog+人和人之間的鏈接  WIKI: 用戶共同建設(shè)一個大百科全書  從知識生產(chǎn)的角度看,是將以前沒有放在網(wǎng)上的人類知識,通過商業(yè)的力量,放到網(wǎng)上去。 ,就可以理解以上觀點。但Google就這一個革新,用上了網(wǎng)頁的制作者的一部份力量,已將其推上了互聯(lián)網(wǎng)的頂峰。 Google有個Page Rank技術(shù),將網(wǎng)頁之間互相鏈接的關(guān)系,用來做結(jié)果排序的一個依據(jù),變相利用了網(wǎng)頁制作人的判斷力。這違反了人們能偷懶就偷懶的本性?! 〉?,語義網(wǎng)提出之后,曲高和寡,響應(yīng)的人不多。裝了它后,到Amazon上去瀏覽時,會自動告訴你某一本書在用戶當(dāng)?shù)氐膱D書館能否找到,書號是多少等。舉一個例子說明標(biāo)準(zhǔn)數(shù)據(jù)庫的魅力。從理想的角度,這是很誘人的,因為科學(xué)家和機器都喜歡有次序的東西。他的理想是,網(wǎng)頁制作時和架構(gòu)數(shù)據(jù)庫時,大家都用一種語義的方式,將網(wǎng)頁里的內(nèi)容表述成機器可以理解的格式。所以,TimBernersLee在提出WWW不久,即開始推崇語義網(wǎng)(Semantic Web)的概念?! ∷阉髯畲蟮呢暙I是,把互聯(lián)網(wǎng)上海量的信息,用機器初步分了個線索。Yahoo和Google。 World Wide Web,簡稱WWW,是英國人TimBernersLee 1989年在歐洲共同體的一個大型科研機構(gòu)任職時發(fā)明的。Ipost(朝鮮語圖片搜索) 。OPPS Online Images(英文圖片搜索) 。SnapPicture Finder(英文) 。Scour(英文圖片搜索) 。科大天狼搜索引擎 。中華特產(chǎn)網(wǎng)(建有大型專業(yè)信息庫——特產(chǎn)搜索引擎,是 中國特產(chǎn)走向世界的電子商務(wù)通道) 。地圖引擎(提供全國各大城市的旅游、商貿(mào)及人文地理等 信息) 。極限數(shù)字電子引擎信息技術(shù)有限公司(提供國內(nèi)外商業(yè) 軟件的信息資訊、技術(shù)交流、軟件試用版下載和廣告發(fā) 布) 。中國秀視(輸入節(jié)目名稱,可以查到在什么電視臺和星期 幾播放該節(jié)目) 。Humor(專門收集幽默、笑話) 。) 。Virage (專門從事圖像及聲像信息檢索,除了檢索靜態(tài)圖 像外,Virage還提) 。Picture Gallery (Yahoo公司推出的圖像檢索服務(wù)。Websek (利用分類、關(guān)鍵詞以及圖像內(nèi)容特征進行圖像檢 索。圖行天下 (這是國人開發(fā)的一個電子地圖信息查詢工具, 可以查各省及城市交) 。女性專業(yè)搜索引 。) 。Mapblast(可以查詢美國地圖、加拿大地圖和世界地圖信 息。WhoWhere(查詢和電話號碼) 。Free Web Search: 。Askjeeves(有超過700萬的大型問題庫,支持自然語言提 問搜索,適合搜索常識性的問題答案) 。Faganfind象一個書簽,它為幾十種特殊搜索 需求都挑選了多個優(yōu)秀搜索工具,你可以點擊子分類進入 挑選使用,也可以很方便的直接用它默認的搜索工具(通 常它默認推薦的都很好) 。中國搜索聯(lián)盟 。下拉菜單還支持各新聞、購物、獨立搜索引擎等的 自動分類搜索最佳綜合搜索引將各個搜索引擎的結(jié)果結(jié)合 在一起) 。 。look4all(無所禁忌什么都搜?。?。Teoma(約3億網(wǎng)頁,速度略慢,支持類似自動分類的 Refine;同時提供專業(yè)鏈接目錄的Resources) 。Northernlight(約7億網(wǎng)頁+7100出版物數(shù)據(jù),需選中 World Wide Web only搜索。Inktomi(20億網(wǎng)頁(疑大量非全文索引),技術(shù)設(shè)置和參數(shù)可調(diào)性高, 支持的門戶搜索數(shù)據(jù)庫和排序多不同, 可到 使用Inktomi的高級搜索) 。singingfish() 。AlltheWeb(21億網(wǎng)頁,高級檢索強大,有新聞、圖片、 MPVideo、ftp,利用ODP對搜索結(jié)果簡單分類) 。聯(lián)合搜索其他的搜索大全:1stBlaze、 Altavista 、 AOL Search、 ASK Jeeves、 CNET的 、 Google、 InfoSpace Web Search、 Lycos Network、 MSN Search、 My Search、 My Way Search、 Netscape Search、 Overture、 Web Search和 Yahoo! Search。  這哥倆是誰,似乎很眼熟的兩顆人頭啊,腦門上還頂著黃色的光環(huán),極副幽默感……顯然,這也是網(wǎng)友搞笑整出來的,微軟+Google搜索引擎,老死不相往來的競爭對手,怎么可能聯(lián)手推出新式的搜索引擎?真要是有那么一天,估計是兩虎之爭而成全的終了結(jié)果罷。從域名的價值來看,中國的IT人士已經(jīng)開始習(xí)慣性把自己的前瞻思考直接轉(zhuǎn)化為一種經(jīng)濟行為,雅虎、GOOGLE和百度的光都沾上了,哪有不亮的道理,在域名的選取和命名上,網(wǎng)站創(chuàng)建人可沒有少花心思,該網(wǎng)站一旦在網(wǎng)絡(luò)中流傳開來,借助廣大網(wǎng)絡(luò)用戶的宣傳能勢,該網(wǎng)站的流量效應(yīng)和經(jīng)濟效應(yīng)也就上去了?! <曳治?,普通網(wǎng)頁搜索引擎的發(fā)展為垂直搜索引擎的出現(xiàn)提供了良好的市場空間,未來三年內(nèi)垂直搜索引擎將會占據(jù)搜索引擎市場一定的份額,而搜索引擎與電子商務(wù)結(jié)合的產(chǎn)物——商業(yè)搜索引擎將成為06年搜索引擎主攻的焦點。為全國的中小企業(yè)和商務(wù)精英徹底做好服務(wù)。搜索結(jié)果都是通過定向搜索或企業(yè)自主提交而來,所有信息均經(jīng)過審核,最大程度地保證了搜索結(jié)果的真實性、準(zhǔn)確性及其商業(yè)價值。但“搜索速度慢,死鏈接太多、重復(fù)信息或不相關(guān)信息較多”是目前網(wǎng)民對搜索引擎最不滿意的地方。商業(yè)搜索由始以來就是網(wǎng)站盈利的金礦,而專業(yè)的商業(yè)搜索引擎則成為用戶目前最迫切的需求,“商搜”正是在這
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1