freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

信息組織課后題答案-文庫(kù)吧資料

2025-07-01 01:00本頁(yè)面
  

【正文】 泛。同時(shí),取出民IAL中的URL,分塊 ( 如每次顯示20個(gè)命中對(duì)象 )裝配,所需信息都是從fulltext 文檔中提取。檢索器按其索引文件的檢索結(jié)果進(jìn)行讀取和裝配。( 3 ) 倒排索引文件 ( Inverted? index? file ) IXF索引文件可以為檢索器提供檢索結(jié)果,如命中的對(duì)象數(shù)n,同時(shí)以n為控制數(shù)由相對(duì)地址指針AP到相應(yīng)的IALi中去讀取n個(gè)URL。(1 ) 接口模塊 ( interface? module? file ) 是用戶通過用戶接口交互傳給檢索器的用戶需求,檢索器理解用戶需求后通過指令的方式傳給了索引數(shù)據(jù)庫(kù),索引數(shù)據(jù)庫(kù)的接口模塊理解該指令的檢索途經(jīng)和特征值。沒有索引數(shù)據(jù)庫(kù)就沒有辦法實(shí)現(xiàn)搜索引擎的功能。用戶接口需要人性化的設(shè)計(jì)。用戶接口的作用是接受用戶的檢索需求的輸入,并進(jìn)語(yǔ)法檢查,使其規(guī)范。檢索器是對(duì)具體搜索引擎所配置的索引數(shù)據(jù)庫(kù)而研制的專用檢索程序包。索引數(shù)據(jù)庫(kù)是搜索引擎的核心,它既是索引器提供的產(chǎn)品,又是搜索器進(jìn)行工作的基礎(chǔ)。一個(gè)搜索引擎一般由搜索器(Robot Spider), 索引器(Indexer),索引數(shù)據(jù)庫(kù)(Index Database),檢索器(Searcher),和用戶接口(User Interface)等五個(gè)部分組成。起初,它只是用于該校的校園網(wǎng)上,后來逐步推廣到整個(gè)因特網(wǎng)上應(yīng)用。Web搜索引擎誕生于20世紀(jì)90年代初。 第八章搜索引擎 (search engines )是指接受用戶的提問,檢索某(索引)數(shù)據(jù)庫(kù),并將與用戶提問相匹配的信息對(duì)象反饋給用戶 的檢索工具。 標(biāo)準(zhǔn)格式的文獻(xiàn)檔可以達(dá)到大范圍的數(shù)據(jù)共享,在世界上可以通用,因此它有著廣泛的用途。(3)指示符和數(shù)據(jù)——在這種情況下,記錄頭標(biāo)內(nèi)的指示符長(zhǎng)度置1或大于1,而標(biāo)示符的長(zhǎng)度置零。(1)數(shù)據(jù)——在這種情況下,記錄頭標(biāo)內(nèi)的指示符長(zhǎng)度和標(biāo)識(shí)符長(zhǎng)度置零。因此,目次區(qū)的總長(zhǎng)度為12n+1(n為一個(gè)目錄記錄中數(shù)據(jù)字段的個(gè)數(shù))。每個(gè)目次項(xiàng)對(duì)應(yīng)于一個(gè)數(shù)據(jù)字段。頭標(biāo)中最后兩位(字符位置2223)字符現(xiàn)空著未用,供系統(tǒng)將來擴(kuò)充時(shí)使用。 字符位置21也是一個(gè)十進(jìn)制數(shù)字,它是目次內(nèi)每一個(gè)登錄項(xiàng)的“起始字符位”部分的字符長(zhǎng)度。數(shù)據(jù)基地址等于記錄頭標(biāo)、目次和在目次尾部的域分隔符的總字符數(shù)。(6)數(shù)據(jù)基地址(字符位置1216)它是5位十進(jìn)制數(shù)字。該標(biāo)識(shí)符的第一個(gè)字符或僅有的一個(gè)字符必須總是ISO646的IS1。若不用指示符,則指示符長(zhǎng)置零。(3)執(zhí)行代碼(字符位置69)這些代碼可表示記錄類型(圖書、期刊、文章、地圖、畫等)和文獻(xiàn)目錄級(jí)別(分析的、專題的和連續(xù)出版物的等)。根據(jù)實(shí)際需要,邏輯記錄必須分塊存取,塊長(zhǎng)通常為2048字節(jié)。用5位十進(jìn)制數(shù)表示。記錄頭標(biāo)為固定長(zhǎng)部分,它共含24字節(jié)。MARC格式結(jié)構(gòu)在1971年被確定為美國(guó)國(guó)家標(biāo)準(zhǔn)。參加這項(xiàng)發(fā)展計(jì)劃的有哈佛大學(xué)、國(guó)家農(nóng)業(yè)圖書館、華盛頓州立圖書館、耶魯大學(xué)等16個(gè)成員館或單位。 例如: 0-表示資源 1-表示資源的版本 2-表示相關(guān)資源 子字段代碼: $a-主機(jī)名 $b-存取號(hào)(Internet 協(xié)議數(shù)字地址) $c—壓縮信息 $d—路徑 $f—電子資源文件名 $g—統(tǒng)一資源名(URN) ┋ $o—操作系統(tǒng) $s—文件尺寸(file size) $u—統(tǒng)一資源地址(URL) MARC發(fā)展計(jì)劃的思想從20世紀(jì)50年代末和60年代初形成。為了適應(yīng)因特網(wǎng)發(fā)展的需要,MARC 21 格式中的856字段對(duì)網(wǎng)上電子資源的定位和存取進(jìn)行了規(guī)范。因此, 其兼容性和包容性好, 并允許動(dòng)態(tài)地?cái)U(kuò)展新的數(shù)據(jù)類型第七章MARC 21 用目錄地址方法組織數(shù)據(jù),每條MARC記錄分為四個(gè)區(qū): 頭標(biāo)區(qū)、目次區(qū)、數(shù)據(jù)區(qū)和記錄結(jié)束符。為了共享多種數(shù)據(jù)結(jié)構(gòu)、語(yǔ)法和詞表,? MCF提供了一個(gè) 通用數(shù)據(jù)模式及詞表 的框架。 MCF力求實(shí)現(xiàn)一種 單一的數(shù)據(jù)模式和相應(yīng)的互換格式的元數(shù)據(jù)框架。在一對(duì)〈CHANNEL〉和〈/CHANNEL〉包括的頻道內(nèi)容中,包括了多個(gè)〈ITEM〉元素,每一個(gè)〈ITEM〉描述了每一個(gè)HTML頁(yè)面的最后修改日期、標(biāo)題、摘要及作者的情況。 更確切的說,它是它將HTML從一種Web“頁(yè)面”描述語(yǔ)言,擴(kuò)展成了為一個(gè)應(yīng)用于頻道站點(diǎn)的Web站點(diǎn)描述語(yǔ)言。對(duì)于一般用戶來講,這是快速、高效獲取所需信息的最佳方法。一些用戶,例如家長(zhǎng)們,可以設(shè)置他們的瀏覽器,將那些不符合他們規(guī)范的內(nèi)容過濾掉。這是PICS最為顯著的功能。 人們想讓用戶能夠非常方便地找到最適合自己需要的內(nèi)容;同時(shí)防止將那些被認(rèn)為是不適宜的或用戶不想要的內(nèi)容傳遞給用戶,特別是未成年的用戶。 (4)權(quán)限控制。 (3)定義正式的子結(jié)構(gòu)。 (2)指明編碼規(guī)則。使用特定領(lǐng)域的受控詞表或分類方法(例如杜威十進(jìn)制分類法DDC)有助于增加描述的精確度。如果沒有權(quán)限管理元素的標(biāo)注,不可以對(duì)與資源相關(guān)的上述或其他權(quán)利的情況作出任何假定。推薦覆蓋范圍最好是取自于一個(gè)受控詞表(例如地名詞庫(kù)[TGN]),并應(yīng)盡可能地使用由數(shù)字表示的坐標(biāo)或日期區(qū)間來描述地名與時(shí)間段 Rights 權(quán)限管理 Rights 有關(guān)資源本身所有的或被賦予的權(quán)限信息 一般而言,權(quán)限管理元素應(yīng)包括一個(gè)對(duì)資源的權(quán)限管理聲明,或者是對(duì)提供這一信息的服務(wù)的參照。 Relation 關(guān)聯(lián) Relation 對(duì)相關(guān)資源的參照 建議對(duì)關(guān)聯(lián)的標(biāo)識(shí)采用一個(gè)符合正式標(biāo)識(shí)體系的字串及數(shù)字組合。 Language 語(yǔ)種 Language 描述資源知識(shí)內(nèi)容的語(yǔ)種 建議本元素的值采用RFC 1766中所定義的語(yǔ)種代碼規(guī)范,此標(biāo)準(zhǔn)定義了一個(gè)2個(gè)英文字母的語(yǔ)言代碼(取自于ISO 639標(biāo)準(zhǔn)),作為一個(gè)可選項(xiàng),也可以在其后加上一個(gè)2個(gè)英文字母的國(guó)家代碼(取自于ISO 3166標(biāo)準(zhǔn))。 Source 來源 Source 對(duì)一個(gè)資源的參照,而當(dāng)前資源是源自這一參照資源 當(dāng)前資源可能部分或全部源自來源所標(biāo)識(shí)的資源。 Identifier 資源標(biāo)識(shí)符 Identifier 在一給定的文本環(huán)境中對(duì)資源的參照引用 建議對(duì)資源的標(biāo)識(shí)采用一個(gè)符合正式標(biāo)識(shí)體系的字串及數(shù)字組合。例如有關(guān)大小及時(shí)長(zhǎng)的標(biāo)注。 Format 形式 Format 資源的物理或數(shù)字化的表現(xiàn)形 一般而言,形式可以包括資源的媒體形式或尺寸。建議采用來自于受控詞表中的值(比如都柏林核資源類型工作草案[DCT1])。建議采用的日期格式應(yīng)符合ISO 8601 [W3CDTF]規(guī)范,并使用YYYYMMDD的格式。一般而言,用其他責(zé)任者的名字來標(biāo)識(shí)這一條目。一般而言,用出版者的名字來標(biāo)識(shí)這一條目。 Description 說明 Description 對(duì)資源內(nèi)容的說明 說明元素可以包括但不限于以下部分:文摘,目錄,對(duì)以圖形來表示內(nèi)容的一個(gè)參照或者一個(gè)有關(guān)內(nèi)容的自由文本描述。 Subject 主題和關(guān)鍵詞 Subject 有關(guān)資源內(nèi)容的主題描述 一般而言,一個(gè)主題和關(guān)鍵詞通常采用描述資源內(nèi)容的關(guān)鍵詞,短語(yǔ)或分類號(hào)。 Creator 創(chuàng)建者 Creator 創(chuàng)建資源內(nèi)容的主要責(zé)任者 創(chuàng)建者的實(shí)例包括一個(gè)個(gè)人,一個(gè)組織或一個(gè)服務(wù)。 研討會(huì) 主辦時(shí)間 主辦國(guó) 主辦地點(diǎn) 主辦組織 DC1 1995年3月1日——3日 美 俄亥俄州, 都柏林 OCLC/NCSA DC2 1996年4月1日——3日 英 華瑞克大學(xué) OCLC/UKOLN DC3 1996年9月24日——25日 美 俄亥俄州, 都柏林 OCLC/CNI DC4 1997年3月3日——5日 澳 坎培拉 OCLC/DSTC,NLA DC5 1997年10月6日——8日 芬 赫爾辛基 OCLC/NLF DC6 1998年11月2日——4日 美 華盛頓特區(qū) OCLC/TLC DC7 1999年10月25日——27日 德 法蘭克福 OCLC/ DC8 2000年10 月4日——6日 加 渥太華 OCLC/NLC/IFLA DC2001 2001年10月2226 日本 東京 DC2002 2002年10月1317 意大利 佛羅倫薩 DC2003 2003年9月2810月2 美國(guó) 西雅圖 都柏林核心元數(shù)據(jù)元素集的最新定義于1999年07月02日推出,。于是人們希望通過對(duì)資源描述的工具——元數(shù)據(jù)(Metadata)這一課題的探討及實(shí)施來促進(jìn)信息資源描述、組織、發(fā)現(xiàn)及利用效率的提高。 隨著WWW的發(fā)展,網(wǎng)絡(luò)信息資源呈無限增長(zhǎng)的趨勢(shì)。例程: ? ()?xml version= encoding=gb2312 ?! 文檔類型聲明開始 !DOCTYPE 電話號(hào)碼本 [!ELEMENT 電話號(hào)碼 (姓名,辦公室電話,住宅電話,手機(jī)號(hào))!ELEMENT 姓名 (PCDATA)!ELEMENT 辦公室電話 (PCDATA)!ELEMENT 住宅電話 (PCDATA)!ELEMENT 手機(jī)號(hào) (PCDATA)!ELEMENT 電話號(hào)碼本 (電話號(hào)碼+)]! DTD end ! ***** 電話號(hào)碼本電話號(hào)碼姓名張曉東/姓名辦公室電話85316255/辦公室電話住宅電話85316147/住宅電話手機(jī)號(hào)13971681010/手機(jī)號(hào)/電話號(hào)碼電話號(hào)碼姓名劉宜光/姓名辦公室電話85316834/辦公室電話住宅電話85316289/住宅電話手機(jī)號(hào)13971683546/手機(jī)號(hào)/電話號(hào)碼/電話號(hào)碼本第六章所謂元數(shù)據(jù), 就是描述數(shù)據(jù)的數(shù)據(jù)(data that describes data)或“關(guān)于數(shù)據(jù)的數(shù)據(jù)”(data about data)。它提高了定位的精度,是尋址的常用方法。標(biāo)準(zhǔn)鏈接只有一個(gè)Locator, 即只能指令一個(gè)Resource作為鏈接對(duì)象,它與HTML的鏈接錨( anchor ) 很相似;XPointor ( XML Pointor Language )為XML指針語(yǔ)言。?X Link ( XML Linking Language )是XML的規(guī)范之一,它的鏈接功能遠(yuǎn)遠(yuǎn)超過HTML。它是通過XML進(jìn)行定義的,遵循XML語(yǔ)法規(guī)范,是XML的一種具體應(yīng)用。XML數(shù)據(jù)建模方法有多種,DTD(Document Type Definition)和XML Schema就是常用的兩種建模方法。合法的XML文檔的邏輯結(jié)構(gòu)?包括:?XML聲明?DTD(文檔類型定義)XML元素集(實(shí)例);而結(jié)構(gòu)完整的XML文檔只有兩部分(沒有DTD描述)。它具備許多特點(diǎn):靈活性與簡(jiǎn)潔性 開放性與可擴(kuò)展性 實(shí)用性高效性XML文檔的邏輯結(jié)構(gòu)分為包含DTD的描述結(jié)構(gòu)和不包含DTD的結(jié)構(gòu)。XML從誕生之日起,就顯示了其強(qiáng)大的生命力。開發(fā)下一代因特網(wǎng)的標(biāo)準(zhǔn)語(yǔ)言。它既可以作為應(yīng)用語(yǔ)言在WWW上直接利用,又可用于開發(fā)應(yīng)用語(yǔ)言。它吸收了HTML簡(jiǎn)易性的優(yōu)點(diǎn),克服了其局限性,開拓了新領(lǐng)域。它是一種元標(biāo)記語(yǔ)言(Metamarkup Language),可提供描述結(jié)構(gòu)化資料的格式,具體來說,XML是一種類似于HTML,被設(shè)計(jì)用來描述數(shù)據(jù)的語(yǔ)言。第五章HTML僅是SGML的一種固定標(biāo)簽的應(yīng)用文檔,而不是SQML的子集。(2)標(biāo)引和索引編制易于實(shí)現(xiàn)自動(dòng)化,從而顯著節(jié)省時(shí)間,大大縮短檢索系統(tǒng)信息組織和報(bào)導(dǎo)的時(shí)差,保證信息報(bào)導(dǎo)和傳遞的及時(shí)性。(4)在機(jī)編索引情況下,由于機(jī)械地抽詞和輪排,其中有不少關(guān)鍵詞款目是不起檢索作用而徒增篇幅的。(3)為了加速和簡(jiǎn)化檢索工具的編制過程,多限于從文獻(xiàn)標(biāo)題中抽取。6 《漢語(yǔ)主題詞表》主題詞參照系統(tǒng)如圖所示:
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1