freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

信息組織課后題答案(編輯修改稿)

2025-07-22 01:00 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 格式)。 Identifier 資源標(biāo)識(shí)符 Identifier 在一給定的文本環(huán)境中對(duì)資源的參照引用 建議對(duì)資源的標(biāo)識(shí)采用一個(gè)符合正式標(biāo)識(shí)體系的字串及數(shù)字組合。例如正式的標(biāo)識(shí)體系包括統(tǒng)一資源標(biāo)識(shí)符(URI),資一資源定位符(URL),數(shù)字對(duì)象標(biāo)識(shí)符 (DOI)和國(guó)際標(biāo)準(zhǔn)書號(hào) (ISBN)。 Source 來(lái)源 Source 對(duì)一個(gè)資源的參照,而當(dāng)前資源是源自這一參照資源 當(dāng)前資源可能部分或全部源自來(lái)源所標(biāo)識(shí)的資源。建議對(duì)這一資源的標(biāo)識(shí)采用一個(gè)符合正式標(biāo)識(shí)系統(tǒng)的字串及數(shù)字組合。 Language 語(yǔ)種 Language 描述資源知識(shí)內(nèi)容的語(yǔ)種 建議本元素的值采用RFC 1766中所定義的語(yǔ)種代碼規(guī)范,此標(biāo)準(zhǔn)定義了一個(gè)2個(gè)英文字母的語(yǔ)言代碼(取自于ISO 639標(biāo)準(zhǔn)),作為一個(gè)可選項(xiàng),也可以在其后加上一個(gè)2個(gè)英文字母的國(guó)家代碼(取自于ISO 3166標(biāo)準(zhǔn))。例如,en為英語(yǔ),fr為法語(yǔ),或者使用enuk表述為英國(guó)英語(yǔ)。 Relation 關(guān)聯(lián) Relation 對(duì)相關(guān)資源的參照 建議對(duì)關(guān)聯(lián)的標(biāo)識(shí)采用一個(gè)符合正式標(biāo)識(shí)體系的字串及數(shù)字組合。 Coverage 覆蓋范圍 Coverage 資源內(nèi)容所涉及的外延與覆蓋范圍 典型的覆蓋范圍包括空間位置描述(一個(gè)地名或地理坐標(biāo))、時(shí)間段描述(一個(gè)時(shí)間標(biāo)識(shí),日期或一個(gè)日期范圍)、或者權(quán)限描述(比如命名的授權(quán)實(shí)體)。推薦覆蓋范圍最好是取自于一個(gè)受控詞表(例如地名詞庫(kù)[TGN]),并應(yīng)盡可能地使用由數(shù)字表示的坐標(biāo)或日期區(qū)間來(lái)描述地名與時(shí)間段 Rights 權(quán)限管理 Rights 有關(guān)資源本身所有的或被賦予的權(quán)限信息 一般而言,權(quán)限管理元素應(yīng)包括一個(gè)對(duì)資源的權(quán)限管理聲明,或者是對(duì)提供這一信息的服務(wù)的參照。權(quán)限管理一般包括知識(shí)產(chǎn)權(quán)(IPR),版權(quán)或其他各種各樣的產(chǎn)權(quán)。如果沒(méi)有權(quán)限管理元素的標(biāo)注,不可以對(duì)與資源相關(guān)的上述或其他權(quán)利的情況作出任何假定。 自研究之初人們便認(rèn)識(shí)到大多數(shù)的應(yīng)用都需要一定的機(jī)制來(lái)精確限定元數(shù)據(jù)元素及其值,原因如下: (1)增強(qiáng)語(yǔ)義的專指性。使用特定領(lǐng)域的受控詞表或分類方法(例如杜威十進(jìn)制分類法DDC)有助于增加描述的精確度。指明某主題描述詞出自何處,這樣才有可能利用有關(guān)瀏覽結(jié)構(gòu)或知識(shí)結(jié)構(gòu)。 (2)指明編碼規(guī)則。指明正式的編碼標(biāo)準(zhǔn)可避免出現(xiàn)含糊不清的詞義。 (3)定義正式的子結(jié)構(gòu)。很多情況下某元素的值是一個(gè)復(fù)合值,這樣的賦值實(shí)際上就需要一種復(fù)合結(jié)構(gòu),因此需要一種定義子結(jié)構(gòu)的機(jī)制——限定詞。 (4)權(quán)限控制。很多結(jié)構(gòu)化的權(quán)威記錄都由相應(yīng)的機(jī)構(gòu)管理、維護(hù),它們?yōu)槟橙?、組織、地名提供唯一確認(rèn)的值。 人們想讓用戶能夠非常方便地找到最適合自己需要的內(nèi)容;同時(shí)防止將那些被認(rèn)為是不適宜的或用戶不想要的內(nèi)容傳遞給用戶,特別是未成年的用戶。為了進(jìn)行內(nèi)容選擇,必須引入內(nèi)容分類定級(jí)機(jī)制。這是PICS最為顯著的功能。不同的組織可以根據(jù)他們的目的及價(jià)值取向,對(duì)Internet上的資源進(jìn)行分類定級(jí)。一些用戶,例如家長(zhǎng)們,可以設(shè)置他們的瀏覽器,將那些不符合他們規(guī)范的內(nèi)容過(guò)濾掉。現(xiàn)在的許多第三方內(nèi)容分類定級(jí)機(jī)構(gòu)利用PICS來(lái)對(duì)某個(gè)站內(nèi)容的及時(shí)性和技術(shù)精確度進(jìn)行評(píng)分。對(duì)于一般用戶來(lái)講,這是快速、高效獲取所需信息的最佳方法。CDF使用XML,將XML應(yīng)用嵌入HTML。 更確切的說(shuō),它是它將HTML從一種Web“頁(yè)面”描述語(yǔ)言,擴(kuò)展成了為一個(gè)應(yīng)用于頻道站點(diǎn)的Web站點(diǎn)描述語(yǔ)言。它使用一種非常簡(jiǎn)易的語(yǔ)法,對(duì)其頻道內(nèi)容進(jìn)行描述。在一對(duì)〈CHANNEL〉和〈/CHANNEL〉包括的頻道內(nèi)容中,包括了多個(gè)〈ITEM〉元素,每一個(gè)〈ITEM〉描述了每一個(gè)HTML頁(yè)面的最后修改日期、標(biāo)題、摘要及作者的情況。當(dāng)瀏覽者接入到這個(gè)頻道之后,這些metadata數(shù)據(jù)就會(huì)展現(xiàn)出來(lái)。 MCF力求實(shí)現(xiàn)一種 單一的數(shù)據(jù)模式和相應(yīng)的互換格式的元數(shù)據(jù)框架。在MCF中, data和metadata不作明顯區(qū)分, 人們以同樣的方式來(lái)利用它們(data和metadata)。為了共享多種數(shù)據(jù)結(jié)構(gòu)、語(yǔ)法和詞表,? MCF提供了一個(gè) 通用數(shù)據(jù)模式及詞表 的框架。它能在一定程度上使用和管理各種metadata數(shù)據(jù)。因此, 其兼容性和包容性好, 并允許動(dòng)態(tài)地?cái)U(kuò)展新的數(shù)據(jù)類型第七章MARC 21 用目錄地址方法組織數(shù)據(jù),每條MARC記錄分為四個(gè)區(qū): 頭標(biāo)區(qū)、目次區(qū)、數(shù)據(jù)區(qū)和記錄結(jié)束符。如下圖。為了適應(yīng)因特網(wǎng)發(fā)展的需要,MARC 21 格式中的856字段對(duì)網(wǎng)上電子資源的定位和存取進(jìn)行了規(guī)范。在856字段中,資源的存取方法和定位均可重復(fù)描述。 例如: 0-表示資源 1-表示資源的版本 2-表示相關(guān)資源 子字段代碼: $a-主機(jī)名 $b-存取號(hào)(Internet 協(xié)議數(shù)字地址) $c—壓縮信息 $d—路徑 $f—電子資源文件名 $g—統(tǒng)一資源名(URN) ┋ $o—操作系統(tǒng) $s—文件尺寸(file size) $u—統(tǒng)一資源地址(URL) MARC發(fā)展計(jì)劃的思想從20世紀(jì)50年代末和60年代初形成。正式命名為MARC計(jì)劃是在1965年底。參加這項(xiàng)發(fā)展計(jì)劃的有哈佛大學(xué)、國(guó)家農(nóng)業(yè)圖書館、華盛頓州立圖書館、耶魯大學(xué)等16個(gè)成員館或單位。 作為信息交換的一種工具,MARC格式結(jié)構(gòu)在美國(guó)已被三個(gè)國(guó)家圖書館(國(guó)會(huì)圖書館、國(guó)家醫(yī)學(xué)圖書館和國(guó)家農(nóng)業(yè)圖書館)、美國(guó)圖書館協(xié)會(huì)(ALA)、研究圖書館協(xié)會(huì)(ARL)、科學(xué)技術(shù)情報(bào)委員會(huì)(COSATI)、教育資源情報(bào)中心(ERIC)、科學(xué)情報(bào)服務(wù)中心協(xié)會(huì)(ASZDIC)和其它機(jī)構(gòu)所采用。MARC格式結(jié)構(gòu)在1971年被確定為美國(guó)國(guó)家標(biāo)準(zhǔn)。根據(jù)MARC經(jīng)驗(yàn)而起草的《文獻(xiàn)工作——文獻(xiàn)目錄信息交換用磁帶格式》1973年被ISO審定為國(guó)際標(biāo)準(zhǔn),即著名的ISO27091973(E)。記錄頭標(biāo)為固定長(zhǎng)部分,它共含24字節(jié)。其信息內(nèi)容及布局如下:長(zhǎng)度(字符位置04) 它是記錄中字符的個(gè)數(shù),包括記錄頭標(biāo)和記錄分隔符。用5位十進(jìn)制數(shù)表示。若不足5位時(shí),左邊用零充滿。根據(jù)實(shí)際需要,邏輯記錄必須分塊存取,塊長(zhǎng)通常為2048字節(jié)。(2) 記錄狀態(tài)(字符位置5) 它是單一字符,用N或C等字母,描述該記錄是新的或修改過(guò)的。(3)執(zhí)行代碼(字符位置69)這些代碼可表示記錄類型(圖書、期刊、文章、地圖、畫等)和文獻(xiàn)目錄級(jí)別(分析的、專題的和連續(xù)出版物的等)。 (4)指示符長(zhǎng)(字符位置10)它是一個(gè)十進(jìn)制數(shù),給出指示符字符位置的數(shù)目。若不用指示符,則指示符長(zhǎng)置零。 (5)標(biāo)識(shí)符長(zhǎng)(字符位置11)它是一個(gè)十進(jìn)制數(shù)字,給出標(biāo)識(shí)符字符位數(shù)。該標(biāo)識(shí)符的第一個(gè)字符或僅有的一個(gè)字符必須總是ISO646的IS1。若沒(méi)有使用標(biāo)識(shí)符,則標(biāo)識(shí)符長(zhǎng)置零。(6)數(shù)據(jù)基地址(字符位置1216)它是5位十進(jìn)制數(shù)字。若有效數(shù)字不滿5位時(shí),則向右對(duì)齊,左邊用零充滿。數(shù)據(jù)基地址等于記錄頭標(biāo)、目次和在目次尾部的域分隔符的總字符數(shù)。(7)用戶用信息(字符位置1719)(8)目次安排(字符位置2021)字符位置20為一個(gè)十進(jìn)制數(shù)字,等于在目次內(nèi)每一登錄項(xiàng)的“數(shù)據(jù)字段長(zhǎng)度”部分的字符長(zhǎng)度。 字符位置21也是一個(gè)十進(jìn)制數(shù)字,它是目次內(nèi)每一個(gè)登錄項(xiàng)的“起始字符位”部分的字符長(zhǎng)度。以上這兩個(gè)十進(jìn)制數(shù)的和應(yīng)為9。頭標(biāo)中最后兩位(字符位置2223)字符現(xiàn)空著未用,供系統(tǒng)將來(lái)擴(kuò)充時(shí)使用。目次區(qū)為可變長(zhǎng),目次區(qū)由若干個(gè)目次項(xiàng)和區(qū)末的一個(gè)字段分隔符組成。每個(gè)目次項(xiàng)對(duì)應(yīng)于一個(gè)數(shù)據(jù)字段。一個(gè)目次項(xiàng)由字段標(biāo)識(shí)符、數(shù)據(jù)字段長(zhǎng)度和數(shù)據(jù)字段起始位置三部分組成,固定為12個(gè)字符。因此,目次區(qū)的總長(zhǎng)度為12n+1(n為一個(gè)目錄記錄中數(shù)據(jù)字段的個(gè)數(shù))。記錄中的每一個(gè)文獻(xiàn)目錄字段必須按照下列變通情況之一構(gòu)成。(1)數(shù)據(jù)——在這種情況下,記錄頭標(biāo)內(nèi)的指示符長(zhǎng)度和標(biāo)識(shí)符長(zhǎng)度置零。(2)標(biāo)識(shí)符和數(shù)據(jù)——在這種情況下,記錄頭標(biāo)內(nèi)的指示符長(zhǎng)度置零,而標(biāo)識(shí)符長(zhǎng)度置1或大于1。(3)指示符和數(shù)據(jù)——在這種情況下,記錄頭標(biāo)內(nèi)的指示符長(zhǎng)度置1或大于1,而標(biāo)示符的長(zhǎng)度置零。(4)指示符、標(biāo)識(shí)符和數(shù)據(jù)——在這種情況下,記錄頭標(biāo)內(nèi)指示符和標(biāo)識(shí)符的長(zhǎng)度置1或大于1。 標(biāo)準(zhǔn)格式的文獻(xiàn)檔可以達(dá)到大范圍的數(shù)據(jù)共享,在世界上可以通用,因此它有著廣泛的用途。標(biāo)準(zhǔn)格式的文獻(xiàn)檔可以用磁帶、光盤發(fā)行,也可以做成Web數(shù)據(jù)庫(kù);利用因特網(wǎng)為全世界網(wǎng)民提供優(yōu)質(zhì)服務(wù)。 第八章搜索引擎 (search engines )是指接受用戶的提問(wèn),檢索某(索引)數(shù)據(jù)庫(kù),并將與用戶提問(wèn)相匹配的信息對(duì)象反饋給用戶 的檢索工具。廣義地講,search engines 不僅指信息檢索程序本身,而且還指界面、相關(guān)的入 口、程序、支持它的索引數(shù)據(jù)庫(kù)和服務(wù)。Web搜索引擎誕生于20世紀(jì)90年代初。比較有代表性 的事件是1991年4月由美國(guó)明尼蘇達(dá)大學(xué)開(kāi)發(fā)的一種交互瀏覽型(Browser)檢索軟件。起初,它只是用于該校的校園網(wǎng)上,后來(lái)逐步推廣到整個(gè)因特網(wǎng)上應(yīng)用。建立搜索引擎是將無(wú)序的網(wǎng)絡(luò)信息資源進(jìn)行有序化組織的有效方法。一個(gè)搜索引擎一般由搜索器(Robot Spider), 索引器(Indexer),索引數(shù)據(jù)庫(kù)(Index Database),檢索器(Searcher),和用戶接口(User Interface)等五個(gè)部分組成。索引器從搜索器返回的純文本信息文件抽取索引項(xiàng)(屬性),生成倒排工作文件,進(jìn)而逐步建立索引數(shù)據(jù)庫(kù)。索引數(shù)據(jù)庫(kù)是搜索引擎的核心,它既是索引器提供的產(chǎn)品,又是搜索器進(jìn)行工作的基礎(chǔ)。沒(méi)有索引數(shù)據(jù)庫(kù)就沒(méi)有辦法實(shí)現(xiàn)搜索引擎的功能。檢索器是對(duì)具體搜索引擎所配置的索引數(shù)據(jù)庫(kù)而研制的專用檢索程序包。它的職責(zé)是從用戶接口接受并理解用戶需求將其轉(zhuǎn)換成檢索指令,對(duì)索引數(shù)據(jù)庫(kù)實(shí)施檢索,并將結(jié)果集按內(nèi)容的相關(guān)度排序,并排序結(jié)果文件向用戶反饋。用戶接口的作用是接受用戶的檢索需求的輸入,并進(jìn)語(yǔ)法檢查,使其規(guī)范。如,概念之間的邏輯運(yùn)算符AND、OR、NOT,通配符和連接號(hào)、括號(hào)配對(duì)、詞組定界符等的正確使用,否則,返回用戶進(jìn)行修改,調(diào)整后再傳給Searcher對(duì)索引數(shù)據(jù)庫(kù)進(jìn)行檢索,并適時(shí)地顯示檢索器反饋的檢索結(jié)果。用戶接口需要人性化的設(shè)計(jì)。索引數(shù)據(jù)庫(kù)是搜索引擎的核心,它既是索引器提供的產(chǎn)品,又是搜索器進(jìn)行工作的基礎(chǔ)。沒(méi)有索引數(shù)據(jù)庫(kù)就沒(méi)有辦法實(shí)現(xiàn)搜索引擎的功能。索引數(shù)據(jù)庫(kù)的結(jié)構(gòu)如圖所示,它由四類文件組成:倒排地址表 ( IALi )、倒排索引ixfi及其它索引文件 ( ixf iixf iixf i3 ) 和純文本 ( fulltext ) 文件。(1 ) 接口模塊 ( interface? module? file ) 是用戶通過(guò)用戶接口交互傳給檢索器的用戶需求,檢索器理解用戶需求后通過(guò)指令的方式傳給了索引數(shù)據(jù)庫(kù),索引數(shù)據(jù)庫(kù)的接口模塊理解該指令的檢索途經(jīng)和特征值。( 2 ) 主索引文件 ( main? index? file ) 一般來(lái)說(shuō),一個(gè)搜索引擎可能要搜集和索引上百萬(wàn)個(gè)網(wǎng)站的信息,索引文件的規(guī)模太大,不利于快速響應(yīng),因而它需要在索引文件上建立多級(jí)主索引,主索引的功能是接收接口模塊傳來(lái)的檢索途經(jīng)和特征值,在索引文件中迅速定位。( 3 ) 倒排索引文件 ( Inverted? index? file ) IXF索引文件可以為檢索器提供檢索結(jié)果,如命中的對(duì)象數(shù)n,同時(shí)以n為控制數(shù)由相對(duì)地址指針AP到相應(yīng)的IALi中去讀取n個(gè)URL。?? 索引數(shù)據(jù)庫(kù)結(jié)構(gòu) ( 4 ) 倒排地址表 ( IAL—Inveted? Address? List ) 倒排地址表中存放的是相關(guān)的URL,它與其索引文件指針相連,內(nèi)部用物理鄰接方式存放。檢索器按其索引文件的檢索結(jié)果進(jìn)行讀取和裝配。( 5 ) 純文本文件 ( fulltext ) 是搜索器從因特網(wǎng)上采集來(lái)的網(wǎng)上信息,經(jīng)過(guò)過(guò)濾后的文件,它包括title、 description、creater、publisher、Date、Keywords? URLs等信息,在檢索器檢索ixf后,在顯示命中結(jié)果。同時(shí),取出民IAL中的URL,分塊 ( 如每次顯示20個(gè)命中對(duì)象 )裝配,所需信息都是從fulltext 文檔中提取。使用搜索引擎的方法有:布爾檢索、截詞檢索、詞組與名稱檢索、范疇檢索 網(wǎng)絡(luò)資源組
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1