freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

虛擬聯(lián)合目錄系統(tǒng)中(編輯修改稿)

2025-04-21 07:37 本頁面
 

【文章內(nèi)容簡(jiǎn)介】 給上層的 VUCS Service,最後 VUCS Service就負(fù)責(zé)將這些資料收集起來並呈現(xiàn)給使用者做檢閱。共同結(jié)構(gòu)網(wǎng)頁文件萃取的技術(shù)將於本文第三部分詳述。3. 擁有共同結(jié)構(gòu)之網(wǎng)頁文件資料萃取一個(gè)虛擬聯(lián)合目錄系統(tǒng)必須要能從各個(gè)不同圖書資訊館藏查詢系統(tǒng)中萃取資料,但由於並不是所有的圖書資訊館藏查詢系統(tǒng)都允許直接存取其底層的資料庫,為了讓虛擬聯(lián)合目錄系統(tǒng)的功能更加完善,我們發(fā)展了 Extractor 這個(gè)系統(tǒng)來分析網(wǎng)頁的文件結(jié)構(gòu)並做資料萃取,其中 LevelID 方法便是其核心的演算法,其目的在於分析文件結(jié)構(gòu),系統(tǒng)架構(gòu)如圖表三所示,本文設(shè)計(jì)並實(shí)作了一個(gè)從含有共同結(jié)構(gòu)之網(wǎng)頁文件作資料萃取的系統(tǒng)如下。圖表三說明了整個(gè) Extractor 的系統(tǒng)架構(gòu),整個(gè)資料萃取主要可分為兩個(gè)步驟:Level 1 (Root, parent level)………….Level 2Level 2Level 2 (child level)Parallel Property (PP)Level 3 圖表四、階層式架構(gòu)的樹狀示意圖Level Property (LP)1. 訓(xùn)練步驟 (Training Process) 在訓(xùn)練步驟時(shí),我們從欲萃取資料的文件中,選取一個(gè)範(fàn)例文件 (Sample Document)來當(dāng)作系統(tǒng)的訓(xùn)練文件,系統(tǒng)會(huì)先透過格式化工具 (Formalization Tool) 將文件做格式化,並參照輔助表格 (ATAuxiliary Table) 以分析出文件的結(jié)構(gòu),接著提供提供一個(gè)介面讓使用者標(biāo)記欲萃取的資料欄位 (Structure Labeling),並利用 MML 語法來描述使用者所標(biāo)記的資料以儲(chǔ)存成一個(gè)結(jié)構(gòu)標(biāo)記檔 (Label File) 以供萃取步驟使用。2. 萃取步驟 (Extracting Process) 執(zhí)行完萃取步驟後,接著讀入和已訓(xùn)練過的文件具有同樣結(jié)構(gòu)的文件 (Document with Common Structure),利用格式化工具以及配置 Level ID 以分析文件結(jié)構(gòu)後,參考之前所儲(chǔ)存的結(jié)構(gòu)標(biāo)記檔以做資料萃取,系統(tǒng)會(huì)根據(jù)已儲(chǔ)存的結(jié)構(gòu)標(biāo)記檔作為欲萃取的資料欄位,並利用 LevelID 演算法來作分析以找出含有相同結(jié)構(gòu)的資料欄位,而最後萃取出來的資料也同樣利用 MML 來加以描述儲(chǔ)存。 下面我們將此一系統(tǒng)分成三個(gè)階段來討論,分別是前置處理階段 (PreProcessing)、結(jié)構(gòu)標(biāo)記階段 (Structure Labeling) 及資料萃取階段 (Information Extraction)。在介紹系統(tǒng)的運(yùn)作流程之前,我們先說明本文所提出的 LevelID 方法。 LevelID 方法結(jié)構(gòu)化文件最大的特性就是擁有階層式的架構(gòu),比如說一本書的章節(jié)或段落。階層式的架構(gòu)可以用樹的型態(tài)來表示,每個(gè)節(jié)點(diǎn)都是代表一個(gè)元素,而每個(gè)節(jié)點(diǎn)所包含的資料就是元素的內(nèi)容,由圖表四可以更清楚地看出其架構(gòu),最上層的節(jié)點(diǎn)就是根節(jié)點(diǎn),根節(jié)點(diǎn)可能有數(shù)個(gè)第二層的子節(jié)點(diǎn),而第二層的子節(jié)點(diǎn)也同樣可能含有數(shù)個(gè)第三層的子節(jié)點(diǎn)。在此,我們定義兩個(gè)性質(zhì)來幫助在 LevelID 方法中做文件結(jié)構(gòu)的分析。定義一、階層性質(zhì) (Level Property (LP)) 節(jié)點(diǎn) A 和節(jié)點(diǎn) B 是階層式架構(gòu)中的兩個(gè)節(jié)點(diǎn),階層性質(zhì)在 A 是 B 的祖先 (Ancestor) 且文件中 A 的內(nèi)容 (Content) 中包含了 B 時(shí)成立,此時(shí), A 和 B 具有階層性質(zhì)的關(guān)係。定義二、平行性質(zhì) (Parallel Property (PP)) 節(jié)點(diǎn) A 和節(jié)點(diǎn) B 是階層式架構(gòu)中的兩個(gè)節(jié)點(diǎn),平行性質(zhì)在 A 和 B 位在階層式架構(gòu)中的同一層時(shí)成立,此時(shí), A 和 B 具有平行性質(zhì)的關(guān)係。定義好上述兩種性質(zhì)之後我們就可以分配 Level ID 給每個(gè)關(guān)鍵元素,Level ID 的格式如下:. …每一層由各自的數(shù)字來表示,Level1ID 所代表的就是第一層的數(shù)字,中間的分隔號(hào)我們用逗號(hào)來表示,其意義就是代表著分層。一個(gè)階層式的架構(gòu)就可以利用這樣的方式來將所有的節(jié)點(diǎn)表示成 Level ID 的格式,要完整地將一個(gè)結(jié)構(gòu)化文件用 Level ID 來格式化,還必須搭配上一個(gè)輔助的表格 (Auxiliary Table) 來記載標(biāo)籤與標(biāo)籤之間的階層關(guān)係性質(zhì),這樣就可利用階層性質(zhì)與平行性質(zhì)來正確地配置 Level ID 給每一個(gè)元素,輔助表格如圖表五所示,在此,我們以 HTML 文件的標(biāo)籤來說明。輔助表格編號(hào)上層元素下層元素1HTMLHeadBody2FramesetFrame3BodyTableOlUlDirBrPHr4TableTr5TrTd6TdTableOlUlDirBrP7OlUlDirLi8LiTableOlUlDirBrP9HrTableOlUlDirBrP圖表五、輔助表格0 LevelID_Assignment_Algorithm (in HTML D, out Level_ID ){1 Var Structure_Hierarchy C。2 For each tag in D{3 C=Check_Structure_Hierarchy (tag)。 // 4 IF (C = “PositiveLP”)5 Down_Level (tag)。 //Level Property holds6 Else If (C = “NegativeLP”)7 Up_Level(tag) until
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1