freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

基于xml的web查詢技術研究畢業(yè)論文(編輯修改稿)

2025-08-15 08:03 本頁面
 

【文章內容簡介】 存信息的結構化載體為了得到 XML文件的有效性,需要確定文件中信息必須遵守哪些結構。這是通過 Schema來實現的, Schema 是一種描述 XML 文件中信息結構的模型。在 XML 中, Schema 被用來建立某類數據的模型。一旦數據模型適合特定的數據類,我們就可以創(chuàng)建遵守該模型的結構化 XML 文件。 DTD 是建立 XML 文件的 Schema 的一種方法。 XML 數據模型中 XML 文檔的結構按照 XML 圖來組織。 XML圖是一種非常靈活的數據模型圖的結點表示屬性,圖的每一個邊用元素標簽標識。通常, XML圖包含以下內容 : 1. 圖的侮一個頂點用一個唯一的字符串標識,稱為對象標識 13 (OID) 2. 圖的邊用元素標簽標記 3. 圖的結點用一組屬性值來標記 4. 圖的葉結點用值 (或字符串 )來標記 5. 圖有一個根結 點 為了更有效地進行 XML數據的處理,學者們提出了許多關于 XML數據模式描述的方案,其中最主要的是文檔類型定義 DTD。與半結構化數據的模式相比, DTD 的優(yōu)點是它的正則語法支持定義半結構化的數據。 如 :!ELEMENT e(a,b?c+)說明元素 e由一個子元素 a,可選的子元素 b, 要求出現或連續(xù)出現多次的子元素 c組成。 要討論 XML的模型圖,首先定義一個 XML文檔的 DTD,假定 XML文檔放在 D: \, !ELEMENTbib(bok)+ !ELEMENTbok(author+,title,publisher) !ATTLISTbook yearCDATA !ELEMENTarticle (author+,title,year?) !ATTLISTarticletypeCDATA !ELEMENTpublisher(name,address) !ELEMENTauthor (firstname?, lastname) 這個 DTD規(guī)定元素 bib中包含多個 bok 元素、每一本書 (book )包含一個或多個作者元素、一個標題元素、一個出版商元素、一個出 14 版年月屬 性。文章 (article) 的 DTD也是相似的,但它的出版年月是可選的,它省略了出版商,但包含了類型屬性,一個出版商包含了名字和地址元素,作者元素包含了可選的名和必須有的姓。假定所有的數據類型是字符串型。 該 DTD 限定了數據是怎樣組織的。事實上, XML 模型的元素順序可以是任意的。數據模型并不要求元素的順序必須與 XML文檔中的次序一致。如下述兩個表示等價: 1. bok 元素內的最開始部分是注釋。 2. 作者名放在書名的前面。 3. 每一個作者的名放在姓前 author firstname $f / lastname $1 / /author 等價于: author lastname $1/ firstname $f / /author 對于上述的 DTD,假定有以下事實 : 1. bok 元素內的最開始部分是注釋。 2. 作者名放在書名的前面。 3. 每一個作者的名放在姓前 XML非常適合描述分布的、多態(tài)的、動態(tài)改變的 Web數據,數據與 XML 圖之間的對應非常簡單。下面是一個 XML 的數據模型圖,該模型圖中的數據的類型和結構與前面定義的 DTD一致。 15 圖 1 XML 數據模型圖 通過該模型圖可以很容易的實現數據從 XML 模型圖到 XML 文檔的轉換,轉換成的 XML文檔如下 : bib bok year=1995 !一 Agodinductorytext authorlastnameDate /lastname/author title AnIntroductionto Database Systems/title publisher nameAdisionWesley/name/publisher /book /bib 模型允許同樣兩個結點之間有多條邊相連,但必須用不同的標簽標識。為了支持元素的共享, XML 可以為一個元素指定一個 ID 屬性值來唯一地標識元素,同時可以為一個元素指定一個引用 IDREF屬性 16 來引用已存在的多個元素 ID. 例如文檔 DTD 中有以下 ID 屬性和IDREFS屬性。 !ATLISTpersonIDIDREQUIRED !ATLISTarticleauthorIDREFSIMPLIED 其中 :REQUIRED 一屬性是必須的 。IMPLIED 一屬性是可選的 。在下面的 XML文檔片段中,兩個 person元素的 ID值分別為 o123和 o234,元素 article的作者是 ID值分別為 o123和 o234的 person.。 personID=oI23 firstnameJohnlfirstname lastname Smith /lastname /person person ID= o234 ? /person article author=o123 o234 title ? .. /title Year1995/Year /article 上述結構用 XML模型圖表示如下: 17 圖 2 XML 圖中數據 之間 的引用 因為僅有 XML 圖的葉結點中包含值 ,并且只能表示一個值 .所以 ,下面的 XML文檔片段就不能直接用數據模型表示 . title A Trip to titlepartthe Moon/title part/title 為此 ,考慮用下面的片段來代替 . titleCDATAA Trip to/CDATAtitlepartCDATAthe Moon/CDATA/titIe part/title 該片段的數據模型圖如下 : 18 圖 3 XML 數據模型圖 19 其中頁結點的值是它的 OID。 XML 數據模型圖向 XML 文檔的映射 通過對 XML 模型圖的轉換可以很容易地得到析可以生成 XML 數據模型圖 .這可以從上述 XMLXML文檔 ,同樣通過對 XML文檔的解文檔與 XML 模型圖的映射對應關系看出 .通常由于如下兩條原因 ,XML 圖不是和 XML 文檔嚴格對應的。 1. XML 數據模型中的數據是無序的 ,元素的順序事先并未假定 。 2.支持結點共享 ,一個結點可 能和幾個結點有邊相連。 XML 數據模型中數據的存儲以及索引的存儲 1. XML 數據的存儲有以下方式 : (1).文本文件 是最簡單 ,直接地存儲 XML 數據的方式 .它與數據被理解的方式一致 ,自然地反映了對象之間的嵌套關系 ,且同一個對象的數據集中存儲 .缺點是存儲粒度大 ,當數據量大時不利于實現網絡通信和數據共享。 (2).關系數據庫 存儲半結構化數據或 XML 數據 .可以利用數據庫現有的存儲管理 ,并發(fā)控制 ,恢復 ,版本機制等技術有效地管理數據 .該方式的欠缺是一個簡單的查詢路徑可能要通過多重鏈接實現 ,影響了查詢的效 率 .半結構化數據的缺乏模式和數據類型的特性也使關系數據庫的一些優(yōu)化存儲策略 (如聚集存儲等 )不能應用。 (3).面向對象數據庫 很多商業(yè)的 XML 服務器采用這種方式 .它利用 DTD 給出的類型信息構造類層次結構 ,正則表達式的符號可由基 20 于對象數據模型的類型表達 (如用 list數據類型表達 ),也可以通過創(chuàng)建新類實現 (如 |符號可用 union 類型的類實現 ).該方式的數據模型更接近半結構化數據模型 ,并能更好地處理嵌套的集合和順序 ,因此 ,其數據存儲和查詢處理可以用來提高 XML 或半結構化數據處理的效率 .問題是在數據加 載時對未知的數據類型需要建立新的類對應 ,這樣就影響了加載效率 。當 DTD 改變時 ,數據模式的變動代價也很昂貴 .面向對象模型雖然比關系模型更適合于表達半結構化數據和 XML數據 ,但有快速連接性能的關系數據庫也可以實現很好的性能。 (4).專門的對象存儲 如 Lore 系統 ,它利用自己的對象管理器管理物理磁盤上的半結構數據或 XML 數據對象 。 半結構化數據索引需要處理的問題是異構原子值的索引和路徑表達式的索引 .不同原子值的索引可以通過強制類型轉換實現 .路徑表達式的索引可以分為樹 /圖結構數據的索引 ,受限 /完 全的正則表達式 .相對來說 ,樹結構的數據 ,如 XML,其索引技術較簡單 ,并且只支持正則路徑表達式的受限形式的索引更有效一些 ,因為較少有非常復雜的正則路徑表達式 .伯克利大學的 XSet系統就為 XML數據采用了一種索引 .這種索引綜合了路徑信息 ,也是樹結構 .索引樹的節(jié)點是哈希表 ,索引根節(jié)點包含了 數據根節(jié)點的所有出邊標記 ,索引樹的內節(jié)點對應了數據中到達某一非葉節(jié)點的標記序列 ,哈希表的每一項都包含了數據樹中指向淚應節(jié)點的指針 .這種索引結構可以有效地處理簡單路徑表達式 , 一些更復雜的路徑表達式也可以通過索引的索引來實現 .斯 21 坦 福大學的 DataGuide 系統實現了任意結構的半結構化數據的索引 ,它是關于半結構化數據的路徑信息的一個精確 ,簡潔的索引結構 ,可以有效地用來輔助建立查詢和進行查詢優(yōu)化。 3. 異構數據庫的集成 異構數據庫集成的方法 Web 上異構數據庫集成目標是支持對 Web 上多個數據源的查詢 ,處理大量的 ,數目遞增的 Web 數據源 . Web 上異構數據庫集成主要有兩種方法 :數據倉庫方法和虛擬方法 .前者是將各數據源的數據裝載到數據倉庫中 ,用戶的查詢基于數據倉庫的數據 。后一種方法基于一個 中間模式 (Mediated Schema),數據仍保存在局部數據源中 ,通過各數據源的 39。39。包裝程序 (Wrappers)將數據虛擬成中間模式 ,用戶的查詢基于中間模式 ,不必知道每個專門的數據源的特點 ,查詢執(zhí)行引擎直接與 Wrappers 打交道 ,將基于中間模式的查詢轉換為基于各局部數據源的模式 .虛擬方法更適應于數據源數目多 ,各局部數據源的自治性很高且局部數據經常變化的 Web環(huán)境。 本文數據的集成方法采用基于 中間模式 的方法 ,將關系數據庫中的數據轉換為通用的 XML 數據源 .由于從不同的關系數據庫中產生 XML 數據源的轉換方法類似 ,文中僅給出從一個 數據庫中進行數據轉換的方法。 用 XML格式表示的數據源的優(yōu)勢 22 XML 是 Web 上定義數據的通用語言 , XML 允許為指定的一群應用程序創(chuàng)建一致的數據格式 ,它同樣也是服務器間傳遞數據的理想格式 .用 XML 格式表示的數據源有以下優(yōu)勢: (1), XML格式表示的數據能夠被唯一標記 ,能用于更有意義的檢索 .例如 ,用戶可以指定查找一些書 ,書的作者是魯訊 ,而不是指書的內容 .傳統的檢索將會將二者混為一談 ,如果是 XML 表示的數據源 ,可以方便地被檢索到 . (2),基于 XML的數據是自描述的 ,不需要有對數據的內容描述 就可以交換和處理 ,可以更好地實現數據的共享和跨平臺操作。 (3),可以更好地從離散的 XML數據源集成數據 .查找多個不兼容的數據庫在實踐上難以實現 ,但是如果把各個數據庫的數據轉換成XML 格式的數據源 ,通過軟件代理可以很方便地把這些數據集成到中間層服務器上 ,在這之后 ,這些數據還可以被傳 到客戶或其他的服務器上進行進一步的集成 ,處理和分發(fā) . (4) , XML數據源可以方便地應用于數據的多個視圖 .如果數據被傳送到桌面上 ,它可以以多種方式顯示 .例如 ,XML 數據的購買訂單對代理商可以顯示得較為詳細 ,而對于顧 客來說 ,只需要顯示簡單的視圖。 (5),易于實現不同的粒度更新 .XML數據允許不同的粒度更新 ,消除每次數據的一部分發(fā)生變化后就必須重傳整個結構化數據的需要 .只有發(fā)生變化的元素從服務器傳給客戶 ,不必更新全部用戶接口就能顯現發(fā)生變化的數據。 23 XML 是一種基于通用數據格式的描述語言 ,能夠被其他應用程序方便地解析和操作 .如果數據是關系數據格式 ,只有 ASP 應用程序和能夠使用 OLEDB 數據源的應用程序才可以訪問 .而 XML 不同 ,只要客戶程序能夠解析 XML 的結構 ,就可以訪問關系數據表中的信息 ,給我們實際生活中的應用帶來了 極大的方便。 關系數據庫中結構化的 XML 格式數據轉換的參考模型 基于 XML 的 Web 查詢先要進行后臺數據的轉換 ,把關系數據庫中的數據源先轉化成 XML 數據源放在 Web 服務器上 ,然后再執(zhí)行查詢 。 在下面的圖示中給出了通過 Web 對 XML數據源訪問的參考模型 ,VB應用程序通過 ADO從數據庫中提取數據 ,然后把 ADO數據集轉換成 XML格式再傳遞到 Web服務器上 ,一旦數據放在 Web服務器上 ,就可以通過Web應用程序 (如 IE5. 0 )來處理和顯示數據 ,從而實現對 Web上的XML 數據源方便地進行存取和訪問 。 圖 4 數據轉換參考模型 注 : 在該實例中 .所有的應用都基于 WINDOWS 環(huán)境 .整個系統中的 24 任何一層可以用運行在其它平臺的應用程序所代替 ,只要應用程序能夠讀取和處理 XML即可 。 如何從關系數據庫中產生 XML 數據源是本文研究的重點之一 .如果能夠把關系數據庫中的數據轉換為 XML 數據源并把這些轉換后的數據源放置在 Web 服務器上 ,就可以很方便地實現對數據的訪問 ,并且能解決很多 HTML數據格式自身的限制
點擊復制文檔內容
研究報告相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1