freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計論文-xml快速解析技術(shù)-文庫吧資料

2024-12-11 17:47本頁面
  

【正文】 或者說利用 XML 文件中所編碼的數(shù)據(jù),必須先將數(shù)據(jù)從純文本中解析出來,因此,要求必須有一個能夠識別 XML 文檔信息的文本文件閱讀器(即 XML 解析器),用來解析 XML 文檔并提取其中的內(nèi)容。本章從總整體上對將要研究 XML 解析技術(shù)做了基礎(chǔ)知識的鋪墊,以便后續(xù)章節(jié)的進一步研究。所以人們最終得到的是可以容易地添加、修改和重新排序的靈活的源信息。 使轉(zhuǎn)換與格式化相分離的好處是,能夠通過選擇一個目標 XSL 處理器理解的名域,來選擇按何種方式格式化試圖顯示的新文檔。 XSLFO 文檔中的各種格式化對象指明內(nèi)容在頁面中的放置順序,但格式化的細節(jié)如頁面的大小、元素的尺寸、顏色、XML 文檔 XSL 樣式表 XML解析器 XML解析器 XML解析器 源樹 結(jié)果 樹 文檔 存儲 成像 圖 XSL 的工作過程 16 XML 快速解析技術(shù) 字體等必須由格式化屬性來說明。而 XSLFO 元素的主要作用就是頁面管理、流動管理(內(nèi)容如何“注入”已創(chuàng)建的一系列頁面)和段落 /字符管理。 XSLT 用 XPath 語言來選擇源樹中要進行處理的節(jié)點,指定處理該節(jié)點的不同方式的條件,并產(chǎn)生插入到結(jié)果樹中的文本。用 XSLT 表示的轉(zhuǎn)換包含一組模板 規(guī)則。 樹轉(zhuǎn)換將源樹轉(zhuǎn)換成結(jié)果樹。圖 表示了 XSL 的工作流程,該流程概括起來說就是: XSL 處理器讀取一個 XML文檔和一個 XSL 樣式表,輸出符合樣式表的 XML 文檔的表示形式。 XSLFO則是描述 XSL 格式化對象的 XML 詞匯,它提供大量的格式化命令,用來說明新文檔以何種方式顯示給讀者。 XSL 由兩個標準組成,一個是 XSLT( Extensible StylesheetLanguage Transformations,可擴展樣式表語言轉(zhuǎn)換),另一個是 XSLFO( ExtensibleStyle Language Formatting Objects,可擴展樣式語言格式化對象)。 XSL 目前,存在兩種顯示 XML 文檔的方法,一種是 CSS( Cascading Style Sheet,層疊樣式表),另一種就是下面主要討論的 XSL( Extensible Stylesheet Language,可擴展樣式表語言)。 XPointer是 XLink 用來結(jié)合 XPath 的機制, XPointer 表達式總是寫成 xpointer(??),括號內(nèi)是 XPath 表達式。下面是一個 XML 簡單鏈接的例子: p xmlns:xlink=― ?????????????? a xlink:type=―simple‖xlink:href=―‖this works too/a XLink 規(guī)范引用另外兩個重要規(guī)范 XPath( XML Path Language, XML 路徑語言)和 XPointer( XML Pointer Language, XML 指針語言)。 XLink 表示資源之間或資源各部分 之間的一種關(guān)系,而資源可以是賦予 URI 的任何東西。使用 XLink 創(chuàng)建鏈接時,其實是指定了兩個或更多資源,然后連接它們。 從圖 中可以看出,“ title”雖然出現(xiàn)了兩次,但由于使用了“ bk”和“ authr”兩個不同的前綴,從而很容易地被區(qū)分開來 [8]。使用名域說明將一個 URI 引用與一個或多個 XML 元素聯(lián)系在一起,作為一個前綴將它們相互區(qū)分開。它是在一個文檔中混合來自多個 DTD 的元素或多組名字并聲明哪些元素和屬性來自哪組名字的一條途徑。因此, XML 模式雖然類似于 DTD,卻比 DTD 功能更強。模式處理程序?qū)@示這個文檔是否符合該模式,即文檔是否有效。 XML 模式是一個 XML 文檔,可以使用 XML 工具創(chuàng)建并編輯它。通過提供對結(jié)構(gòu)和內(nèi)容的約束,XML 模式定義一類 XML 文檔。開發(fā)者常常不需要建立他們自己的 DTD,但如果未發(fā)現(xiàn)適合自己的已存在的 DTD,也可以選擇使用 現(xiàn)有的 DTD 的一部分并以它為基礎(chǔ)進行開發(fā)。圖 是 XML 文檔的外部 DTD[7]。 DTD 分為內(nèi)部和外部兩種。 DTD 可以定義文檔的元素、元素的屬性以及元素和屬性之間的關(guān)系。 DTD 和模式 XML 提供兩種控制文檔內(nèi)容的機制,一種是 DTD( Document Type Definition,文檔類型定義),另一種是 XML 模式( Schema) [6]。 XML 相關(guān)技術(shù)和標準 XML 不是一 項獨立的技術(shù),它包含了很多其他相關(guān)技術(shù)和標準,例如 DTD、 XML模式( Schema)、名域( Namespace)、 XLink,、 XPath、 XPointer、 XHTML、 XSL、CSS、 DOM、 SAX 和 SOAP 等。由于 name 標記和 address 標記被放在了未被解析的 CDATA 片段中,所以它們不會被解析。下面是一個 CDATA 片段的例子: ![CDATA[ nameJack Tors/name address1816 N Street/address ]] cityNew York/city stateNew York/state 在該例子中,元素 name 和元素 address 不被當作 XML 標記,而其中的數(shù)據(jù)也不能被當作解析的字符數(shù)據(jù),因為這些標記被放在 CDATA 片段中。具體地說, XML 文件的 CDATA 片段包含的是不需要作為 XML 字符數(shù)據(jù)解析的內(nèi)容。這還使應用程序在試圖處理一個不支持版本的文件時,可以提示給用戶。最明顯的一個處理指令的例子就是眾所周知的 xml 處理指令,在地址簿的例子中是: ?xml version=‖‖encoding=―UTF8‖standalone=―yes‖? 這個處理指令指出了這個文件是基于 XML 版本 的。 XML 解析器并不處理處理指令,相反,它將處理指 令返回給應用程序。 處理指令 XML 語法不僅僅涉及了字符數(shù)據(jù)和標記,其中還包含了處理指令。在該例子中,下面的注釋被用來描述地址簿中特定的聯(lián)系人。對注釋的唯一限制就是在注釋中不能包含兩個連續(xù)的連字符。注釋可以出現(xiàn)在 CDATA 片段, 但他們并不作為注釋來處理。 注釋可以被用在 XML 文件有解析字符數(shù)據(jù)出現(xiàn)的任何地方。換句話說, XML 解析器和應用程序通常會忽略注釋。 注釋 在 XML 文件中,注釋用來表示那些技術(shù)上不是文件內(nèi)容的信息。通常, XML 解析可能會根據(jù)這些字符在 XML 中不同的結(jié)構(gòu)作用來解析 這些字符。apos。s Ratchet Service/pany 實體引用在和號和分號之間。)作為解析字符數(shù)據(jù): panyFrankamp。實質(zhì)上,實體引用還是 XML 片段的唯一名稱。 實體引用 實體是構(gòu)成 XML 文件的基本單位,而這就是實體本身以及通常通過實體引用構(gòu)成的其它實體。然而,仍然可以以“起始標記 /結(jié)束標記”的形式來表示空元素。第二個標記中的斜杠指出它是這對標記中的結(jié)束標記。 HTML 中空元素的語法來自結(jié)束標記的格式。 XML 中空元素的標記必須在元素名之后用一個斜杠( /)用來指出它是空的。在HTML 中的元素 br 就是一個空元素,因為它不含有任何字符數(shù)據(jù)。為了便于理解,可以將“元素”這個主語理解為邏輯上的標記片段,而“標記”是指用來在 XML文件中表示元素的文本字符串。 標記 標記( tag)是 XML 語法中最顯而易見的組成部分,它被用來描述元素。在該例子中使用了下面的文件類型聲明: !DOCTYPE addressbook SYSTEM―‖ 在文件類型聲明中明確地指定了文件的根元素是 addressbook 元素,文件的外 第二章 可擴展標記語言 9 部 DTD—— 在文件的類型聲明中也被明確地引用。如果鏈接 DTD,那么說明包括指示 XML 分析器到哪去尋找該DTD 的鏈接信息,這叫做鏈接文檔類型說明。 ? 指出文件的外部 DTD。文件類型聲明有如下三個主要作用: ? 指定文件的根元素。 ? 文件類型說明 文件類型聲明在 XML 中用來在文件中詳細地說明文件信息,其中包括文件根元素和文件類型定義( Document Type Definition, DTD) [5]。注釋是調(diào)試代碼的好方法,它 不是為機器準備的,而是供人閱讀的,因此分析器總是不理會“ !”和“ ”中間的一切。在圖 的文檔示例中, !–This is my good friend 就是注釋。該說明有三個組成部分: ? version=“ ”是版本說明,表示該文檔遵循 規(guī)范; ? encoding=“ UTF8”是編碼說明,表示采用 UTF8 作為編碼方式 ; ? standalone=“ yes”是獨立說明,指出該文檔在一個文件里完成,不需要從外部導入文件。apos。 第二章 可擴展標記語言 7 圖 XML 地址簿文件 文檔說明 所有的 XML 文檔都以首部開始,即使首部中沒有任何內(nèi)容。 為了更好地理解 XML 語法的主要組成部分,圖 包含一個用來保存聯(lián)系信息的 XML 地址簿?!薄ⅰ啊焙汀啊薄弊址?。apos;”和“ amp。gt;”、“ amp。 ? XML 用五種預定義實體“ amp。 ? 元素必須正確的嵌套。在深入了解 XML 文檔結(jié)構(gòu)之前,先需要了解以下幾條基本語法規(guī)則 [3]: ? XML 區(qū)分大小寫,元素的起始標注必須正好匹配結(jié)束標注。它們用于在 XML 分析器外給另一個處理應用發(fā)送指示。文檔首部就像一個引導記號,給處理器提供關(guān)于如何處理文檔主體(即文檔實例)的指示。有效文檔則已經(jīng)針對某個 DTD 驗證過了。 XML 文檔語法基礎(chǔ) XML 解析器讀取兩類 XML 文檔:良構(gòu)文檔和有效文檔。XML 是一個更具彈性、更容易添加新功能而又具有統(tǒng)一標準 的語言格式,它的目標是以目前用 HTML 尚不可能的方法在 Web 上服務、接受和處理 SGML。盡管 HTML 推出了一個又一個新版本,卻始終滿足不了不斷增長的需求。而從 SGML 衍生出來的 HTML( Hyper Text MarkupLanguage,超文本標記語言),憑借其簡潔性使得每個人都可能創(chuàng)建 Web頁面并將它們推向外部世界,從 而迅速成為在網(wǎng)上制作頁面的標準語言格式 [2]。 4 XML 快速解析技術(shù) 第二章 可擴展標記語言 5 第二章 可擴展標記語言 XML 技術(shù)的產(chǎn)生 上個世紀的 80 年代, SGML( Standard Generalized Markup Language,標準通用標記語言)作為文檔說明工具而被世人所知,并成為國際標準組織( ISO)的一項國際標準,即 ISO8879。 第五章是本論文的結(jié)束部分,對全文做統(tǒng)一總結(jié),并簡要概括了本文未詳細討論的如何使 VTD 記錄具有唯一性的內(nèi)容。然后介紹了 VTDXML解析結(jié)構(gòu)的原理。 第三章首先說明了 XML 解析的必要性以及解析原理,并詳細講解了基于對象的解析方式( DOM)和基于事件的解析方式( SAX)。 本文章節(jié)安排如下: 第一章對 XML 的發(fā)展 、 XML 解析技術(shù)的分類 和本文研究背景進行了簡要介紹。 XML 的解析技術(shù)在 XML 文檔的應用過程中有著重要的作用,它的行為減少了應用程序處理 XML 數(shù)據(jù)的負擔,為應用程序和數(shù)據(jù)庫提供了可操作的數(shù)據(jù)。 XML 文檔解析的主要任務是檢查編輯的 XML 文檔是否是結(jié)構(gòu)完整( Wellformed)和合法的( Validate)。 XML 文檔的編輯目前有兩種方式:一種是使用通用的編輯器生成 XML 文檔,如 Notepad;另一種是使用 XML IDE(集成開發(fā)環(huán)境),如 XMLSPY 等工具。 2. 性能:由于 XML 固有的冗余特性,對 XML 數(shù)據(jù)的管理將增大應用服務器的負擔。這便造成了程序處理的低效,并且給公司網(wǎng)絡、處理器和存儲結(jié)構(gòu)都帶來了很大的負載壓力,這就導致了 XML 的兩個關(guān)鍵問題:冗長和性能 。 XML 的使用因此而快速增長,分析家 Ron Schmelzer 預測,到 2021 年, XML 將由 2021 年網(wǎng)絡流量的 3%上漲至 24%,并且到 2021 年將至少上漲至 40%。 由于 XML 文檔能應用在不同平臺上,實現(xiàn)數(shù)據(jù)的協(xié)同工作,它現(xiàn)在已成為不可缺少的企業(yè)技術(shù)的一部分。 論文研究背景 XML( eXtensible Markup Language) ——可擴展標記性語言,是 W3C 組織認可的文檔數(shù)據(jù)格式標準,是 SGML( Standard Generalized Markup Language,標準通用標記語言)的子集,保留了 SGML 主要的使用功能,同時大大縮減了 SGML的復雜性。而其它非標準化、非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)換為 XML 文檔后,就可以將大量遺留數(shù)據(jù)實現(xiàn)信息共享和交換。目前很多國際著名 的 公司已完全加入到 XML 支持者的行列,如微軟 已廣泛使用了 XML,Netscape 新版本也將會支持 XML,其它公司,包括 IBM, Adobe, Sun 和 Xerox等也宣布支持 XML,并都在著手相關(guān)產(chǎn)品的研制。虛擬令牌環(huán); 數(shù)據(jù)通信模型 XML 快速解析技術(shù) ABSTRA
點擊復制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1