【正文】
uctured data with different sources, XML makes it Fossible to retrieve data from different and inpatible database servers, and brings hopes for Web data query. This article focus on these following problems: 1. Consicering the big difference of data format and data sources on the Web, We made research and discuss on the Web data model XML data model. 2. To resolve the problem of integration of data with. different structure. Because the integration problem mainly focus on the integration of different structured RDBMS, this article adopted mediated schema and transformed the data in RDBMS into XML data source. Therefore, better sharing of data can be ealized. full use of the advantages of using XML data model in semistructured data representation and query,we can carry out dataretrieving queries from XML data resources on Web by using XMLQL. Before the emergence of XML,Weboriented data query is a plex technique. Through the research in this article if we represent Web data by XML data model and transform the structured data from different data source into XML data format sources We will realize data sharing and carry out exact and efficient data query,which will simplify ourwork and enhance efficiency greatly.Key words:XML, Web query, Semistructured data, Data model目錄一、引 言 (7)二、基于XML的Web查詢技術(shù)研究 (8)1 Web查詢涉及的幾個主要問題 (8)2 Web上的數(shù)據(jù)模型XML數(shù)據(jù)模型 (9)3 異構(gòu)數(shù)據(jù)庫的集成 (20)4 基于XML的Web查詢 (29)三、結(jié) 論 (44)參考文獻 (45)基于XML的Web查詢技術(shù)研究一、引 言隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)已成為人們獲得信息的主要途徑和重要手段網(wǎng)絡(luò)}資源豐富,悶容龐雜,網(wǎng)絡(luò)上的數(shù)據(jù)能否很好地得到共享成為影響網(wǎng)絡(luò)發(fā)展的個重要因素但就目前來看,我們?nèi)粘S玫降臄?shù)據(jù)大部分是無結(jié)構(gòu)的文檔和完全結(jié)構(gòu)化的關(guān)系數(shù)據(jù)庫中的數(shù)據(jù),如果把這些數(shù)據(jù)放在互聯(lián)網(wǎng)上很難實現(xiàn)數(shù)據(jù)的共享為此,必須改變當前數(shù)據(jù)格式的多樣性和共享性差的缺點,用一種統(tǒng)一的數(shù)據(jù)格式來表示數(shù)據(jù),從而實現(xiàn)數(shù)據(jù)在互聯(lián)網(wǎng)上更大范圍內(nèi)的共享。通過本文的研究方法,如果通過XML數(shù)據(jù)模型描述Web上的數(shù)據(jù),把不同來源的結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)換成XML格式的數(shù)據(jù),就能夠方便的實現(xiàn)數(shù)據(jù)的共享和進行精確、有效的信息查詢,將極大的簡化復(fù)雜性,提高工作效率。3. 利用XML數(shù)據(jù)模型在半結(jié)構(gòu)化數(shù)據(jù)表示和查詢方面的優(yōu)勢,通過基于XML查詢語言XMLQL實施Web查詢。由于異構(gòu)數(shù)據(jù)的集成主要是異構(gòu)關(guān)系數(shù)據(jù)庫中數(shù)據(jù)的集成。由于XML能夠使不同來源的結(jié)構(gòu)化的數(shù)據(jù)很容易地結(jié)起,從而使搜索多樣的不兼容的數(shù)據(jù)成為可能,為解決Web查詢問題帶來了希圍繞著基于XML的Web查詢技術(shù)涉及到的幾個主要問題展開研究與討論:、數(shù)據(jù)來源差別大及當前的數(shù)據(jù)模型不能很好地描述Web上數(shù)據(jù)的缺點,研究和探討了Web上的數(shù)據(jù)模型XML數(shù)據(jù)模型。XML的出現(xiàn)為解決上述問題提供了理想的解決方案。但WWW是一個信息的海洋,數(shù)億萬計的Web文檔散布在世界各地的成千上萬個Web服務(wù)器上,并且每個服務(wù)器自主管理自己的資源,沒有一個統(tǒng)一的管理機制。涉密論文按學校規(guī)定處理。作者簽名: 日期: 年 月 日學位論文版權(quán)使用授權(quán)書本學位論文作者完全了解學校有關(guān)保留、使用學位論文的規(guī)定,同意學校保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。對本文的研究做出重要貢獻的個人和集體,均已在文中以明確方式標明。作者簽名: 日 期: 學位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨立進行研究所取得的研究成果。對本研究提供過幫助和做出過貢獻的個人或集體,均已在文中作了明確的說明并表示了謝意?!”究粕厴I(yè)論文(設(shè)計)論文(設(shè)計)題目:基于XML的WEB查詢技術(shù)研究 系: 信息管理系畢業(yè)設(shè)計(論文)原創(chuàng)性聲明和使用授權(quán)說明原創(chuàng)性聲明本人鄭重承諾:所呈交的畢業(yè)設(shè)計(論文),是我個人在指導(dǎo)教師的指導(dǎo)下進行的研究工作及取得的成果。盡我所知,除文中特別加以標注和致謝的地方外,不包含其他人或組織已經(jīng)發(fā)表或公布過的研究成果,也不包含我為獲得 及其它教育機構(gòu)的學位或?qū)W歷而使用過的材料。作 者 簽 名: 日 期: 指導(dǎo)教師簽名: 日 期: 使用授權(quán)說明本人完全了解 大學關(guān)于收集、保存、使用畢業(yè)設(shè)計(論文)的規(guī)定,即:按照學校要求提交畢業(yè)設(shè)計(論文)的印刷本和電子版本;學校有權(quán)保存畢業(yè)設(shè)計(論文)的印刷本和電子版,并提供目錄檢索與閱覽服務(wù);學??梢圆捎糜坝 ⒖s印、數(shù)字化或其它復(fù)制手段保存論文;在不以贏利為目的前提下,學??梢怨颊撐牡牟糠只蛉績?nèi)容。除了文中特別加以標注引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫的成果作品。本人完全意識到本聲明的法律后果由本人承擔。本人授權(quán) 大學可以將本學位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學位論文。作者簽名: 日期: 年 月 日導(dǎo)師簽名: 日期: 年 月 日指導(dǎo)教師評閱書指導(dǎo)教師評價:一、撰寫(設(shè)計)過程學生在論文(設(shè)計)過程中的治學態(tài)度、工作精神□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格學生掌握專業(yè)知識、技能的扎實程度□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格學生綜合運用所學知識和專業(yè)技能分析和解決問題的能力□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格研究方法的科學性;技術(shù)線路的可行性;設(shè)計方案的合理性□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格完成畢業(yè)論文(設(shè)計)期間的出勤情況□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格二、論文(設(shè)計)質(zhì)量論文(設(shè)計)的整體結(jié)構(gòu)是否符合撰寫規(guī)范?□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格是否完成指定的論文(設(shè)計)任務(wù)(包括裝訂及附件)?□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格三、論文(設(shè)計)水平論文(設(shè)計)的理論意義或?qū)鉀Q實際問題的指導(dǎo)意義□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格論文的觀念是否有新意?設(shè)計是否有創(chuàng)意?□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格論文(設(shè)計說明書)所體現(xiàn)的整體水平□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格建議成績:□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格(在所選等級前的□內(nèi)畫“√”)指導(dǎo)教師: (簽名) 單位: (蓋章)年 月 日評閱教師評閱書評閱教師評價:一、論文(設(shè)計)質(zhì)量論文(設(shè)計)的整體結(jié)構(gòu)是否符合撰寫規(guī)范?□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格是否完成指定的論文(設(shè)計)任務(wù)(包括裝訂及附件)?□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格二、論文(設(shè)計)水平論文(設(shè)計)的理論意義或?qū)鉀Q實際問題的指導(dǎo)意義□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格論文的觀念是否有新意?設(shè)計是否有創(chuàng)意?□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格論文(設(shè)計說明書)所體現(xiàn)的整體水平□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格建議成績:□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格(在所選等級前的□內(nèi)畫“√”)評閱教師: (簽名) 單位: (蓋章)年 月 日教研室(或答辯小組)及教學系意見教研室(或答辯小組)評價:一、答辯過程畢業(yè)論文(設(shè)計)的基本要點和見解的敘述情況□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格對答辯問題的反應(yīng)、理解、表達情況□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格學生答辯過程中的精神狀態(tài)□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格二、論文(設(shè)計)質(zhì)量論文(設(shè)計)的整體結(jié)構(gòu)是否符合撰寫規(guī)范?□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格是否完成指定的論文(設(shè)計)任務(wù)(包括裝訂及附件)?□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格三、論文(設(shè)計)水平論文(設(shè)計)的理論意義或?qū)鉀Q實際問題的指導(dǎo)意義□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格論文的觀念是否有新意?設(shè)計是否有創(chuàng)意?□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格論文(設(shè)計說明書)所體現(xiàn)的整體水平□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格評定成績:□ 優(yōu) □ 良 □ 中 □ 及格 □ 不及格(在所選等級前的□內(nèi)畫“√”)教研室主任(或答辯小組組長): (簽名)年 月 日教學系意見:系主任: (簽名)年 月 日基于XML的Web查詢技術(shù)研究摘 要WWW是目前使用最為廣泛的Internet信息服務(wù)系統(tǒng),它為用戶提供了一個搜索和瀏覽信的工具??傮w狀況是,整個網(wǎng)絡(luò)上資源豐富,內(nèi)容龐雜,很難實現(xiàn)數(shù)據(jù)的共享,亦不能進行有效地查詢。XML全稱為Extensible Markup Language,即擴展標記語言,是SGML(Standard Generalized Markup Language)的一個簡化的而又嚴格的子集,它是特別為Web應(yīng)用設(shè)計的,XML是一個在互聯(lián)網(wǎng)上進行數(shù)