【正文】
................................................................38 WEB 模塊 .....................................................................................................................38 Servlet 模塊 .........................................................................................................38 ManagedBean 模塊 ..............................................................................................38 有關(guān)網(wǎng)頁(yè)的 Facelets 實(shí)現(xiàn) ..................................................................................41第六章 系 統(tǒng)測(cè)試 .................................................................................................................43 系統(tǒng)搜索模塊的測(cè)試 .................................................................................................43 資源模塊的測(cè)試 .........................................................................................................44 用戶模塊的測(cè)試 .........................................................................................................45結(jié)束語(yǔ) ...................................................................................................................................47致 謝 .....................................................................................................................................48參考文獻(xiàn) ...............................................................................................................................48湖南人文科技學(xué)院畢業(yè)設(shè)計(jì)I基于本體和 Lucene 的網(wǎng)絡(luò)教育資源檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)摘要:隨著 Inter/Intra 的迅速發(fā)展和廣泛普及,越來(lái)越多的 網(wǎng)站的出現(xiàn),Inter 上的信息量呈指數(shù)級(jí)增長(zhǎng),人們需要從浩如煙海的網(wǎng)絡(luò)中快速、準(zhǔn)確地找到自己需要的信息,這是信息時(shí)代的必然要求,所以對(duì)網(wǎng)站內(nèi)容的索引和搜索將會(huì)變得越來(lái)越重要。本設(shè)計(jì)在對(duì)網(wǎng)絡(luò)教育資源檢索系統(tǒng)的需求分析的基礎(chǔ)上,以 Eclipse 為集成開發(fā)環(huán)境,MySQL 為后臺(tái)數(shù)據(jù)庫(kù),使用 JSF、JPA 框架和 Lucene、OWL API 設(shè)計(jì)實(shí)現(xiàn)了基于本體和 Lucene 的網(wǎng)絡(luò)教育資源檢索系統(tǒng)。該系統(tǒng)主要實(shí)現(xiàn)了用戶登錄與注冊(cè)、網(wǎng)絡(luò)教育資源的管理與搜索。系統(tǒng)測(cè)試表明,該系統(tǒng)運(yùn)行穩(wěn)定,可訪問性、可靠性很好,操作簡(jiǎn)單方便。 關(guān)鍵詞:教育資源檢索;本體;JSF;JPA;Lucene;OWLDesign and Implementation of Network Education Resources Retrieval System Based on Ontology and LuceneAbstract: With the rapid development and wide spreading of Inter/Intra, the appearance of more and more web site, the exponentially increasing of the information amount in Inter, People need to find the information they need, This is the inevitable request of information age, so the index and search of web site content will be more and more important.In the design based on the need analysis of the work education resources retrieval system based on ontology and Lucene, using Eclipse as development environment, MySQL as background database, using JSF, JPA framework design and implement the work education resources retrieval system based on ontology and Lucene. The system mainly implements the user login and register, the management and search of work education resources. System testing showed that the system run stability, has good accessibility and reliability, simple operation.Key words: Education Resource Search。 Ontology。 JSF。 JPA。 Lucene。 OWL 湖南人文科技學(xué)院畢業(yè)設(shè)計(jì)1第一章 緒 論 引言由于 Inter 的迅猛發(fā)展,信息迅速膨脹,人們對(duì)信息查詢的準(zhǔn)確率的要求也越來(lái)越高,而全文檢索系統(tǒng)因?yàn)闄z索功能強(qiáng)大、效率高而越來(lái)越流行。Lucene 是一個(gè)基于 Java 的開放源代碼的全文檢索引擎工具包,能夠方便地嵌入到各種應(yīng)用中實(shí)現(xiàn)索引和搜索功能。本系統(tǒng)用此技術(shù)來(lái)實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)教育資源的全文檢索,通過對(duì)索引的查詢可以快速、可靠的得到相關(guān)信息,并在查詢過程中應(yīng)用中文分詞技術(shù),以使得查詢結(jié)果更加準(zhǔn)確和全面。 傳統(tǒng)的數(shù)據(jù)庫(kù)檢索方式大都采用傳統(tǒng)的關(guān)鍵詞匹配算法進(jìn)行查詢,并不能很準(zhǔn)確地返回相關(guān)信息,無(wú)法理解語(yǔ)義。而用來(lái)對(duì)特定領(lǐng)域的概念及術(shù)語(yǔ)給予明確的形式化描述的本體論不僅為規(guī)范化資源描述及用戶查詢提供了基礎(chǔ),也為更準(zhǔn)確地搜索信息提供了保證。本人在此項(xiàng)目中使用 Prot233。g233。 建立了知識(shí)本體,并使用 OWL API 解析本體,實(shí)現(xiàn)了一個(gè)能使用本體中已有的概念進(jìn)行的單詞補(bǔ)全,并查找特定概念的子概念,實(shí)現(xiàn)了推理補(bǔ)全,這兩者組成了搜索框的自動(dòng)完成功能,能在用戶搜索時(shí)提供相關(guān)的關(guān)鍵字智能提示,還可以對(duì)搜索詞進(jìn)行語(yǔ)義擴(kuò)展后搜索。 研究背景Lucene 是 apache 軟件基金會(huì) jakarta 項(xiàng)目組的一個(gè)子項(xiàng)目,是一個(gè)開放源代碼的全文檢索引擎工具包,即它不是一個(gè)完整的全文檢索引擎,而是一個(gè)全文檢索引擎的架構(gòu),提供了完整的查詢引擎和索引引擎,部分文本分析引擎(英文與德文兩種西方語(yǔ)言) 。 Lucene 的目的是為軟件開發(fā)人員提供一個(gè)簡(jiǎn)單易用的工具包,以方便的在目標(biāo)系統(tǒng)中實(shí)現(xiàn)全文檢索的功能,或者是以此為基礎(chǔ)建立起完整的全文檢索引擎。在計(jì)算機(jī)科學(xué)與信息科學(xué)領(lǐng)域,理論上,本體是指一種“形式化的,對(duì)于共享概念體系的明確而又詳細(xì)的說明”。本體提供的是一種共享詞表,也就是特定領(lǐng)域之中那些存在著的對(duì)象類型或概念及其屬性和相互關(guān)系;或者說,本體就是一種特殊類型的術(shù)語(yǔ)集,具有結(jié)構(gòu)化的特點(diǎn),且更加適合于在計(jì)算機(jī)系統(tǒng)之中使用;或者說,本體實(shí)際上就是對(duì)特定領(lǐng)域之中某套概念及其相互之間關(guān)系的形式化表達(dá)(formal representation) 。本體是人們以自己興趣領(lǐng)域的知識(shí)為素材,運(yùn)用信息科學(xué)的本體論原理而編寫出來(lái)的作品(artifacts) 。本體一般可以用來(lái)針對(duì)該領(lǐng)域的屬性進(jìn)行推理,亦可用于定義該領(lǐng)域(也就是對(duì)該領(lǐng)域進(jìn)行建模) 。 湖南人文科技學(xué)院畢業(yè)設(shè)計(jì)2 本文主要工作本系統(tǒng)從建立之初就注重良好的設(shè)計(jì)、效率和可移植性,系統(tǒng)先使用 MySQL Workbench 建立數(shù)據(jù)庫(kù)模 型,然后將 EER 模型生成建表的 SQL 腳本并放在 MySQL中運(yùn)行,以此來(lái)創(chuàng)建數(shù)據(jù)表。本項(xiàng)目使用的集成開發(fā)環(huán)境是 Eclipse ,持久層使用(EclipseLink 的實(shí)現(xiàn) )框架完成對(duì)象關(guān)系映射,Web 層使用 (使用 sun 的實(shí)現(xiàn)和 Primefaces 的擴(kuò)展 )框架,Web 和 Servlet 容器是 Apache Tomcat 。系統(tǒng)整體架構(gòu)為 B/S 模式,遵循 MVC 模式開發(fā),代碼符合 JavaEE 6 標(biāo)準(zhǔn),使用 JPA 完成ORM 映射,使用 JSF 的 Facelets 模板技術(shù),將用戶界面 設(shè)計(jì)與業(yè)務(wù)邏輯分離,利用POJO 做實(shí)現(xiàn), 在 Facelets 模板中使用 JSF 的標(biāo)準(zhǔn)標(biāo)簽、 Primefaces 擴(kuò)展標(biāo)簽、JSTL標(biāo)簽和 EL 表達(dá)式實(shí)現(xiàn)可維護(hù),可重用的視圖,具體實(shí)現(xiàn)操作利用 JSF 的ManagedBean 的方法作為 Action 或 AcitionListener,在 中定義頁(yè)面導(dǎo)航規(guī)則作為控制器,通過對(duì) JPA 實(shí)體類及其 Facade 類的操作實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)的操作,使用實(shí)體類和 POJO 作為模型,使用 ManagedBean 和 POJO 實(shí)現(xiàn)業(yè)務(wù)邏輯。對(duì)基于本體和 Lucene 的網(wǎng)絡(luò)教育資源檢索系統(tǒng)的功能進(jìn)行分析,主要是分析對(duì)網(wǎng)絡(luò)教育資源的管理、索引和搜索,以及解析本體中的特定類的子類的功能實(shí)現(xiàn)。其次進(jìn)行概要設(shè)計(jì),將系統(tǒng)分為 4 個(gè)模塊:數(shù)據(jù)庫(kù)模塊(實(shí)體模塊,facade 模塊) ,Lucene 模塊(索引模塊,搜索模塊) ,本體模塊,Web 模塊(模型模塊、Servlet 模塊、ManagedBean 模塊) 。再次進(jìn)行數(shù)據(jù)庫(kù)設(shè)計(jì),基于本體和 Lucene 的網(wǎng)絡(luò)教育資源檢索系統(tǒng)擁有多個(gè)數(shù)據(jù)表,為了實(shí)現(xiàn)相應(yīng)的功能模塊,需要對(duì)數(shù)據(jù)庫(kù)進(jìn)行相應(yīng)的設(shè)計(jì)。然后進(jìn)行詳細(xì)設(shè)計(jì),最后系統(tǒng)測(cè)試。開發(fā)一個(gè)基于本體和 Lucene 的網(wǎng)絡(luò)教育資源檢索系統(tǒng)必須經(jīng)過以下階段:? 可行性研究階段? 需求分析階段? 總體設(shè)計(jì)階段? 詳細(xì)設(shè)計(jì)階段? 系統(tǒng)實(shí)現(xiàn)階段? 測(cè)試階段 本文的組織安排文章緒論部分對(duì)本系統(tǒng)的背景和現(xiàn)狀進(jìn)行了簡(jiǎn)要的介紹,分析了本文的主要工作任務(wù);系統(tǒng)分析部分,包括開發(fā)環(huán)境和技術(shù)分析、可行性分析、需求分析、系統(tǒng)功能分析等,為設(shè)計(jì)和理解應(yīng)用程序做了很好的鋪墊;系統(tǒng)設(shè)計(jì)部分主要介紹了系統(tǒng)功能設(shè)計(jì)和數(shù)據(jù)庫(kù)設(shè)計(jì),并根據(jù)系統(tǒng)要對(duì)功能進(jìn)行了劃分和細(xì)化;系統(tǒng)實(shí)現(xiàn)部分 湖南人文科技學(xué)院畢業(yè)設(shè)計(jì)3說明了幾個(gè)主要模塊的算法及代碼設(shè)計(jì)。圍繞基于本體和 Lucene 的網(wǎng)絡(luò)教育資源檢索系統(tǒng)的項(xiàng)目實(shí)施,根據(jù)開發(fā)過程,重點(diǎn)闡述了軟件項(xiàng)目開發(fā)的流程,從業(yè)務(wù)流程、功能描述等方面對(duì)系統(tǒng)進(jìn)行了詳盡的分析,從數(shù)據(jù)庫(kù)邏輯模型、軟件結(jié)構(gòu)、模塊加工說明、界面設(shè)計(jì)四方面對(duì)系統(tǒng)進(jìn)行了詳盡的設(shè)計(jì)。最后對(duì)論文進(jìn)行了總結(jié),并對(duì)指導(dǎo)者進(jìn)行致謝。 湖南人文科技學(xué)院畢業(yè)設(shè)計(jì)4第二章 開發(fā)環(huán)境和開發(fā)技術(shù) 系統(tǒng)介紹本設(shè)計(jì)所實(shí)現(xiàn)的基于本體和 Lucene 的網(wǎng)絡(luò)教育資源檢索系統(tǒng)主要用于研究在Lucene 全文檢索系統(tǒng)中,如何利用本體中的概念和術(shù)語(yǔ)及其之間的關(guān)系進(jìn)行推理,提高搜索的質(zhì)量。本系統(tǒng)分為數(shù)據(jù)庫(kù)模塊(實(shí)體模塊,facade 模塊) ,Lucene 模塊(索引模塊,搜索模塊) ,本體模塊,Web 模塊(模型模塊、 Servlet 模塊、ManagedBean 模塊)四個(gè)模塊,實(shí)現(xiàn)用戶的登錄與注冊(cè)、文檔的管理和分類、文檔的搜索,文檔的索引、搜索關(guān)鍵字的智能提示等功能。 系統(tǒng)開發(fā)環(huán)境開發(fā)與運(yùn)行的環(huán)境的選擇會(huì)影響到數(shù)據(jù)庫(kù)設(shè)計(jì),本系統(tǒng)開發(fā)與運(yùn)行環(huán)境如下:? 操作系統(tǒng):Ubuntu Linux ? 開發(fā)工具:Eclipse ? 數(shù)據(jù)庫(kù)管理系統(tǒng):MySQ