【正文】
發(fā) 布代 理發(fā) 布代 理In tr a n e tIn tr a n e tIn tr a n e tINTERNET信息采集系統(tǒng) INTERNET信息非常豐富,希望擴(kuò)充信息資源,同時(shí)也了解同行業(yè)者的最新動(dòng)態(tài),滿足不同用戶的個(gè)性化信息需求的需要。 ? 用戶自定義感興趣的需要挖掘網(wǎng)站。 ? 系統(tǒng)包括訓(xùn)練與采集兩個(gè)過程,訓(xùn)練過程是獲取用戶的興趣模型,采集過程是給用戶推薦感興趣信息的過程。 ? 支持與內(nèi)容發(fā)布系統(tǒng)的接口,將采集結(jié)果有選擇性的發(fā)布到網(wǎng)站平臺(tái)上。 ? 對于采集結(jié)果支持用戶參與。 異構(gòu)數(shù)據(jù)集成系統(tǒng) 數(shù)據(jù)源A C C E S SO R A C L ES Y B A S ES Q L S E R V E RD B F物 理 數(shù) 據(jù) 庫( 中 心 )邏 輯 數(shù) 據(jù) 庫( 中 心 )數(shù) 據(jù) 的 映 射 規(guī) 則 、 數(shù) 據(jù) 模 型 ( 元 數(shù) 據(jù) )數(shù) 據(jù) 映 射 、 數(shù) 據(jù) 采 集 及整 合( 數(shù) 據(jù) 集 成 D I )數(shù)據(jù)訪問、數(shù)據(jù)分析(OLAP)10 %10 %10 %10 %10 %10 %10 %10 %10 %10 %12345WEB用戶訪問X M L采 集( A g e n t )采 集( A g e n t )采 集( A g e n t )采 集A g e n t采 集A g e n t采 集A g e n t基于主題的決策查詢系統(tǒng) ? 領(lǐng)域主題的維護(hù) ? 支持固定報(bào)表和動(dòng)態(tài)報(bào)表的自動(dòng)生成 ? 支持二維表格和復(fù)合表格的展現(xiàn)形式。二維表格是指表頭很復(fù)雜但數(shù)據(jù)是以二維表的方式出現(xiàn),復(fù)合表格表格是指是表格中的數(shù)據(jù)與表格說明相互嵌套。 ? 系統(tǒng)管理人員可以通過可視化的手段來定義和維護(hù)這些報(bào)表。 ? 支持報(bào)表展現(xiàn)的其他方式,如圖形、 EXCEL表格倒出等。 ? 同時(shí)通過授權(quán)管理模塊,可以實(shí)現(xiàn)多種控制方式的查詢訪問控制。 基于 LUCENCE的全文搜索引擎 采用開源代碼 LUCENCE,然后進(jìn)行封裝和二次開發(fā): ? 實(shí)現(xiàn)基于內(nèi)容的搜索,也可以指定查網(wǎng)頁某一部分的內(nèi)容。 ? 支持基于 AND 和 OR 的組合查詢,在結(jié)果中查詢的用戶查詢定置功能。 ? 管理員可以通過 WEB定義要搜索的站點(diǎn)。 ? 在統(tǒng)一的搜索界面上,用戶可以選擇所有站點(diǎn)查詢及某一站點(diǎn)查詢。 ? 該搜索引擎既可以作為全校的統(tǒng)一信息服務(wù)平臺(tái)的搜索引擎,也可以向?qū)W校某一站點(diǎn)提供搜索引擎服務(wù)。 ? 支持 WORD,PDF等文件基于內(nèi)容的搜索。 站 點(diǎn) 信 息索 引 庫搜 索 引 擎 頁 面定 時(shí) 索 引 器I N T E R N E T系 統(tǒng) 管 理管 理 員統(tǒng) 計(jì) 報(bào) 表其 他 W E B 網(wǎng) 站調(diào) 用 接 口調(diào) 用 接 口文 檔 或 網(wǎng) 頁搜 索 器文 檔 或 網(wǎng) 頁文 檔 或 網(wǎng) 頁網(wǎng) 絡(luò) 爬 蟲應(yīng)用示例 應(yīng)用示例 門戶理解 門戶構(gòu)架 我們工作 一點(diǎn)體會(huì) 一點(diǎn)體會(huì) ? 針對每個(gè)學(xué)校的具體情況,采用大集中或整合的方式。 ? 技術(shù)不是重要的,關(guān)鍵是需要有一個(gè)較強(qiáng)的協(xié)調(diào)團(tuán)隊(duì)。 ? 統(tǒng)籌規(guī)劃,分步驟實(shí)施。 ? 是一個(gè)長期投資的過程,是一個(gè)不斷完善和整合的過程。 ? 制定部門信息化建設(shè)的規(guī)范和標(biāo)準(zhǔn)。 謝謝! 中南大學(xué)網(wǎng)絡(luò)中心