freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

全文檢索系統(tǒng)整體方案-文庫吧資料

2025-05-01 00:21本頁面
  

【正文】 有“Computer”或“計算機”的信息。 近似概念詞庫輔助查詢功能252。也有可能因為模糊不明確的意象,使用者希望只需要輸入一 個關(guān)鍵詞,就能一并查詢性質(zhì)類似或相關(guān)之信息。252。 搭配多國語言同義詞庫,可以通過單一語言條件,得到多國語言檢索結(jié)果; 中英文模糊搜索查詢功能252。 可以輸入多國語言的檢索條件,并使用AND、OR、NOT邏輯關(guān)系;252。 同個數(shù)據(jù)表或一條數(shù)據(jù)庫記錄中可以支持多國語言混排內(nèi)容;252。 可支持多種編碼格式的索引,包含BigGB231Unicode、UTF EUCJP、ShiftJIS,并支持以Unicode同時輸入多國語系條件進行搜尋。 可支持多國語系(英文、繁簡體中文、日文、韓文、Unicode等)混合的文件的建置與查詢。 系統(tǒng)基于Unicode設(shè)計。 更小的索引空間:–通過詞索引的方式,索引數(shù)據(jù)庫相對字索引需要更少的磁盤空間;同樣數(shù)據(jù)量下,檢索時需要的Memory更少;252。該功能優(yōu)勢如下:252。 檢索字串首先通過自動斷詞,將其斷詞結(jié)果進行組合檢索;216。 中文句子將透過智能型自動斷詞技術(shù)以達(dá)到詞索引的效果,自動分析與斷詞,并建立詞索引;216。多字段條件間,支持AND/OR/NOT邏輯條件; 詞索引與查詢功能系統(tǒng)中提供了傳統(tǒng)的字索引,但是為提高查詢檢索的準(zhǔn)確度,系統(tǒng)采用自然語言斷詞機制和靈活的詞索引開關(guān),用戶可根據(jù)需要選擇詞索引或字索引。Cache儲存目錄記錄了Cache檔案所要放置的地址,經(jīng)查詢過的資料或畫面,第二次再進入時,可重復(fù)使用第一次查詢結(jié)果;252。 搜尋條件具有完整的布爾邏輯運算AND、OR、NOT能力,支持復(fù)合式布爾邏輯運算查詢,并且可以配合多組左括號(與右括號)作關(guān)鍵詞查詢優(yōu)先級的設(shè)定,方便查詢者輸入布爾組合之查詢條件;252。例如:輸入關(guān)鍵詞【Chin*】,會找到【China】、【Chine】、【Chinese】等等。 支持「萬用字符(*、?)查詢」。將分散在File Server上的文件、遠(yuǎn)程網(wǎng)站中的網(wǎng)頁、群組軟件中的資料,以及數(shù)據(jù)庫中的文字與非文字紀(jì)錄,在一次搜尋條件下,整合搜尋出來。 全文檢索系統(tǒng)功能特點 基本檢索功能支持252。 應(yīng)用整合完整外部程序整合機制—所有組件均提供SDK完整開發(fā)接口,方便外部整合。應(yīng)用本系統(tǒng)一系列內(nèi)容分析與索引核心組件群,將匯整的內(nèi)容進行斷詞、索引、分類、文件特征等運算與處理,以便滿足信息檢索與信息管理的應(yīng)用,提供多功能全面性的數(shù)據(jù)分析能力,可針對不同情境應(yīng)用加以整合,快速達(dá)到使用者需求。 可針對不同使用層級、項目進行非結(jié)構(gòu)性數(shù)據(jù)權(quán)限控管。 自動分類機制與專業(yè)詞庫須具備自動學(xué)習(xí)與修正之功能以提升數(shù)據(jù)處理準(zhǔn)確度。 針對非結(jié)構(gòu)性數(shù)據(jù)建立詞庫,詞庫須包含同音詞庫、同義詞庫、專業(yè)詞庫。 分類模式建立自動分類功能。搭配使用本系統(tǒng) 的 TXT、Microsoft Office、RTF、PDF、HTML、Email及 FileMeta資料提取器,將可解析Text、Microsoft Office、XML、RTF、PDF、HTML、MHT及Email(含附件文件)及文件影音附檔(如影片的文件名或摘要、圖片的文件名或摘要、及文字)等格式,包括繁體中文、簡體中文、英文、Unicode等;使用數(shù)據(jù)庫數(shù)據(jù)適配器,將可支持?jǐn)?shù)據(jù)庫數(shù)據(jù)匯入處理如Oracle、 Informix、Sybase、MS SQL等。本系統(tǒng)提供可掛載的數(shù)據(jù)適配器(Data Adapter),將異質(zhì)的數(shù)據(jù)來源與數(shù)據(jù)結(jié)構(gòu)進行匯整與粹取,亦扮演將非結(jié)構(gòu)的信息結(jié)構(gòu)化,可以很容易地分析特殊檔案格式和管理復(fù)雜的數(shù)據(jù)源結(jié)構(gòu)(如遞歸、巢狀等)的多功能設(shè)計,以方便信息檢索與管理。根據(jù)用戶實際需求,用戶可以選擇導(dǎo)入包含Text、Microsoft Office、XML、RTF、PDF、HTML、MHT、AutoCAD及Email(含附件文件)等格式及文件影音附件(如影片的文件名或摘要、圖片的文件名或摘要、及文字)自動化建立索引數(shù)據(jù),建立索引數(shù)據(jù)所處理之文字包括繁體中文、簡體中文等;同時用戶可以選擇導(dǎo)入數(shù)據(jù)庫數(shù)據(jù),如Oracle、 Informix、Sybase、MS SQL等。所有組件均提供SDK完整開發(fā)接口,方便應(yīng)用整合和應(yīng)用擴展。252。 信息萃取和服務(wù)在信息整合層形成的相對結(jié)構(gòu)化的數(shù)據(jù)虛擬層基礎(chǔ)上,本系統(tǒng)將對其中的每筆記錄進行中文切分詞、索引、文件特征分析、自動分類等各種演算算法處理,形成可以提供搜索服務(wù)的索引庫。 信息整合此部分主要作用是將企業(yè)內(nèi)部存儲于不同應(yīng)用系統(tǒng)中的結(jié)構(gòu)化信息、半結(jié)構(gòu)化信息、非結(jié)構(gòu)化信息通過本系統(tǒng)提供的兩種數(shù)據(jù)適配器進行信息提取,形成一個相對結(jié)構(gòu)化的數(shù)據(jù)虛擬層,以備后期信息萃取和服務(wù)。 全文檢索系統(tǒng)平臺架構(gòu)本系統(tǒng)基于組件化和松散耦合架構(gòu)和設(shè)計,系統(tǒng)平臺架構(gòu)示意圖如下:整個系統(tǒng)主要分為信息整合、信息萃取和服務(wù)、應(yīng)用整合三個部分。 整合容易,使用簡易,導(dǎo)入迅速,易于接受!套裝化、模塊化的設(shè)計及靈活的整合能力,能在企業(yè)內(nèi)迅速的安裝設(shè)置;
點擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1