freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

某某移動企業(yè)搜索引擎項目技術方案-資料下載頁

2024-10-19 20:43本頁面

【導讀】動搜索引擎項目使用。未經北京拓爾思信息技術有限公司明確的書面許可,不得以。任何方式或手段對文檔的任何部分進行復制或傳播。盡管北京拓爾思信息技術有限公司已經盡力保證文檔內容的完整性和有效性,但是,仍可能有技術方面不夠準確的地方或印刷錯誤。北京拓爾思信息技術有限公司將根據需求變化對有關內容進行相應的調整。TRS®為北京拓爾思信息技術有限公司的注冊商標。六、搜索引擎功能響應-------------------------------------------------------------------------28

  

【正文】 邏輯表達式 10 關鍵詞檢索 邏輯表達式 50 關鍵詞檢索 邏輯表達式 5 100 關鍵詞 檢索 3 邏輯表達式 15 *關鍵詞檢索:指非結構化數據的全文檢索 **邏輯表達式:指非結構化數據和結構化數據的聯合檢索 其他參數 4) 每秒支持 100 個查詢 5) 網頁索引更新時間需要達到每 8 小時更新 1 次 6) 數據庫索引更新時間需要每 4 個小時更新 1 次; 本項目要求能夠安全穩(wěn)定地運行,支撐相關工作人員的日常工作。并需要根據應用數據的增長情況,充分考慮未來的服務支撐和數據擴容方式。為了達到系統(tǒng)要求的性能和適應未來發(fā)展的需要,下面將對數據庫的擴展性和伸縮性進行詳細闡述。 數據庫鏡像和分布式設計 在互聯網上經常需要進行信 息的交換和傳遞,為了提高網絡的訪問效率,實現信息的及時高效的傳遞, TRS 開發(fā)了全文檢索系統(tǒng)的數據鏡像技術,即在各一級節(jié)點中建立了中心節(jié)點數據的鏡像數據,鏡像數據源來自于中心節(jié)點的共享信息中的相對固定的部分數據,如聯合目錄數據庫等。在各一級站點建立鏡像以后,能夠提高本地的訪問速度、防止網絡的堵塞。 某某移動 搜索引擎項目技術方案 25 ? 單向一對多完全鏡像。 ? 可設置多個數據庫做完全鏡像。 ? 主節(jié)點在鏡像數據庫上進行的任何記錄增刪改,將定期地復制到子節(jié)點上(增量 式復制,每天一次)。 ? 鏡像初始化有兩種方式:手工方式和自動方式。 ? 主節(jié)點上的 mirror_portal 數據庫記錄各子節(jié)點的 SynchroClock,以決定各子節(jié)點的鏡像同步時間。如果沒有,則各子節(jié)點可在 里自行設置鏡像同步時間。 ? 當主節(jié)點的鏡像數據庫被刪除時,應從 中刪除該鏡像數據庫的描述行 , 并重新啟動 TRS Server;如果刪除后,又重新創(chuàng)建該鏡像數據庫,則應重新啟動 TRS Server。 ? 子節(jié)點的鏡像數據庫,一般只有 SYSTEM 用戶才有修改數據的權限。原則上 可以進行任何數據庫記錄的增刪改操作。但由于鏡像是單向的,所以子節(jié)點應盡量少修改:鏡像不會影響增加的記錄(除非主節(jié)點有清空鏡像數據庫的操作);刪除記錄后 , 該記錄將失去鏡像;在修改記錄后,如果主節(jié)點上也對該記錄進行了修改,則主節(jié)點上的修改將復蓋子節(jié)點上的修改。 ? 不能修改子節(jié)點上的鏡像數據庫結構。 某某移動 搜索引擎項目技術方案 26 TRS 分布式檢索技術 在復雜的網絡環(huán)境下,信息分布在網絡的各個節(jié)點上,為了方便的獲取信息,需要給用戶提供一種透明訪問網絡信息的手段。 TRS 提供了一種有效建立統(tǒng)一的檢索入口的方法。TRS 采用獨立統(tǒng)一的用戶認證機制,來 統(tǒng)一管理和分配網絡信息的訪問權限,網絡信息資源采用頻道技術來管理,通過定義頻道來鏈接不同的服務器和不同的數據庫,甚至數據庫中部分數據,頻道具有子頻道的概念,這樣可以允許用戶通過頻道來訪問網絡信息資源。 TRS頻道是在 Web 應用服務器中定義,可以和數據庫服務器分布在同一臺或不同臺服務器上,所以可以適應各種網絡環(huán)境。如下圖所示: 數據庫集群架構設計 網絡搜索引擎的特點就是訪問者總多,并發(fā)訪問量相當高,系統(tǒng)需要支持集群和負載平衡 的機制,以適應并發(fā)用戶同時訪問量的增加。 TRS 全文檢索數據庫基于分布式架構,高并發(fā)量設計,底層支持集群和負載均衡技術,在訪問量增加的時候,通過增加相應的硬件,很容易就實現系統(tǒng)擴容。 隨著數據量的增加 ,比如大幾十 G 或幾百 G 以上,就必須實施分布式檢索和負載均衡方案。 TRS 集群服務器是架構在多個物理 TRS 全文檢索數據庫服務器之上的分布式管理系統(tǒng),它支持數據分布以及負載均衡兩種基本分布方式,并支持兩種方式的組合運用。 引入TRS Database Cluster 以后, TRS 搜索引擎架構可以進行無限擴展,其 擴展機理 解釋如下: 某某移動 搜索引擎項目技術方案 27 當數據量增加時,通??赏ㄟ^增加全文數據庫服務器組(組間服務器為數據分布關系)的數量來實現新增數據的分布存儲索引; 當并發(fā)負載要求上升時,通常可通過增加組內服務器(組內 服務器之間 數據為鏡像關系)的數量來提高并發(fā)檢索效率。(這里的組是一個邏輯組織概念,也可以將數據相互分布的各臺服務器視為一個組) 服務器和服務器組增加后由 TRS 集群服務器( TRS Database Cluster) 完成對后臺部署的集群系統(tǒng)的統(tǒng)一調用,因為 它支持數據分布以及負載均衡兩種基本分布方式,并支持兩種方式的組合運用,所以服務 器的分組可以很靈活。 而 Cluster 本身可引入多臺,通過應用層的負載均衡設備連接,為應用層系統(tǒng)提供核心檢索功能。 由此可以看出, TRS Database Server 和 TRS Database Cluster 的聯合部署可以實現 某某移動 搜索引擎項目技術方案 28 以下目標: ? 實現海量數據的無限擴展。 ? 實現高并發(fā)用戶的高性能訪問。 ? 實現混合型搜索,滿足更加個性化的檢索需求,如按字、按詞等(架構中某一分支支持某種類型的搜索)。 ? 實 現高可靠性的檢索服務(無單點故障)。 6. 架構方案優(yōu)勢 本架構方案的優(yōu)勢在于: ? 性能優(yōu)異:本方案可穩(wěn)定支撐 100 并發(fā)用 戶的檢索請求,在此并發(fā)請求情況下,可獲得理想的檢索時間響應。 ? 健壯可靠:本方案中的服務系統(tǒng)和設備采用雙組模式,包括應用服務器、集群服務器、全文數據庫服務器組,完全消除了單點故障對系統(tǒng)整體運行可能造成的影響,能夠保障應用服務的高質量和穩(wěn)定性。 ? 投入產出比高:架構中支持采用 PC Server 來構成檢索核心集群,以很少的硬件投入獲得很高的檢索性能輸出,能夠完美地達到客戶方對系統(tǒng)性能的要求,并且此架構仍留有部分性能峰值空間。此外,系統(tǒng)維護成本很低,可通過監(jiān)控程序遠程監(jiān)控檢索后臺所有系統(tǒng)的運行狀況,在故障發(fā)生時可迅速 恢復相關故障服務。 ? 系統(tǒng)擴展便捷,代價低: TRS 的全文數據庫服務器和集群服務器具備靈活的組合擴展機制,可根據應用需求方便地進行調整和擴充,能夠適應未來數年內增長的信息的整合和檢索服務需求。 六、 搜索引擎功能響應 1. 文件搜索功能 TRS 全文數據庫 =全文檢索 +關系數據庫的基本關系特征 +NativeXML 數據庫特性。 TRS Database ( TRS 全文數據庫系統(tǒng))完全支持結構化數據和非結構化數據的聯合查詢,支持的文件種類包括網頁、電子郵件、 Office 文件、 PDF 文件、圖片、音視 某某移動 搜索引擎項目技術方案 29 頻多媒體文件、 圖表、公文、研究報告及關系型數據等,完成可以滿足 RTF、 DOC、 PPT、 XLS、 PDF、 HTML、 ASP、 JSP、 PHP、 TXT、 EML、 ZIP、 RAR 等文件類型的搜索。 在數據庫加載時, TRS 系統(tǒng)將根據文件格式確定相應的數據存儲方式,使用相應的分詞方法;在數據輸出時, TRS 系統(tǒng)將根據文件格式對數據進行相應的處理,便于瀏覽。每個TRS 系統(tǒng)可管理多達 1023 個文件格式對象。 TRS 系統(tǒng)把文件格式劃分成六種類型: ? 純文本 (TEXT) ? 格式文檔 (DOC) ? 圖像 (IMAGE) ? 音頻 (AUDIO) ? 視頻 (VIDEO) ? 自定義 (BIT) TRS 系統(tǒng)在安裝時,將自動創(chuàng)建下列文件格式對象 (名稱 ): ? BIT(不確定格式的二進制數據) ? TEXT(文本文件格式) ? WORD( Microsoft Word 文件格式) ? WS( WordStar 文件格式) ? WP( WordProfect 文件格式) ? XCL( Microsoft Excel 文件格式) ? WPS(金山 WPS 文件格式) ? S2(方正、華光二掃文件格式) ? DOC(不確定格式的文檔文件格式) ? AUDIO(不確定格式的音頻文件格式) ? IMAGE( 通用圖像文件格式) ? VIDEO(不確定格式的視頻文件格式) ? AVI( AVI 動畫文件格式) ? MPEG( MPEG 壓縮動畫文件格式) ? WAVE( Wave 音頻文件格式) ? MIDI( MIDI 音頻文件格式) 某某移動 搜索引擎項目技術方案 30 ? CDA( CD 音頻文件格式) ? PS( PostScript 文件格式) ? GIF( GIF 圖像文件格式) ? TIF( TIF 圖像文件格式) ? PCX( PCX 圖像文件格式) ? BMP( BMP 圖像文件格式) ? JPEG( JPEG 圖像文件格式) ? HTML( HTML 超文本文件格式) ? PDF( Adobe PDF 文件格 式) ? PPT( Microsoft Power Point 文件格式) ? RTF( Rich Text 文件格式) ? XML( XML 文件格式) ? MP3( MP3 文件格式) ? XLS( MP3 文件格式) ? PDF( MP3 文件格式) ? HTML( MP3 文件格式) ? ASP( ASP 文件格式) ? JSP( JSP 文件格式) ? PHP( PHP 文件格式) ? EML( EML 文件格式) ? ( CAD 文件格式) ? ZIP( ZIP 壓縮 文件格式) ? RAR( RAR 壓縮 文件格式) TRS 系統(tǒng)允許用戶自己定義新的文件格式,或者修改已有的文件格式。 2. 多國語言的支持 能力 TRS 全文數據庫 全 Unicode 的體系,可以同時顯示各種語言文字 ,可以支持 Unicode基礎上的多國語言查詢。 簡繁系統(tǒng)全由一個選項控制,界面和文字均自動轉換 。在外交部項目中,已經實現了對中(簡體、繁體)文、英文、日文、韓文等近 20 多種多國語言的支持。 某某移動 搜索引擎項目技術方案 31 同時也支持單一索引庫可同時包含多國語言檔案、單一檔案同時包含多國語言也能被建成索引、 單一查詢條件可同時以多國語言作為查詢詞匯。 對于單一查詢結果可同時包含多國語言的輸出以及同時啟動多國語言的同義詞查詢則需要對定制開發(fā)的方式實現。 3. 支持英文萬用字符 TRS 全 文數據庫完全滿足要求,支持截詞檢索:只有右截斷,使用“ *”作為截詞符,如“ biolog*”。截詞檢索也可用于非英語類的特殊字母,如 Grundstr?m 可以使用“ Grundstr*”來檢索。截詞命令檢索到截詞符為止的前幾個字母相同的所有詞。 4. 多條件搜索的邏輯關系 TRS 全文數據庫完全滿足要求, 全方位檢索手段提供了多達 48 種檢索運算符。包括外部特征與正文內容的各種邏輯組合檢索、位置檢索、二次檢索、漸進檢索、歷史檢索、詞根檢索、大小寫敏感檢索、概念檢索、對檢索結果按與檢索表達式的相關性和重要性程度排序等。 檢索表 達式可以包括合法的算術運算符、比較運算符、邏輯運算符、重復邏輯運算符、屬性運算符、限制運算符、加權運算符等等。 例如:輸入“中國 *北京” 表示在默認字段查詢中國和北京同時出現的記錄。 輸入“中華 %” 表示在默認字段查詢出現“中華??”的記錄,這里“ %”為通配符。 輸入“日期 *作者 =王 %”表示查詢日期為 1997 年 1
點擊復制文檔內容
公司管理相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1