【正文】
們的源代碼 ,庫或二進制文件。因此,應用程序的透明度可取的,以便在網(wǎng)格,一個廣泛的應用部署,其中格啟用應該是網(wǎng)格中間件的責任,但不是應用程序用戶或開發(fā)人員?,F(xiàn)有 的解決方案通過專門的使用 Grid數(shù)據(jù) API 或庫 , 允許應用程序訪問。在局域網(wǎng)絡( LAN) 里的 這些差異帶來的數(shù)據(jù)管理的新挑戰(zhàn)系統(tǒng) 和 成功的技術(shù),例如,局域網(wǎng)文件系統(tǒng),不能直接應用在網(wǎng)格環(huán)境。 在網(wǎng)格式環(huán)境中的 DFS為基礎(chǔ)的辦法,它也被 成功在生產(chǎn)電網(wǎng)系統(tǒng)部署了數(shù)年,支持科學工具和許多學科的用戶。 ?它開發(fā)自主功能,自動優(yōu)化數(shù)據(jù)管理根據(jù)高層次的目標,以降低管理數(shù)據(jù)的復雜性和適應迅速變化的環(huán)境。 ?它支持網(wǎng)格式環(huán)境設(shè)計的應用程序定制的增強幾個重要方面,遠程數(shù)據(jù)訪問,包括性能,一致性,安全性和可靠性。 為了應對這些挑戰(zhàn),本文提出了兩個層次的數(shù)據(jù)管理系統(tǒng)中,文件系統(tǒng)虛擬化應用提供定制網(wǎng)格范圍內(nèi)的數(shù)據(jù)接入和服務為基礎(chǔ)的中間件使數(shù)據(jù)自動管理供應。第二,寬領(lǐng)域,跨應用程序域環(huán)境必要定制的優(yōu)化數(shù)據(jù)訪問,以解決效率低下(網(wǎng)絡延時長,有限的網(wǎng)絡帶寬) , 不安全(不安全的資源,有限的互不同域之間的信任),以及 不安 全(不可靠機器和網(wǎng)絡)是在這種環(huán)境中的典型。因為上述的任務異構(gòu),動態(tài)的,大規(guī)模的性質(zhì)在網(wǎng)格式計算環(huán)境造成這些獨特的挑戰(zhàn)應用程序和資源。 他們分布在不同的機構(gòu)和廣域連接網(wǎng)絡,提供的計算能力和存儲能力,支持處決許多應用程序。另一方面,應用根據(jù)需要啟動和終止,以及他們的工作量也隨著時間的推移會有所不同。 ?活力:在網(wǎng)格式的環(huán)境中部署的系統(tǒng)具有高度的活力。 關(guān)鍵詞: 數(shù)據(jù) ;應用;程序 這環(huán)境 有以下特色 特點 : ?異質(zhì)性:有一個存在于多種應用程序和資源網(wǎng)格式環(huán)境。在這些系統(tǒng)中常見的是,應用程序和數(shù)據(jù)都分布在資源跨行政區(qū)劃和廣域網(wǎng)。文件系統(tǒng)虛擬化和服務網(wǎng)格數(shù)據(jù)管理 摘要 : 根據(jù)計算的大小和行政區(qū)劃來看,它的規(guī)模在日益增大。例如 科學網(wǎng)格 ,指 幾個機構(gòu)之間資源利用協(xié)調(diào)解決問題,企業(yè)信息系統(tǒng),從多個站點聚合協(xié)同努力發(fā)展。這樣的環(huán)境可稱為 “格式 ”環(huán)境 。這些資源通常有不同的硬件配置(例如, CPU速度和結(jié)構(gòu),內(nèi)存大小,磁盤帶寬和容量)和軟件設(shè)置(例如,操 作系統(tǒng)和圖書館),而應用程序也有不同的特性(如數(shù)據(jù)訪問模式)和需要(如需要的數(shù)據(jù)訪問性能,安全性和可靠性)。在機器和網(wǎng)絡故障可發(fā)生在任何時間和非專用資源可以動態(tài)加入和退出制度。 ?規(guī)模:大量資源可以在網(wǎng)格式的環(huán)境中匯總 。 重點是分布式數(shù)據(jù)管理的兩個具 體方面 系統(tǒng):數(shù)據(jù)供應 上 運行的應用程序提供計算資源遠程訪問存儲對存儲資源的數(shù)據(jù),并會管理數(shù)據(jù)供應 的建立,配置和遠程終端數(shù)據(jù)訪問。 首先,應用程序和數(shù)據(jù)資源的多樣性促使供應解決方案,可以透明地部署,無需改變現(xiàn)有的經(jīng)營 系統(tǒng)(海外 / SS)和修改應用程序源代碼或二進制代碼。最后但并非最不重要的,在一個大的,動態(tài)的數(shù)據(jù)管理系統(tǒng)的配置也欲望靈活的控制和遠程數(shù)據(jù)訪問的自動優(yōu)化,以與眾多的應用程序提供數(shù)據(jù)的復雜性協(xié)議,以靈活地適應不斷變化的環(huán)境,并提供應用所需的性能,安全性和可靠性。特別是,該系統(tǒng)已作出以下貢獻: ?它提供點播,跨域數(shù)據(jù)訪問透明的未修改應用和 O /S用戶級別廣泛使用的 O / S 級的虛擬化基礎(chǔ)分布式文件系統(tǒng)( DFSs)。 ?它采用的中間件服務,以實現(xiàn)靈活和可互操作的管理電網(wǎng)規(guī)模的數(shù)據(jù)配置,這是控制能力和生命周期動態(tài)數(shù)據(jù)的會話配置基于應用的需要。 ?最后,建議的制度已經(jīng)證明,以徹底的實驗評價,認為它是有效的,能顯著優(yōu)于常規(guī) 。 ,以解決三個重要的問題 應用程序透明的電網(wǎng)范圍內(nèi)的數(shù)據(jù)訪問 第一個問題是,如何提供應用程序透明的并網(wǎng)范圍內(nèi)的數(shù)據(jù)訪問? 不同于傳統(tǒng)的分布式網(wǎng)格,因為他們的計算環(huán)境 的 鮮明的特點,例如,廣域網(wǎng)絡,異構(gòu)的終端系統(tǒng),與不相交 的 管理域。相反,數(shù)據(jù)網(wǎng)格管理需要專門處理這些獨特的問題。然而,應用程序源或二進制必要的修改經(jīng)常發(fā)生后,最終用戶和開發(fā)人員的肩膀上的負擔并提出一個障礙 的應用程序不能輕易修改。 本論文提出了一個用戶級 DFS的虛擬化,即網(wǎng)格虛擬文件系統(tǒng)( GVFS中),為應用程序透明的網(wǎng)格數(shù)據(jù)訪問。此外,該方法是基于用戶級的虛擬化技術(shù),它不要求改變現(xiàn)有 216。此外,用戶級別的增強為網(wǎng)格環(huán)境而設(shè)計風格是建立在虛擬層,使數(shù)據(jù)配置與應用程序所要求的特點。 應用量身定做的柵格數(shù)據(jù)配置 第二個問題是,如何提供與應用程序定制的優(yōu)化數(shù)據(jù)?典型的 O / SS是旨在支持通用的應用程序,但它往往是 “一大小不適合所有 ” 的 情況。為了提供所需的性能,安全性和可靠性,一個網(wǎng)格,數(shù)據(jù)供應需求要按照優(yōu)化應用程序的行為和需要。此外,內(nèi)核級的修改是難以港口和部署,特別是在共享環(huán)境。為了解決這個問題,用戶級別的 DFS支持自定義,則建議應用定制的 GVFS中數(shù)據(jù)會話。基于 GVFS中,數(shù)據(jù)會議可以根據(jù)需要創(chuàng)建的每個應用程序的基礎(chǔ)上,其中每個會話 應用和配置這些增強自主解決其應用的需求。 服務為基礎(chǔ)的管理自主數(shù)據(jù) 第三個問題是,如何管理數(shù)據(jù)在網(wǎng)格尺度系統(tǒng)配置與動態(tài)變化的環(huán)境? GVFS中方法的基礎(chǔ)上,數(shù)據(jù)會話可以啟動需求和獨立定制的應用程序。數(shù)據(jù)會話需要 在 動態(tài)的基礎(chǔ)上建立和銷毀的生命周期的應用程序和它們的實例和數(shù)據(jù)存儲的位置 。動態(tài)改變應用程序的工作量和資源進一步要求提供的數(shù)據(jù)會話連續(xù)監(jiān)測,及時適應它們的配置。然而,用戶或管理員的目標是相當簡單,明確的。因此,本論文提出了一種新的基于服務的數(shù)據(jù)管理辦法,自主管理和自動優(yōu)化配置的數(shù)據(jù)按照這樣高層次的目標。它們支持靈活的控制在生命周期和數(shù)據(jù)會話的配置,并可以探索知識應用程序(如數(shù)據(jù)訪問模式,數(shù)據(jù)共享方案,和服務質(zhì)量要求)來定制的性能,使用他們的數(shù)據(jù)會話的一致性,安全性和可靠性增強。為了進一步降低管理數(shù)據(jù)會話的人為干預,使他們迅速適應不斷變化的環(huán)境,植物神經(jīng)功能內(nèi)置于數(shù)據(jù)管理服務,使他們自動監(jiān)測,分析能力 , 優(yōu)化電網(wǎng)范圍內(nèi)的數(shù)據(jù)會分散的實體,合作共同努力實現(xiàn)所需的數(shù)據(jù)配置和資源使 用的目標。 總之, GVFS中的數(shù)據(jù)管理系統(tǒng)解決最后一個問題由用人自主服務,提供自動化管理 的數(shù)據(jù)和優(yōu)化會議根據(jù)應用需求和不斷變化的環(huán)境。 the applications also have diverse characteristics (., data access pattern) and needs (., desired data access performance, security, and reliability). Dynamism: Systems deployed in a gridstyle environment are highly dynamic. Failures on machines and works can happen at any time, and nondedicated resources may dynamically join and leave the system. On the other hand, applications are started and terminated on demand, and their workloads also vary over time. Scale: Large amounts of resources can be ag