【正文】
ons of dynamic data sessions based on application needs. It develops autonomic functions to automatically optimize the data management according to highlevel objectives, in order to reduce the plexity of managing data sessions and adapt them promptly to changing environments. Finally, the proposed system has been demonstrated, with thorough experimental evaluation, that it is efective and can significantly outperform conventional DFSbased approaches in gridstyle environments。為了進(jìn)一步降低管理數(shù)據(jù)會(huì)話的人為干預(yù),使他們迅速適應(yīng)不斷變化的環(huán)境,植物神經(jīng)功能內(nèi)置于數(shù)據(jù)管理服務(wù),使他們自動(dòng)監(jiān)測(cè),分析能力 , 優(yōu)化電網(wǎng)范圍內(nèi)的數(shù)據(jù)會(huì)分散的實(shí)體,合作共同努力實(shí)現(xiàn)所需的數(shù)據(jù)配置和資源使 用的目標(biāo)。因此,本論文提出了一種新的基于服務(wù)的數(shù)據(jù)管理辦法,自主管理和自動(dòng)優(yōu)化配置的數(shù)據(jù)按照這樣高層次的目標(biāo)。動(dòng)態(tài)改變應(yīng)用程序的工作量和資源進(jìn)一步要求提供的數(shù)據(jù)會(huì)話連續(xù)監(jiān)測(cè),及時(shí)適應(yīng)它們的配置。 服務(wù)為基礎(chǔ)的管理自主數(shù)據(jù) 第三個(gè)問(wèn)題是,如何管理數(shù)據(jù)在網(wǎng)格尺度系統(tǒng)配置與動(dòng)態(tài)變化的環(huán)境? GVFS中方法的基礎(chǔ)上,數(shù)據(jù)會(huì)話可以啟動(dòng)需求和獨(dú)立定制的應(yīng)用程序。為了解決這個(gè)問(wèn)題,用戶(hù)級(jí)別的 DFS支持自定義,則建議應(yīng)用定制的 GVFS中數(shù)據(jù)會(huì)話。為了提供所需的性能,安全性和可靠性,一個(gè)網(wǎng)格,數(shù)據(jù)供應(yīng)需求要按照優(yōu)化應(yīng)用程序的行為和需要。此外,用戶(hù)級(jí)別的增強(qiáng)為網(wǎng)格環(huán)境而設(shè)計(jì)風(fēng)格是建立在虛擬層,使數(shù)據(jù)配置與應(yīng)用程序所要求的特點(diǎn)。 本論文提出了一個(gè)用戶(hù)級(jí) DFS的虛擬化,即網(wǎng)格虛擬文件系統(tǒng)( GVFS中),為應(yīng)用程序透明的網(wǎng)格數(shù)據(jù)訪問(wèn)。相反,數(shù)據(jù)網(wǎng)格管理需要專(zhuān)門(mén)處理這些獨(dú)特的問(wèn)題。 ?最后,建議的制度已經(jīng)證明,以徹底的實(shí)驗(yàn)評(píng)價(jià),認(rèn)為它是有效的,能顯著優(yōu)于常規(guī) 。特別是,該系統(tǒng)已作出以下貢獻(xiàn): ?它提供點(diǎn)播,跨域數(shù)據(jù)訪問(wèn)透明的未修改應(yīng)用和 O /S用戶(hù)級(jí)別廣泛使用的 O / S 級(jí)的虛擬化基礎(chǔ)分布式文件系統(tǒng)( DFSs)。 首先,應(yīng)用程序和數(shù)據(jù)資源的多樣性促使供應(yīng)解決方案,可以透明地部署,無(wú)需改變現(xiàn)有的經(jīng)營(yíng) 系統(tǒng)(海外 / SS)和修改應(yīng)用程序源代碼或二進(jìn)制代碼。 ?規(guī)模:大量資源可以在網(wǎng)格式的環(huán)境中匯總 。這些資源通常有不同的硬件配置(例如, CPU速度和結(jié)構(gòu),內(nèi)存大小,磁盤(pán)帶寬和容量)和軟件設(shè)置(例如,操 作系統(tǒng)和圖書(shū)館),而應(yīng)用程序也有不同的特性(如數(shù)據(jù)訪問(wèn)模式)和需要(如需要的數(shù)據(jù)訪問(wèn)性能,安全性和可靠性)。例如 科學(xué)網(wǎng)格 ,指 幾個(gè)機(jī)構(gòu)之間資源利用協(xié)調(diào)解決問(wèn)題,企業(yè)信息系統(tǒng),從多個(gè)站點(diǎn)聚合協(xié)同努力發(fā)展。在這些系統(tǒng)中常見(jiàn)的是,應(yīng)用程序和數(shù)據(jù)都分布在資源跨行政區(qū)劃和廣域網(wǎng)。 ?活力:在網(wǎng)格式的環(huán)境中部署的系統(tǒng)具有高度的活力。 他們分布在不同的機(jī)構(gòu)和廣域連接網(wǎng)絡(luò),提供的計(jì)算能力和存儲(chǔ)能力,支持處決許多應(yīng)用程序。第二,寬領(lǐng)域,跨應(yīng)用程序域環(huán)境必要定制的優(yōu)化數(shù)據(jù)訪問(wèn),以解決效率低下(網(wǎng)絡(luò)延時(shí)長(zhǎng),有限的網(wǎng)絡(luò)帶寬) , 不安全(不安全的資源,有限的互不同域之間的信任),以及 不安 全(不可靠機(jī)器和網(wǎng)絡(luò))是在這種環(huán)境中的典型。 ?它支持網(wǎng)格式環(huán)境設(shè)計(jì)的應(yīng)用程序定制的增強(qiáng)幾個(gè)重要方面,遠(yuǎn)程數(shù)據(jù)訪問(wèn),包括性能,一致性,安全性和可靠性。 在網(wǎng)格式環(huán)境中的 DFS為基礎(chǔ)的辦法,它也被 成功在生產(chǎn)電網(wǎng)系統(tǒng)部署了數(shù)年,支持科學(xué)工具和許多學(xué)科的用戶(hù)?,F(xiàn)有 的解決方案通過(guò)專(zhuān)門(mén)的使用 Grid數(shù)據(jù) API 或庫(kù) , 允許應(yīng)用程序訪問(wèn)。由于眾所周知的 DFS的界面是由 GVFS中保存并提交給應(yīng)用程序,沒(méi)有修改要求他們的源代碼 ,庫(kù)或二進(jìn)制文件。 總之,這種方法提供建議 GVFS中回答了第一個(gè)問(wèn)題 ,即 透明網(wǎng)寬未修改的應(yīng)用和 O /不銹鋼通過(guò)數(shù)據(jù)訪問(wèn)用戶(hù)級(jí)別的 DFS的虛擬化。因?yàn)橐粋€(gè)應(yīng)用程序定制的優(yōu)化(例如,有進(jìn)取心的預(yù)取文件內(nèi)容),可能會(huì)導(dǎo)致性能(例如,其他幾個(gè)稀疏文件退化,數(shù)據(jù)庫(kù)),應(yīng)用量身定做的功能通常沒(méi)有實(shí)現(xiàn)通用 O / S的內(nèi)核。特別是,增強(qiáng)設(shè)計(jì)網(wǎng)格式的環(huán)境是虛擬化層時(shí)提供 GVFS中,這包括可定制的磁盤(pán)高速緩存的高性能數(shù)據(jù)和多線程接入,應(yīng)用程序所需的數(shù)據(jù)一致性協(xié)議的一 致性效率,強(qiáng)并網(wǎng)兼容的安全保障網(wǎng)范圍內(nèi)的數(shù)據(jù)訪問(wèn)和可靠性協(xié)議支持應(yīng)用程序透明的故障檢測(cè)和恢復(fù)。然而,在大型系統(tǒng)中,許多動(dòng)態(tài)數(shù)據(jù)會(huì)話管理是另一個(gè)具有挑戰(zhàn)性的任務(wù),因?yàn)樗鼜?fù)雜性。這些要求往往超出了最終用戶(hù)和系統(tǒng)的能力,甚至管理員。 本論文提出的數(shù)據(jù)管理服務(wù)來(lái)管理每個(gè)應(yīng)用程序 GVFS中會(huì)話,執(zhí)行獨(dú)立會(huì)話之間的隔離,并為每個(gè)會(huì)話申請(qǐng)所需的定制。這種自主管理是適用于幾個(gè)重要的方面,包括數(shù)據(jù)會(huì)話緩存配置,數(shù)據(jù)復(fù)制和會(huì)話重定向。 it has also been successfully deployed in a production grid system [2][3] for several years, supporting scientific tools and users from many disciplines. The data management system proposed in this dissertation is architected to address three important questions, which are discussed in the following subsections respectively. ApplicationTransparent GridWide Data Access The first question is, how to provide applicationtransparent gridwide data access? Grids difer from traditional distributed puting environments because of their distinct characteristics, ., widearea working, heterogeneous end systems, and disjoint administrative domains. These diferences bring new challenges to data management systems, and the technologies that are successful in localarea works (LAN), ., LAN file systems, cannot be directly applied in a grid environment. Instead, grid data management needs to specifically address these unique issues. Exist