【正文】
數(shù)據(jù)庫的設(shè)計更加復雜 分布式數(shù)據(jù)庫的設(shè)計除了要考慮集中式數(shù)據(jù)庫設(shè)計所要考慮的所有問題之外,還要考慮到數(shù)據(jù)分段,數(shù)據(jù)段的分配以及數(shù)據(jù)復制。因此,在分布式 DBMS 方面所積累的工業(yè)經(jīng)驗和集中式 DBMS 是不能相比的。而且, 9 直到現(xiàn)在還沒有一種工具或方法能將集 中式 DBMS 轉(zhuǎn)換為分布式 DBMS。 缺乏標準 分布式 DBMS 的實現(xiàn)基于有效的通信網(wǎng)絡(luò)的支持,但直到現(xiàn)在才逐漸出現(xiàn)了標準的通信和數(shù)據(jù)訪問協(xié)議。強制的完整性約束需要訪問大量用來定義這些約束的數(shù)據(jù),但這些數(shù)據(jù)在更新操作中并不是真正的涉及。 更難以控制的完整性 數(shù)據(jù)庫的完整性就是指存儲數(shù)據(jù)的可用性和一致性。而在分布式 DBMS 中,不僅需要對各個接上復制數(shù)據(jù)的訪問驚醒控制,而且網(wǎng)絡(luò)本身也同樣如此。設(shè)置在管理和維護本地 DBMS 和地層網(wǎng)絡(luò)時也需要一定的人力開銷。而且分布式 DBMS 需要額外的硬件開銷以建立連接各個結(jié)點的網(wǎng)絡(luò)。這是,上述的優(yōu)點就會 全部變成缺點。而且數(shù)據(jù)的可復制性更增加了分布式 DBMS 的復雜性。集中式 DBMS 的擴展會使硬件和軟件都需要升級。新結(jié)點可以添加 到網(wǎng)絡(luò)中,而不會影響其他結(jié)點的操作,這種適應性使得組織的擴展相對同意一些。在這種情況下,在網(wǎng)絡(luò)中驚醒數(shù)據(jù)傳送需要的開銷比本地訪問的開銷更大,將應用進行劃分并且在每個結(jié)點中執(zhí)行開銷將更少。而且在網(wǎng)絡(luò)中添加一個工作站也會比升級大型計算機系統(tǒng)更加經(jīng)濟。然而,現(xiàn)在通常認為用相對低得多的成本建立的小型計算機系統(tǒng)就能夠獲得與大型計算機相當?shù)挠嬎隳芰Α? 節(jié)約開銷 20 世紀 60 年代,計算能力是通過設(shè)備趁本的平方來衡量的: 3 倍的成本能產(chǎn) 生 9倍的能力。 改進了性能 因為數(shù)據(jù)是防止在離“最大需求“最近的結(jié)點上的,而且由于分布式 DBMS 內(nèi)在的并行機制,所以訪問分布式數(shù)據(jù)庫的速度肯定比訪問遠程集中式數(shù)據(jù)庫快。即使一個結(jié)點出現(xiàn)故障,系統(tǒng)也可 以把對故障結(jié)點的訪問請求重定向到其他結(jié)點。然而,在 DDBMS 系統(tǒng)中,一個結(jié)點的故障或通信鏈路的故障只會使某些結(jié)點不能被訪問,但決不會中斷整個系統(tǒng)的操作。通常也可以把責任部分地下放到本地級,所以本地 DBA可以管理本地 DBMS。這樣,擁護就可以對數(shù)據(jù)擁有本地控制權(quán),從而可以建立和執(zhí)行關(guān)于使用這些數(shù)據(jù)的本地策略。 改進了共享性和本地自主權(quán) 數(shù)據(jù)的分布可以反映出一個組織在地理上的分布,一個結(jié)點的用戶可以訪問其他結(jié)點上的數(shù)據(jù)。 DreamHome 的每個分支機構(gòu)都有一個數(shù)據(jù)庫用來記錄該機構(gòu)的職員信息,出租房產(chǎn)信息以及房產(chǎn)所有者的信息。例如, DreamHome 在許多城市都設(shè)有分支機構(gòu)。 DDBMS 的優(yōu)缺點 數(shù)據(jù)分布以及應用分布比傳統(tǒng)的集中式數(shù)據(jù)庫具有潛在的優(yōu)勢, 但也存在著不足。這常常被稱為 DDBMS 的基本原則。這樣,用戶 7 就不需要知道分布式數(shù)據(jù)庫是分段的,存儲在多個不同計算機上,并且可能被復制等細節(jié)。 ? 每個 DBMS 至少參與一個全局應用。 ? 結(jié)點是用通信網(wǎng)絡(luò)連接起來的。 ? 段是可以復制的。 因此, DDBMS 應當具有如下特征: ? 邏輯上相關(guān)的共享數(shù)據(jù)的集合。每一個結(jié)點都可以獨立的處理用戶訪問本地數(shù)據(jù)的請求,并且也可以處理網(wǎng)絡(luò)上其他計算機存儲的數(shù)據(jù)。 分布式數(shù)據(jù) 庫管理系統(tǒng)是由一個被氛圍多段的邏輯數(shù)據(jù)庫構(gòu)成的。 由此可以得到分布式 DBMS 的定義。 2. 概念 在開始討論分布式 DBMS 之前,先給出分布式數(shù)據(jù)庫的定義。這可能是由于地理分割,計算機體系結(jié)構(gòu)不兼容或通信協(xié)議不兼容原因造成的。數(shù)據(jù)的共享和數(shù)據(jù)訪問效率的提高以來與分布式數(shù)據(jù)庫系統(tǒng)的發(fā)展,分布式數(shù)據(jù)庫反映了上述組織結(jié)構(gòu),使得每個單元的數(shù)據(jù)都是可訪問的,并將最 近的數(shù)據(jù)存放于最常用的位置。實際上,計算機網(wǎng)絡(luò)的發(fā)展促進了分散式的作業(yè)模式。 From the definition of the DDBMS, the system is expected to make the distribution transparent to the user. Thus, the fact that a distributed database is split tinto fragments that can be stored on different puters and perhaps replicated, should be hidden from the user. The objective of transparency is to make the distributed system appear like a centralized system. This is sometimes referred to as the fundamental principle of distributed DBMSs. Advantages and Disadvantages of DDBMSs The distribution of data and applications has potential advantages over traditional centralized database systems. Unfortunately, there are also disadvantages. In this section, we review the advantages and disadvantages of the DDBMS. Advantages Reflects anizational structure Many anizations are naturally distributed over several locations. For example, DreamHome has many officers in different cities. It is natural for databases used in such an application to be distributed over these locations. DreamHome may keep a database at each branch