【正文】
獻[12]從算法與應(yīng)用角度綜述了不確定數(shù)據(jù)管理技術(shù)。文獻[13]進一步從理論角度闡述不確定數(shù)據(jù)管理的基礎(chǔ)與挑戰(zhàn)。裴健等人[14]回顧了近期不確定性查詢處理方面的進展,特別是他們自己的工作,包括范圍查詢、s k y l i n e查詢與t o pk查詢等。周傲英等人[1]以不確定數(shù)據(jù)管理框架為主線,綜述了不確定性數(shù)據(jù)管理技術(shù)在數(shù)據(jù)模型、預(yù)處理與集成、存儲與索引、查詢處理等各個方面所取得的重要進展。數(shù)據(jù)集成董欣(Xin Dong,音譯)等人[15]研究了面向不確定性數(shù)據(jù)的數(shù)據(jù)集成系統(tǒng),他們認為一個數(shù)據(jù)集成系統(tǒng)需要在三個層次上處理不確定性:不確定性數(shù)據(jù)源、不確定性模式映射和不確定性查詢。首先,不確定性數(shù)據(jù)源是該數(shù)據(jù)集成系統(tǒng)最直接的動力,在很多情況下原始數(shù)據(jù)都可能不準確。其次,異構(gòu)數(shù)據(jù)源與中介模式之間的映射關(guān)系可能存在不確定性,其可能的原因包括用戶操作不熟練、機器自動匹配等。在實際應(yīng)用中,利用半自動化工具自動生成中介模式也很常見,并非需要領(lǐng)域?qū)<姨貏e指定。最后,在很多應(yīng)用中還需要處理不確定性查詢。例如,在萬維網(wǎng)應(yīng)用中,以關(guān)鍵詞形式提交查詢非常普遍,這就是一個典型的不確定性查詢。索引技術(shù)需要針對概率維度創(chuàng)建一維索引,此時傳統(tǒng)索引技術(shù)有效。但傳統(tǒng)的索引技術(shù)無法解決所有問題。當各元組的取值必須通過概率分布函數(shù)描述,且概率分布函數(shù)無法預(yù)先指定時,傳統(tǒng)的索引技術(shù)就無法勝任了。目前較好的方法有概率闕值索引技術(shù)(PTI)[16]和UTree技術(shù)[17]。前者針對一維數(shù)據(jù),后者針對多維空間數(shù)據(jù)。其他查詢Skyline查詢是另一類查詢,其目的是返回成為skyline的節(jié)點。裴健等人定義了概率skyline查詢,并提出了自下而上和自上而下兩種方法,充分運用定界、剪枝精化等啟發(fā)式規(guī)則提高效率[32]。連(Lian,音譯)與陳(Chen,音譯)等人則定義了在不確定性數(shù)據(jù)上的reverse skyline問題,并給出了解決方案[33]。 參考文獻