【正文】
有完好封裝、松散耦合、,基于Web Ser vi ces 的信息集成方案是構建Web 數(shù)據(jù)集成系統(tǒng)較為理想的體系結構. 數(shù)據(jù)流管理測量和監(jiān)控復雜的動態(tài)的現(xiàn)象,如遠程通信、Web 應用、金融事務、大氣情況等,產(chǎn)生了大量、系統(tǒng)、算法、,包括新的流操作、SQL 擴展、查詢優(yōu)化方法、操作調(diào)度(operator scheduling)技術等[6] ..Tabl e 1 Comparison of database and data stream表1 數(shù)據(jù)流與數(shù)據(jù)庫對比Data stream DatabaseModel Tuple sequence Tuple set/bagData duration Transient PersistentQuery RealTime, continuous queries OffLine, onetime queriesQuery evaluation One pass ArbitraryQuery answer Approximate ExactQuery plan Fixed Adaptive,在數(shù)據(jù)庫中,數(shù)據(jù)是穩(wěn)定的,持續(xù)的,:數(shù)據(jù)是動態(tài)的,支持復雜的實時查詢需求.,數(shù)據(jù)流環(huán)境中的選擇、投影, ,、,不但要處理現(xiàn)在的數(shù)據(jù),若在有限的空間不能支持數(shù)據(jù)流的精確聚集操作,、,如何考慮數(shù)據(jù)流的查詢優(yōu)化問題.考慮到數(shù)據(jù)流速(data rate)的情況,數(shù)據(jù)流查詢優(yōu)化的目的應為獲得最大的查詢數(shù)據(jù)流速,即單位時間的數(shù)據(jù)流量,.商業(yè)微傳感器設備即將出現(xiàn),使得新型的DBMS 的“監(jiān)視”(如網(wǎng)絡入侵或電信欺詐監(jiān)測等),人們會在筆記本電腦或者投影儀上附加一個傳感器,如果一個投影儀丟失或者被竊,“信息流”,、時間序列功能、歷史消息窗口以及高效率隊列處理方面給DBMS 產(chǎn)品也將嘗試提供對這種監(jiān)視應用的支持,其方法應該是通過將流處理的功能移植到傳統(tǒng)的結構數(shù)據(jù)框架上.Web Ser vi ces 自然也產(chǎn)生數(shù)據(jù)流,松散結合的系統(tǒng)相互交換大量的商務數(shù)據(jù),如訂單、 格式表現(xiàn),產(chǎn)生持續(xù)的XML 數(shù)據(jù)流的查詢能力,從不間斷的XML 數(shù)據(jù)流中匹配、抽取和轉(zhuǎn)換部分數(shù)據(jù)流以驅(qū)動后臺商務應用,是Web Ser vi ces 的核心.XML 流處理的特點是XML (元素、屬性或text),所以需要將必要的數(shù)據(jù)有效地緩存,是目前XML ,查詢XML 數(shù)據(jù)流的研究包括Xfilter [18] ,Yfilter [19] ,XMLTK [20] ,XSQ [21] ,XSM [22] 轉(zhuǎn)化成一個有限自動機模型,有固定的初始節(jié)點和終節(jié)點,當走到有限自動機的終點時,表示XPath (//)和*或帶多個謂詞的XPath 語句, 查詢并綜合到一個結構中,同時計算共享路徑以避免重復操作,可以大大提高處理的效率.數(shù)據(jù)流本身的流速和流量的增長,傳感器數(shù)據(jù)流和XML 數(shù)據(jù)流的出現(xiàn)是對傳統(tǒng)的數(shù)據(jù)流處理提出的挑戰(zhàn).(NiagaraCQ,Stanford Stream, Telegraph, Aurora)或者專用的(Gigascope)數(shù)據(jù)流管理系統(tǒng). 傳感器數(shù)據(jù)庫技術隨著微電子技術的發(fā)展,根據(jù)傳感器在一定的范圍內(nèi)發(fā)回的數(shù)據(jù)定位小鳥的位置,從而進行其他的研究??梢苑奖愕嘏渲谩惭b和重新啟動傳感器數(shù)據(jù)庫中的各個組件等. XML 數(shù)據(jù)管理目前大量的XML 數(shù)據(jù)以文本文檔的方式存儲, XML 數(shù)據(jù)庫的原型系統(tǒng)已經(jīng)出現(xiàn)(Taminon,Lore,Timber,OrientX(中國人民大學開發(fā))等).XML 數(shù)據(jù)是半結構化的,不像關系數(shù)據(jù)那樣是嚴格的結構化數(shù)據(jù),這樣就給Native XML 數(shù)據(jù)庫中的存儲系統(tǒng)帶來更大的靈活性,同時,能夠減少I/O 次數(shù),提高查詢效率。在民用領域,利用移動對象數(shù)據(jù)庫技術可以實現(xiàn)智能運輸系統(tǒng)、出租車/警員自動派遣系統(tǒng)、,移動對象管理主要研究問題包括:(1) 位置的表示與建模[32] :為了對移動對象的位置進行行之有效的管理,移動對象數(shù)據(jù)庫系統(tǒng)必須能夠準確地獲取移動對象的當前位置信息(位置信息的獲取),并建立有效的位置管理模型(位置信息的表示).(2) 移動對象索引技術[33] :在移動對象數(shù)據(jù)庫中,這方面的研究還比較初步,尚待進一步地深入.(3) 移動對象及靜態(tài)空間對象的查詢處理:移動對象數(shù)據(jù)庫中的查詢目標分為兩種:一種是移動對象(如汽車、移動用戶等),另一種是靜態(tài)空間對象(如旅館、醫(yī)院等),即查詢結果依賴于移動對象當前位置,同一個查詢請求,其提交的時間、地點不同,(查詢某個時間段處于某個地理區(qū)域的移動對象)、KNN 查詢(查詢離某一點最近的K 個移動對象)以及連接查詢(查詢滿足條件的移動對象組合)等.(4) 位置相關的持續(xù)查詢及環(huán)境感知的查詢處理[34] :在移動對象數(shù)據(jù)庫中,另一類重要的查詢是位置相關的持續(xù)查詢(locationdependent continuous query,簡稱LDCQ).位置相關的持續(xù)查詢是指在某個時間區(qū)間內(nèi)持續(xù)有效的查詢,在該時間區(qū)間內(nèi),由于移動對象位置的改變,查詢的結果也在不斷變化,系統(tǒng)需要隨時將查詢結果的變化信息傳遞給查詢用戶,在高速公路上行進的救護車可以提交一個持續(xù)查詢:“請在未來20 分鐘之內(nèi)隨時告訴我離我最近的醫(yī)院”.用戶將在未來20 分鐘的行程中不斷地收到離救護車最近的醫(yī)院的查詢結果. 微小型數(shù)據(jù)庫技術數(shù)據(jù)庫技術一直隨著計算的發(fā)展而不斷進步,隨著移動計算時代的到來,[35~37],人們對移動數(shù)據(jù)實時處理和管理要求也不斷提高,嵌入式移動數(shù)據(jù)庫越來越體現(xiàn)出其優(yōu)越性,從而被學界和業(yè)界所重視.一般說來,微小型數(shù)據(jù)庫系統(tǒng)(a smallfootprint DBMS)可以定義為:,而對于掌上設備和其他手持設備,它占用的內(nèi)存空間只有50KB :超微DBMS(picoDBMS)、微小DBMS(microDBMS)和嵌入式DBMS 3 種.? PicoDBMS 包括GnatDB 和PicoDBMS,分別占用內(nèi)存11KB 和35KB,適用于智能卡(smart card)等微小設備。191。213。loch S, eds. Proc. of the ACM SIGMOD Int’l Conf. on Management of Data (SIGMOD 2004). ACMPress, 2004. 95~106.[16] Rajaraman A, Sagiv Y, Ullman JD. Anawering queries using templates with binding patterns. In: Jan C, ed. Proc. of the 14th ACMSIGACTSIGMODSIGART Symp. on Principles of Database Systems (PODS). ACM Press, 1995. 105~112.[17] Yerneni R, Li C, GarciaMolina H, Ullman J D. Computing capabilities of mediators. In: Delis A, Faloutsos C, Ghandeharizadeh G,eds. Proc. ACM SIGMOD Int’l Conf. on Management of Data. ACM Press, 1999. 443~454.[18] Altinel M, Franklin MJ. Efficient filtering of XML documents for selective dissemination of information. In: Abbadi AE, BrodieML, Chakravarthy S, Dayal U, Kamel N, Schlageter G, Whang KY, eds. Proc. of the 26th Int’l Conf. on Very Large Data Bases(VLDB). Morgan Kaufmann, 2000. 53~64.[19] Diao Y, Altinel M, Franklin MJ, Zhang H, Fischer P. Path sharing and predicate evaluation for highperformance XML filtering.TODS, 2003,28(4):296~336.[20] Peng F, Chawathe SS. Stream processing of XPath queries with predicates. In: Halevy AY, Ives ZG, Doan A, eds. Proc. of the 2003ACM SIGMOD Int’l Conf. on Management of Data (SIGMOD). ACM Press, 2003. 419~430.[21] AvilaCampillo I, Ravin D, Green T, Gupta A, Kadiyska Y, Onizuka M, Suciu D. Processing XML streams with deterministicautomata. In: Calvanese D, Lenzerini M, Motwani R, eds. Proc. of the 9th Int’l Conf. Database Theory (ICDT 2003). Lecture Notesin Computer Science 2572, SpringerVerlag. 2003. 173~189.[22] Lud228。loch S, eds. Proc. of the ACM SIGMOD Int’l Conf.on Management of Data. ACM Press, 2004. 1~4.[43] Database Access and Integration Services Working Group. [44] Goldman R. Integrated query and search of databases, XML, and the Web [ Thesis]. Stanford University, 2000.[45] Hristidis V, Gravano L, Papakonstantinou Y. Efficient IRStyle keyword search over relational databases. In: Freytag JC,Lockemann PC, Abiteboul S, Carey MJ, Selinger PG, Heuer A, eds. Proc. of the 29th Int’l Conf. on Very Large Data Bases(VLDB). Berlin: Morgan Kaufmann, 2003. 850~861.附中文參考文獻:[7] , 2003,20(11):32~36.[34] 丁治明,孟小峰,白蕓,2004,41(3):492~499.21 / 21