freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)分析與挖掘習(xí)題-文庫吧資料

2025-03-31 02:56本頁面
  

【正文】 據(jù)庫的設(shè)計(jì)者必須把真實(shí)世界抽象為規(guī)范數(shù)據(jù);目前的多媒體數(shù)據(jù)庫一般應(yīng)用經(jīng)過擴(kuò)展的關(guān)系模型,多媒體數(shù)據(jù)庫的設(shè)計(jì)者將真實(shí)世界的模擬信號(圖形、圖像、音頻、視頻等)經(jīng)數(shù)字化,并對原始多媒體數(shù)據(jù)進(jìn)行特征參數(shù)提取獲得規(guī)范數(shù)據(jù)(元數(shù)據(jù)),然后將這些規(guī)范數(shù)據(jù)和原始多媒體的非規(guī)范數(shù)據(jù)通過關(guān)系模型合成為一個元組。簡單地說,多媒體數(shù)據(jù)庫是按一定方式組織在一起的可以共享的相關(guān)多媒體數(shù)據(jù)的集合,簡稱MDB(Multimedia Database)。這個表很少修改,而且也不會許多記錄,所以適合用文本數(shù)據(jù)庫。對于無需并發(fā)訪問的數(shù)據(jù)庫,其次數(shù)據(jù)庫不大(比如只有一條記錄),或者不需要修改刪除數(shù)據(jù)的數(shù)據(jù)庫才適合使用文本類型。任何文件都可以成為文本數(shù)據(jù)庫。空間數(shù)據(jù)庫引擎技術(shù)是目前系統(tǒng)集成中廣泛使用的中間件技術(shù)在空間數(shù)據(jù)庫應(yīng)用解決方案中的一種實(shí)現(xiàn),雖然付出了附加中間層的額外代價(jià),但它較好地解決了GIS 應(yīng)用與空間數(shù)據(jù)庫集成中數(shù)據(jù)提供與訪問模式方面的制約瓶頸問題, 是第三代數(shù)據(jù)模型,它克服了拓?fù)潢P(guān)系數(shù)據(jù)模型的缺點(diǎn),由于它是面向?qū)ο蟮?因此能夠方便地構(gòu)造用戶需要的任何復(fù)雜地理實(shí)體,而且這種模式符合人們看待客觀世界的思維習(xí)慣,便于用戶理解。由于傳統(tǒng)的關(guān)系數(shù)據(jù)庫在空間數(shù)據(jù)的表示、存儲、管理、檢索上存在許多缺陷,從而形成了空間數(shù)據(jù)庫這一數(shù)據(jù)庫研究領(lǐng)域。 這些應(yīng)用如同設(shè)計(jì)應(yīng)用一樣在程序設(shè)計(jì)方面和數(shù)據(jù)類型方面都是數(shù)據(jù)密集型的,它們需要識別于類型關(guān)系的存儲技術(shù),并能對相近數(shù)據(jù)備份進(jìn)行調(diào)整. 空間數(shù)據(jù)庫指的是地理信息系統(tǒng)在計(jì)算機(jī)物理存儲介質(zhì)上存儲的與應(yīng)用相關(guān)的地理空間數(shù)據(jù)的總和,一般是以一系列特定結(jié)構(gòu)的文件的形式組織在存儲介質(zhì)之上的。在數(shù)據(jù)庫中提供面向?qū)ο蟮募夹g(shù)是為了滿足特定應(yīng)用的需要。把面向?qū)ο蟮姆椒ê蛿?shù)據(jù)庫技術(shù)結(jié)合起來可以使數(shù)據(jù)庫系統(tǒng)的分析、設(shè)計(jì)最大程度地與人們對客觀世界的認(rèn)識相一致。 第二章 作業(yè)1. 簡述以下高級數(shù)據(jù)庫系統(tǒng)和應(yīng)用:面向?qū)ο髷?shù)據(jù)庫、空間數(shù)據(jù)庫、文本數(shù)據(jù)庫、多媒體數(shù)據(jù)庫和W W W。之所以有的大型數(shù)據(jù)倉庫系統(tǒng)架構(gòu)設(shè)計(jì)復(fù)雜,是因?yàn)榭紤]到了未來35年的擴(kuò)展性,這樣的話,客戶不用太快花錢去重建數(shù)據(jù)倉庫系統(tǒng),就能很穩(wěn)定運(yùn)行??蛻粢锤鞣N信息,肯定要準(zhǔn)確的數(shù)據(jù),但由于數(shù)據(jù)倉庫流程至少分為3步,2次ETL,復(fù)雜的架構(gòu)會更多層次,那么由于數(shù)據(jù)源有臟數(shù)據(jù)或者代碼不嚴(yán)謹(jǐn),都可以導(dǎo)致數(shù)據(jù)失真,客戶看到錯誤的信息就可能導(dǎo)致分析出錯誤的決策,造成損失,而不是效益。由于有的企業(yè)每日的數(shù)據(jù)量很大,設(shè)計(jì)不好的數(shù)據(jù)倉庫經(jīng)常會出問題,延遲13日才能給出數(shù)據(jù),顯然不行的。 ??梢哉f,數(shù)據(jù)庫、數(shù)據(jù)倉庫相輔相成、各有千秋。數(shù)據(jù)倉庫的出現(xiàn),并不是要取代數(shù)據(jù)庫。因此,數(shù)據(jù)倉庫中的數(shù)據(jù)是極少或根本不修改的。 “不可修改”:數(shù)據(jù)倉庫中的數(shù)據(jù)并不是最新的,而是來源于其它數(shù)據(jù)源。決策中,時間屬性很重要。數(shù)據(jù)倉庫側(cè)重于數(shù)據(jù)分析工作,是按照主題存儲的 “與時間相關(guān)”:數(shù)據(jù)庫保存信息的時候,并不強(qiáng)調(diào)一定有時間信息。那么,數(shù)據(jù)倉庫與傳統(tǒng)數(shù)據(jù)庫比較,有哪些不同呢?:面向主題的、集成的、與時間相關(guān)且不可修改的數(shù)據(jù)集合。這些數(shù)據(jù)是海量的,匯總計(jì)算起來也要慢一些,但是,只要能夠提供有效的分析數(shù)據(jù)就達(dá)到目的了。事務(wù)系統(tǒng)是實(shí)時的,這就要求時效性,客戶存一筆錢需要幾十秒是無法忍受的,這就要求數(shù)據(jù)庫只能存儲很短一段時間的數(shù)據(jù)。如果存款又多,消費(fèi)交易又多,那么該地區(qū)就有必要設(shè)立ATM了。數(shù)據(jù)倉庫是分析系統(tǒng)的數(shù)據(jù)平臺,它從事務(wù)系統(tǒng)獲取數(shù)據(jù),并做匯總、加工,為決策者提供決策的依據(jù)。以銀行業(yè)務(wù)為例。 單從概念上講,有些晦澀。 數(shù)據(jù)庫是為捕獲數(shù)據(jù)而設(shè)計(jì),數(shù)據(jù)倉庫是為分析數(shù)據(jù)而設(shè)計(jì),它的兩個基本的元素是維表和事實(shí)表。 數(shù)據(jù)庫一般存儲在線交易數(shù)據(jù),數(shù)據(jù)倉庫存儲的一般是歷史數(shù)據(jù)。一個經(jīng)驗(yàn)豐富的人對于此類最常見的問題會比較警覺,但出錯的可能性太多了。對于大的數(shù)據(jù)集,尤其是要發(fā)現(xiàn)精細(xì)的小型或偏離常規(guī)的模型的時候,這個問題尤其突出。GIGO的意思是垃圾進(jìn),垃圾出,它的引用到處可見
點(diǎn)擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1