freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

空間數(shù)據(jù)分析-資料下載頁

2024-08-24 23:37本頁面
  

【正文】 果在任何時候趨勢 已知 ,無論趨勢是否是常量,都形成簡單克里金模型。 ? 趨勢也可以表示為: 若趨勢中的 系數(shù)未知 ,就是 泛克里金 模型。 ? 如果 未知 ,就是 普通克里金 模型。 ? 可以對 Z(s)進行一下變換。例如,可以把它換為一個指示變量,若 Z(s)低于一定的閾值(如空氣中的溴氧濃度值 ),則變?yōu)?0;若 Z(s)高于一定的閾值,則變?yōu)?1。然后對高于閾值的情況進行預(yù)測。便形成了 指示克里金 模型。 現(xiàn)在看一下方程 的左邊。 普通克里金( Ordinary Kriging, OK) 簡單克里金( Simple Kriging, SK) 泛克里金( Universal Kriging, UK) 指示克里金( Indicator Kriging, IK) ( 1)計算樣點對之間的距離和方差 半變異值 = 方差 示例:普通克里金方法 半變異值計算結(jié)果 位置 距離 方差 (ZiZj)2 半變異值 距離計算 變異函數(shù)y = 1 3 . 4 9 8 xR2 = 0 . 4 6 2 40204060801001200 1 2 3 4 5 6半變異線性 (半變異)如果數(shù)據(jù)很大,樣點對的數(shù)目將迅速增加并且變得難以操作。因此,可以將樣點對分組,也就是將步長 (h)分組。在該例中,首先將距離在 1~ 2之間的作為第一組; h在 2~ 3之間的作為第二組;依此類推(下表)。 步長間距 樣點對間距 平均距離 半變異值 平均半變異值 半變異值的步長分組表 ( 2)擬合模型 為了預(yù)測,需要用理論半方差模型擬合經(jīng)驗半方差,以描述其變程、基臺值和塊金 (range, sill, amp。 nugget )。 四個常用模型: Linear: Exponential: Assumes no sill or range Gaussian: Spherical: Where: c0 = nugget b = regression slope a = range c0+ c = sill 擬合模型: 用 平均半變異值 為縱坐標(biāo), 步長(抽樣間距) 為橫坐標(biāo),做理論半變異圖。 半變異值 = 斜率 距離 = h 生成伽瑪矩陣:如,樣點 (1,5)與樣點 (3,4)的半變異值為: = 變異函數(shù)y = 1 3 . 4 9 8 xR2 = 0 . 4 6 2 40204060801001200 1 2 3 4 5 6半變異線性 (半變異)伽瑪矩陣: 最后一行的 1和 0根據(jù)無偏估計的限制條件求得。 伽瑪矩陣的逆矩陣: ( 3)計算權(quán)系數(shù)與預(yù)測 普通克里金的 權(quán)系數(shù)矩陣 為: 向量 g由未知點生成。如用點 (1,4)來計算,計算該點與每個觀測點的距離,如 (1,4)與 (1,5)、 (3,4)、 (1,3)、 (4,5)、 (5,1)的距離。預(yù)測點 (1,4)的g向量計算結(jié)果如下表。 半變異值 = h 計算權(quán)系數(shù): 權(quán)系數(shù) 觀測值 乘積 克里金預(yù)測結(jié)果 正如預(yù)期,權(quán)系數(shù)隨距離的增加而減小,但由于將各點的空間分布也考慮進去,其結(jié)果比直接的距離權(quán)重要好。 d)克里格方差 為了估計預(yù)測結(jié)果的不確定性,將權(quán)系數(shù)向量的每一行和 g向量的每一行相乘,然后將結(jié)果相加,得到預(yù)測克里格方差,其平方根就是克里格標(biāo)準(zhǔn)差。 g向量 權(quán)系數(shù) 乘積 克里格方差 克里格標(biāo)準(zhǔn)差 如果假設(shè)誤差是正態(tài)分布的,則 95%的置信區(qū)間為: 克里格預(yù)測值 177。 克里格標(biāo)準(zhǔn)差 = [, ] 這僅是一個小例子,但從中可以看出幾個重要特點: 1. Kriging是計算密集型的方法。 2. 需要一個合適的軟件。雖然一些 GIS軟件提供半方差估計、建模和 Kriging,該鄰域大多嚴肅的工作者使用特殊軟件如 GSLIB、 Variowin,或 GS+。 3. 所有的結(jié)果依賴于為從樣點數(shù)據(jù)估計的半方差所擬合的模型,以及相關(guān)假設(shè)。其中包含一些主觀決定(多少個距離組合?擬合的模型是什么?基臺值和塊金值取多少?)。 4. 除了所討論的普通克里金,還有其他不同類型的克里金方法,比如,當(dāng)存在均值漂移( drift)時采用 Universal Kriging; CoKriging擴展到同時考慮兩個或更多變量。 六、空間數(shù)據(jù)挖掘 空間數(shù)據(jù)挖掘( Spatial Data Mining,SDM),是從空間數(shù)據(jù)庫中提取隱含的、用戶感興趣的空間或非空間的模式和普遍特征的過程 ? 數(shù)據(jù)概化就是一個從相對低層概念到更高層概念并對數(shù)據(jù)庫中與任務(wù)相關(guān)的大量數(shù)據(jù)進行抽象概述的一個分析過程;數(shù)據(jù)細化則相反 ? 將概化和特殊化技術(shù)應(yīng)用于空間分析,可以生成不同概念層面之間的規(guī)則和聯(lián)系 ? 空間數(shù)據(jù)概化可分為兩類:空間數(shù)據(jù)主導(dǎo)的概化和非空間數(shù)據(jù)主導(dǎo)的概化 ? 數(shù)據(jù)概化方法主要有兩種:數(shù)據(jù)立方體方法和基于屬性的歸納方法 ? 數(shù)據(jù)立方體方法 可以認為是基于數(shù)據(jù)倉庫的、面向預(yù)計算的、物化視圖的方法 ? 在數(shù)據(jù)立方體上進行計算和存儲結(jié)果,可以使用rolldown和 rollup操作完成數(shù)據(jù)概化和數(shù)據(jù)細化工作 ? 限制:只能處理非數(shù)值化數(shù)據(jù)和數(shù)值數(shù)據(jù)的簡單匯總。只能分析,不能自動的選擇哪些字段和相應(yīng)的概念層次 面向?qū)傩缘臍w納 ? 面向關(guān)系數(shù)據(jù)庫查詢的、基于概化的、聯(lián)機的數(shù)據(jù)分析處理技術(shù) ? 方法介紹: ?使用 SQL等收集相關(guān)數(shù)據(jù) ?通過數(shù)據(jù)屬性值刪除和屬性值概化來實現(xiàn)概化 ?聚集通過合并相等的廣義元組,并累計他們對應(yīng)的計數(shù)值進行 ?和使用者之間交互式的呈現(xiàn)方式 . 基本方法 ? 數(shù)據(jù)聚焦 :選擇和當(dāng)前分析相關(guān)的數(shù)據(jù),包括維。 ? 屬性刪除 : 如果某個屬性包含大量不同值,但是 1)在該屬性上沒有概化操作, 或者 2)它的較高層概念用其它屬性表示。 ? 屬性概化 :如果某個屬性包含大量不同值,同時在該屬性上有概化操作符,則運用該操作符進行概化 為什么要有空間數(shù)據(jù)倉庫? ?面對空間數(shù)據(jù)堆積越來越龐大的環(huán)境,各級管理者和指揮人員需要從大量復(fù)雜的空間數(shù)據(jù)中獲取各自權(quán)限內(nèi)的決策信息,從而作出正確有效的判斷和決策。 ?從各級決策者的角度講,空間數(shù)據(jù)處理的重點應(yīng)該從傳統(tǒng)的操作型擴展到空間數(shù)據(jù)的聯(lián)機分析( OLAP)處理或分析型(信息型)。 空間數(shù)據(jù)倉庫 ? 無數(shù)分散的不同數(shù)據(jù)庫存在著數(shù)據(jù)格式、數(shù)據(jù)語義、數(shù)據(jù)編碼、空間參照系統(tǒng)、數(shù)據(jù)處理方式、數(shù)據(jù)質(zhì)量等方面的異構(gòu)性,面對如此復(fù)雜的海量空間數(shù)據(jù)的頻繁交互過程,各級決策者從復(fù)雜的數(shù)據(jù)庫中提取的數(shù)據(jù)必須具有集成和關(guān)聯(lián)機制。 結(jié)論: 空間數(shù)據(jù)倉庫 就是針對解決上述問題所產(chǎn)生的一種技術(shù)方案,空間數(shù)據(jù)倉庫的歷史是伴隨著空間數(shù)據(jù)庫的發(fā)展過程開始的。 空間數(shù)據(jù)倉庫與空間數(shù)據(jù)庫 數(shù)據(jù)倉庫( DW) 數(shù)據(jù)庫( DB) 分析型數(shù)據(jù)環(huán)境 操作型數(shù)據(jù)環(huán)境 面向空間分析(主題),支持 SDSS 面向業(yè)務(wù),日常事務(wù)處理 集成的綜合數(shù)據(jù) 非集成或者集成程度很低,主要是明細數(shù)據(jù) 歷史數(shù)據(jù)( 510年) 主要關(guān)心當(dāng)前數(shù)據(jù) 定期加載,加載后極少更新 實時更新 數(shù)據(jù)驅(qū)動的開發(fā)周期 需求驅(qū)動的開發(fā)周期 ? 構(gòu)造和使用空間數(shù)據(jù)倉庫存在幾個挑戰(zhàn)性問題: ? 多源異構(gòu)空間數(shù)據(jù)的有效提取和集成: 由于空間數(shù)據(jù)倉庫中的數(shù)據(jù),是根據(jù)決策者所要解決問題的主題或領(lǐng)域,從多源異構(gòu)空間數(shù)據(jù)庫中提取的,數(shù)據(jù)由操作型空間數(shù)據(jù)庫環(huán)境導(dǎo)入空間數(shù)據(jù)倉庫環(huán)境,而且空間數(shù)據(jù)倉庫中的數(shù)據(jù)存在不同的細節(jié)級,因此如何有效地提取和集成這些數(shù)據(jù)就成了一個突出的問題。從深層次講,這是空間數(shù)據(jù)倉庫的數(shù)據(jù)結(jié)構(gòu)問題 ? 空間數(shù)據(jù)倉庫的聯(lián)機分析處理 OLAP技術(shù) ? 即共享多維信息的快速分析( Fast Analysis of shared Multidimensional information,簡稱FASMI)。目前常見的有基于多維數(shù)據(jù)庫的MOLAP( Mutielemention OLAP)、基于關(guān)系數(shù)據(jù)庫的 ROLAP( Relation OLAP)和混合的 HOLAP( Hybrid OLAP) 形式: A =》 B[s%, c%] A和 B是空間和非空間謂詞的集合, s%表示規(guī)則的支持度, c%表示規(guī)則的可信度。 例: is_a(X,”school”)∧close_to(X,”sports_center”) =close_to(X,”park”) [%, 80%] 此規(guī)則表明 80%靠近體育中心的學(xué)校同時也靠近公園,并且有 %的數(shù)據(jù)符合這一規(guī)則。 空間關(guān)聯(lián)規(guī)則的挖掘 需要在大量的空間對象中計算多種空間關(guān)系,代價極高。所以應(yīng)采用逐步求精的挖掘優(yōu)化方法: ( 1)通過空間查詢從初始空間數(shù)據(jù)庫中獲得和任務(wù)相關(guān)的空間數(shù)據(jù)庫; ( 2)使用一 些有效空間挖掘算法計算對象之間的空間聯(lián)接,從而獲得一個候選謂詞集合; ( 3)對( 2)中所得到的謂詞集合中的每一個謂詞計算其支持度,并且將那些支持度小于最小支持度的謂詞刪除; ( 4)對謂詞集合進行進一步精化以決定準(zhǔn)確的空間關(guān)系 ( 5)以( 4)所得的候選集作為輸入,生成空間關(guān)聯(lián)規(guī)則。 空間數(shù)據(jù)挖掘 前期采用的粗略挖掘算法必須滿足超級覆蓋特性( superset coverage property):即它保持了潛在的答案。 ? 允許假正測試( false positive test),即可以包括一些不屬于結(jié)果集的數(shù)據(jù)集; ? 不允許假負測試( false negative test),即不能排除一些潛在的答案。 例如,挖掘與空間謂詞 close_to有關(guān)的空間關(guān)聯(lián)規(guī)則: ? 使用一定的近似空間計算算法:如用最小邊界矩形結(jié)構(gòu)(僅涉及兩個空間點); ? 計算放寬后的空間謂詞,如 g_close_to,它包括 close_to,touch和 intersect的結(jié)果。 ? 聚類( clustering)就是將數(shù)據(jù)對象分組成為多個類或簇( cluster),在同一個簇中的對象之間具有較高的相似度,而不同簇中的對象分簇中的對象差別較大。 ? 聚類分析是統(tǒng)計學(xué)的一個分支,與規(guī)則分類不同的是,聚類算法無需背景知識,能直接從空間數(shù)據(jù)庫中發(fā)現(xiàn)有意義的空間聚類結(jié)構(gòu)。 主要聚類方法的分類 1. 劃分方法: 給定一個 n個對象或元組的數(shù)據(jù)庫,一個劃分方法構(gòu)建數(shù)據(jù)的 k個劃分,每個劃分表示一個簇(即 k個組), k≤n 。同時要求: ( 1)每個劃分至少包含一個對象 ( 2)每個對象必須屬于且只屬于一個組。 給定要構(gòu)建的劃分的數(shù)目 k,劃分方法首先創(chuàng)建一個初始劃分。然后采用一種迭代的重定位技術(shù),嘗試通過對象在劃分間移動來改進劃分。一個好的劃分的準(zhǔn)則: 在同一個類中的對象之間盡可能“接近”或相關(guān);而不同類中的對象之間盡可能“遠離”或不同。 流行的啟發(fā)式方法: (1) k平均算法; (2) k中心點算法 :對給定數(shù)據(jù)對象集合進行層次的分解。 凝聚的方法:自底向上的方法,一開始將每個對象作為單獨的一個組,然后相繼地合并相近的對象或組,直到所有的組合并為一個(層次的最上層),或者達到一個終止條件; 分裂的方法:自頂向下的方法,一開始將所有的對象置于一個簇中。在迭代的每一步中一個簇被分裂為更小的簇,直到最終每個對象在單獨的一個簇中,或者達到一個終止條件。 3. 基于密度的方法: 只要臨近區(qū)域的密度(對象或數(shù)據(jù)點的數(shù)目)超過某個閾值,就繼續(xù)聚類。對給定類中的每個數(shù)據(jù)點,在一個給定范圍的區(qū)域中必須至少包含某給數(shù)目的點。 4. 基于網(wǎng)格的方法 5. 基于模型的方法 ? 空間分類發(fā)現(xiàn)的規(guī)則在模式識別、基于內(nèi)容的查詢、圖象分類等應(yīng)用中具有重要應(yīng)用。 ? 數(shù)據(jù)分類( data classification)是一個兩步過程: ( 1)建立一個模型,描述預(yù)定的數(shù)據(jù)類集或概念集(或稱作分類器)。 要構(gòu)造分類器,需要有一個訓(xùn)練樣本數(shù)據(jù)集作為輸入。 訓(xùn)練集由一組數(shù)據(jù)庫記錄或元組構(gòu)成,每個元組是一個由有關(guān)字段(又稱屬性或特征)值組成的特征向量,此外,訓(xùn)練樣本還有一個類別標(biāo)記。 訓(xùn)練樣本形式: (v1,v2,…vn, c) ;其中 vi表示字段值, c表示類別。 ( 2)使用模型進行分類。 分類方法 分類器的構(gòu)造方法有統(tǒng)計方法、機器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法等等。機器學(xué)習(xí)方法包括決策樹法和規(guī)則歸納法,神經(jīng)網(wǎng)絡(luò)法主要是 BP算法。 決策樹方法的分類穩(wěn)定性優(yōu)于神經(jīng)網(wǎng)絡(luò)方法。 GIS中數(shù)據(jù)挖掘的過程 ( 1)根據(jù)一定的主題要求及相關(guān)背景知識,從現(xiàn)有的分布式空間數(shù)據(jù)庫中提取數(shù)據(jù)并進行分析和
點擊復(fù)制文檔內(nèi)容
外語相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1