freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

空間數(shù)據(jù)分析(參考版)

2024-08-26 23:37本頁面
  

【正文】 決策樹方法的分類穩(wěn)定性優(yōu)于神經(jīng)網(wǎng)絡(luò)方法。 分類方法 分類器的構(gòu)造方法有統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法等等。 訓(xùn)練樣本形式: (v1,v2,…vn, c) ;其中 vi表示字段值, c表示類別。 要構(gòu)造分類器,需要有一個(gè)訓(xùn)練樣本數(shù)據(jù)集作為輸入。 4. 基于網(wǎng)格的方法 5. 基于模型的方法 ? 空間分類發(fā)現(xiàn)的規(guī)則在模式識別、基于內(nèi)容的查詢、圖象分類等應(yīng)用中具有重要應(yīng)用。 3. 基于密度的方法: 只要臨近區(qū)域的密度(對象或數(shù)據(jù)點(diǎn)的數(shù)目)超過某個(gè)閾值,就繼續(xù)聚類。 凝聚的方法:自底向上的方法,一開始將每個(gè)對象作為單獨(dú)的一個(gè)組,然后相繼地合并相近的對象或組,直到所有的組合并為一個(gè)(層次的最上層),或者達(dá)到一個(gè)終止條件; 分裂的方法:自頂向下的方法,一開始將所有的對象置于一個(gè)簇中。一個(gè)好的劃分的準(zhǔn)則: 在同一個(gè)類中的對象之間盡可能“接近”或相關(guān);而不同類中的對象之間盡可能“遠(yuǎn)離”或不同。 給定要構(gòu)建的劃分的數(shù)目 k,劃分方法首先創(chuàng)建一個(gè)初始劃分。 主要聚類方法的分類 1. 劃分方法: 給定一個(gè) n個(gè)對象或元組的數(shù)據(jù)庫,一個(gè)劃分方法構(gòu)建數(shù)據(jù)的 k個(gè)劃分,每個(gè)劃分表示一個(gè)簇(即 k個(gè)組), k≤n 。 ? 聚類( clustering)就是將數(shù)據(jù)對象分組成為多個(gè)類或簇( cluster),在同一個(gè)簇中的對象之間具有較高的相似度,而不同簇中的對象分簇中的對象差別較大。 ? 允許假正測試( false positive test),即可以包括一些不屬于結(jié)果集的數(shù)據(jù)集; ? 不允許假負(fù)測試( false negative test),即不能排除一些潛在的答案。所以應(yīng)采用逐步求精的挖掘優(yōu)化方法: ( 1)通過空間查詢從初始空間數(shù)據(jù)庫中獲得和任務(wù)相關(guān)的空間數(shù)據(jù)庫; ( 2)使用一 些有效空間挖掘算法計(jì)算對象之間的空間聯(lián)接,從而獲得一個(gè)候選謂詞集合; ( 3)對( 2)中所得到的謂詞集合中的每一個(gè)謂詞計(jì)算其支持度,并且將那些支持度小于最小支持度的謂詞刪除; ( 4)對謂詞集合進(jìn)行進(jìn)一步精化以決定準(zhǔn)確的空間關(guān)系 ( 5)以( 4)所得的候選集作為輸入,生成空間關(guān)聯(lián)規(guī)則。 例: is_a(X,”school”)∧close_to(X,”sports_center”) =close_to(X,”park”) [%, 80%] 此規(guī)則表明 80%靠近體育中心的學(xué)校同時(shí)也靠近公園,并且有 %的數(shù)據(jù)符合這一規(guī)則。從深層次講,這是空間數(shù)據(jù)倉庫的數(shù)據(jù)結(jié)構(gòu)問題 ? 空間數(shù)據(jù)倉庫的聯(lián)機(jī)分析處理 OLAP技術(shù) ? 即共享多維信息的快速分析( Fast Analysis of shared Multidimensional information,簡稱FASMI)。 結(jié)論: 空間數(shù)據(jù)倉庫 就是針對解決上述問題所產(chǎn)生的一種技術(shù)方案,空間數(shù)據(jù)倉庫的歷史是伴隨著空間數(shù)據(jù)庫的發(fā)展過程開始的。 ?從各級決策者的角度講,空間數(shù)據(jù)處理的重點(diǎn)應(yīng)該從傳統(tǒng)的操作型擴(kuò)展到空間數(shù)據(jù)的聯(lián)機(jī)分析( OLAP)處理或分析型(信息型)。 ? 屬性刪除 : 如果某個(gè)屬性包含大量不同值,但是 1)在該屬性上沒有概化操作, 或者 2)它的較高層概念用其它屬性表示。 六、空間數(shù)據(jù)挖掘 空間數(shù)據(jù)挖掘( Spatial Data Mining,SDM),是從空間數(shù)據(jù)庫中提取隱含的、用戶感興趣的空間或非空間的模式和普遍特征的過程 ? 數(shù)據(jù)概化就是一個(gè)從相對低層概念到更高層概念并對數(shù)據(jù)庫中與任務(wù)相關(guān)的大量數(shù)據(jù)進(jìn)行抽象概述的一個(gè)分析過程;數(shù)據(jù)細(xì)化則相反 ? 將概化和特殊化技術(shù)應(yīng)用于空間分析,可以生成不同概念層面之間的規(guī)則和聯(lián)系 ? 空間數(shù)據(jù)概化可分為兩類:空間數(shù)據(jù)主導(dǎo)的概化和非空間數(shù)據(jù)主導(dǎo)的概化 ? 數(shù)據(jù)概化方法主要有兩種:數(shù)據(jù)立方體方法和基于屬性的歸納方法 ? 數(shù)據(jù)立方體方法 可以認(rèn)為是基于數(shù)據(jù)倉庫的、面向預(yù)計(jì)算的、物化視圖的方法 ? 在數(shù)據(jù)立方體上進(jìn)行計(jì)算和存儲(chǔ)結(jié)果,可以使用rolldown和 rollup操作完成數(shù)據(jù)概化和數(shù)據(jù)細(xì)化工作 ? 限制:只能處理非數(shù)值化數(shù)據(jù)和數(shù)值數(shù)據(jù)的簡單匯總。其中包含一些主觀決定(多少個(gè)距離組合?擬合的模型是什么?基臺值和塊金值取多少?)。雖然一些 GIS軟件提供半方差估計(jì)、建模和 Kriging,該鄰域大多嚴(yán)肅的工作者使用特殊軟件如 GSLIB、 Variowin,或 GS+。 克里格標(biāo)準(zhǔn)差 = [, ] 這僅是一個(gè)小例子,但從中可以看出幾個(gè)重要特點(diǎn): 1. Kriging是計(jì)算密集型的方法。 d)克里格方差 為了估計(jì)預(yù)測結(jié)果的不確定性,將權(quán)系數(shù)向量的每一行和 g向量的每一行相乘,然后將結(jié)果相加,得到預(yù)測克里格方差,其平方根就是克里格標(biāo)準(zhǔn)差。預(yù)測點(diǎn) (1,4)的g向量計(jì)算結(jié)果如下表。 伽瑪矩陣的逆矩陣: ( 3)計(jì)算權(quán)系數(shù)與預(yù)測 普通克里金的 權(quán)系數(shù)矩陣 為: 向量 g由未知點(diǎn)生成。 四個(gè)常用模型: Linear: Exponential: Assumes no sill or range Gaussian: Spherical: Where: c0 = nugget b = regression slope a = range c0+ c = sill 擬合模型: 用 平均半變異值 為縱坐標(biāo), 步長(抽樣間距) 為橫坐標(biāo),做理論半變異圖。 步長間距 樣點(diǎn)對間距 平均距離 半變異值 平均半變異值 半變異值的步長分組表 ( 2)擬合模型 為了預(yù)測,需要用理論半方差模型擬合經(jīng)驗(yàn)半方差,以描述其變程、基臺值和塊金 (range, sill, amp。因此,可以將樣點(diǎn)對分組,也就是將步長 (h)分組。 現(xiàn)在看一下方程 的左邊。然后對高于閾值的情況進(jìn)行預(yù)測。 ? 可以對 Z(s)進(jìn)行一下變換。 ? 趨勢也可以表示為: 若趨勢中的 系數(shù)未知 ,就是 泛克里金 模型。 趨勢值 可以被簡單地賦予一個(gè)常量,即,在任何位置處 。為確保自相關(guān)方差有解,必須允許某兩點(diǎn)間的自相關(guān)可以相等。 ?半方差: 定量描述區(qū)域性變化的第一步,它為空間插值、優(yōu)化采樣方案提供了有益信息。 假設(shè): 所有的隨機(jī)誤差都具有二階平穩(wěn)性,即,隨機(jī)誤差的均值為零,并且任意兩個(gè)隨機(jī)誤差之間的協(xié)方差只與兩者之間的距離和方向有關(guān),而與它們的具體位置無關(guān)。 樣條函數(shù)插值法評價(jià) ? 不適用于在短距離內(nèi)屬性有較大變化的地區(qū),否則估計(jì)結(jié)果偏大 。 ? 樣條函數(shù)是靈活曲線規(guī)的數(shù)學(xué)等式,為分段函數(shù),一次擬合只有少數(shù)數(shù)據(jù)點(diǎn)配準(zhǔn),同時(shí)保證曲線段的連接處為平滑連續(xù)曲線。因?yàn)楣烙?jì)值為均值,得到的表面將不通過樣本點(diǎn) ? 樣條插值的目標(biāo)就是尋找一表面 s(t),使它滿足最優(yōu)平滑原則,也就是說,利用樣本點(diǎn)擬合光滑曲線,使其表面曲率最小。對于高程表面,這‘抹平’了峰和谷。步驟 : a) 計(jì)算未知點(diǎn)到所有點(diǎn)的距離; b)計(jì)算每個(gè)點(diǎn)的權(quán)重: 權(quán)重 是 距離倒數(shù) 的函數(shù)。且對某待估點(diǎn)而言,其所有鄰域的樣點(diǎn)數(shù)的權(quán)重和為 1。 距離倒數(shù)插值 /反距離權(quán)重插值法 (Inverse Distance Weighting, IDW) ? IDW綜合了泰森多邊形的自然鄰近法和趨勢面分析漸變方法的長處,在插值時(shí)為待估點(diǎn) Z值為鄰近區(qū)域內(nèi)所有數(shù)據(jù)點(diǎn)的距離加權(quán)平均值,當(dāng)有各向異性時(shí),還要考慮方向權(quán)重。通常使用的采樣點(diǎn)數(shù)為 6— 8點(diǎn)。對于三角網(wǎng)邊緣的泰森多邊形,可作垂直平分線與圖廓相交,與圖廓一起構(gòu)成泰森多邊形。 ? 計(jì)算每個(gè)三角形的外接圓圓心,并記錄之。 ? 設(shè)離散點(diǎn)為 o。這只要在已構(gòu)建的三角網(wǎng)中找出具有一個(gè)相同頂點(diǎn)的所有三角形即可。對離散點(diǎn)和形成的三角形編號,記錄每個(gè)三角形是由哪三個(gè)離散點(diǎn)構(gòu)成的。因此, F檢驗(yàn)的結(jié)果表明,用二次趨勢面進(jìn)行擬合比較合理。在置信水平 a=,查 F分布表得 F2a= (5,6)= , F3a=(9,2)= 。結(jié)果表明,二次趨勢面回歸模型和三次趨勢面回歸模型的顯著性都較高,而且三次趨勢面較二次趨勢面具有更高的擬合程度。若計(jì)算的 F值大于臨界值 Fa ,則認(rèn)為趨勢面方程顯著;否則,不顯著。多項(xiàng)式回歸的基本思想是用多項(xiàng)式表示線或面,按最小二乘法原理對數(shù)據(jù)點(diǎn)進(jìn)行擬合,擬合時(shí)假定數(shù)據(jù)點(diǎn)的空間坐標(biāo) X、Y為獨(dú)立變量,而表示特征值的 Z坐標(biāo)為因變量。 即先用已知采樣點(diǎn)數(shù)據(jù)擬合出一個(gè)平滑的數(shù)學(xué)平面方程 , 再根據(jù)該方程計(jì)算無測量值的點(diǎn)上的數(shù)據(jù) ? 它的理論假設(shè)是地理坐標(biāo) ( x,y) 是獨(dú)立變量 , 屬性值 Z也是獨(dú)立變量且是正態(tài)分布的 , 同樣回歸誤差也是與位置無關(guān)的獨(dú)立變量 。 ? 邊界內(nèi)插方法最簡單的統(tǒng)計(jì)模型是標(biāo)準(zhǔn)方差分析( ANOVAR) 模型: 式中 , z是在 x0位置的屬性值 , μ 是總體平均值, α k是 k類平均值與 μ 的差 , ε 為類間平均誤差( 噪聲 ) 。 ?地統(tǒng)計(jì)學(xué)與空間經(jīng)濟(jì)計(jì)量學(xué)被看作空間統(tǒng)計(jì)學(xué)在不同領(lǐng)域中的別稱 五、空間插值 所謂空間數(shù)據(jù)插值 ,即通過探尋收集到的樣點(diǎn) /樣方數(shù)據(jù)的規(guī)律 ,外推 /內(nèi)插到整個(gè)研究區(qū)域?yàn)槊鏀?shù)據(jù)的方法 .即根據(jù)已知區(qū)域的數(shù)據(jù)求算待估區(qū)域值 , 影響插值精度的主要因素就是插值法的選取 ? 思路:假設(shè)任何重要的變化發(fā)生在邊界上 , 邊界內(nèi)的變化是均勻的 , 同質(zhì)的 , 即在各方向都是相同的 。 ? 根據(jù)預(yù)先確定的等級序列因子標(biāo)準(zhǔn)和判別臨界值,將要分析的對象進(jìn)行分析判別,并將其劃歸到序列的合適位置。 以上分析結(jié)果表明,根據(jù)主成分載荷,該區(qū)域地貌 水文系統(tǒng)的九項(xiàng)地理要素可以被歸為三類,即流域盆地的規(guī)模,流域侵蝕狀況和流域河系形態(tài)。第一,第二,第三主成分的累計(jì)貢獻(xiàn)率已高達(dá) %,故只需求出第一,第二,第三主成分 z1, z2, z3即可。下面,我們將其作為主成分分析方法在地理學(xué)研究中的一個(gè)應(yīng)用實(shí)例介紹給讀者,以供參考。 實(shí)例:對于某區(qū)域地貌 水文系統(tǒng),其 57個(gè)流域盆地的九項(xiàng)地理要素: x1為流域盆地總高度( m)x2為流域盆地山口的海拔高度( m), x3為流域盆地周長( m), x4為河道總長度( km), x5為河道總數(shù), x6為平均分叉率, x7為河谷最大坡度(度 ), x8為河源數(shù)及 x9為流域盆地面積( km2)的原始數(shù)據(jù)如表 214所示。在實(shí)際問題的分析中,常挑選前幾個(gè)最大的主成分,這樣既減少了變量的數(shù)目,又抓住了主要矛盾,簡化了變量之間的關(guān)系。 這樣決定的新變量指標(biāo) z1, z2, … , zm分別稱為原變量指標(biāo) x1, x2, … , xp的第一,第二, … ,第 m主成分。 如果記原來的變量指標(biāo)為 x1, x2, … , xp,它們的綜合指標(biāo) —— 新變量指標(biāo)為 x1, x2, … , zm( m≤p) 。為了克服這一困難,就需要進(jìn)行降維處理,即用較少的幾個(gè)綜合指標(biāo)來代替原來較多的變量指標(biāo),而且使這些較少的綜合指標(biāo)既能盡量多地反映原來較多指標(biāo)所反映的信息,同時(shí)它們之間又是彼此獨(dú)立的。 主成分分析的基本原理 主成分分析是把原來多個(gè)變量化為少數(shù)幾個(gè)綜合指標(biāo)的一種統(tǒng)計(jì)分析方法,從數(shù)學(xué)角度來看,這是一種降維處理技術(shù)。變量太多,無疑會(huì)增加分析問題的難度與復(fù)雜性,而且在許多實(shí)際問題中,多個(gè)變量之間是具有一定的相關(guān)關(guān)系的。如果回歸分析中包括兩個(gè)或兩個(gè)以上的自變量,且因變量和自變量之間是線性關(guān)系,則稱為多元線性回歸分析。運(yùn)用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。偏相關(guān)分析就是在研究兩個(gè)變量之間的線性相關(guān)系時(shí)控制可能對其產(chǎn)生影響的變量。但是在現(xiàn)實(shí)研究中,變量之間的相互影響往往涉及更深層次的因素。如控制年齡和工作經(jīng)驗(yàn)的影響,估計(jì)工資收入與受教育水平之間的相關(guān)關(guān)系?!軀r| 低度相關(guān); |r|≥ 高度相關(guān); 正相關(guān):如果 x,y變化的方向一致,如身高與體重的關(guān)系, r0;一般地, 線性相關(guān)分析 研究兩個(gè)變量間線性關(guān)系的程度。 空間統(tǒng)計(jì)分析,其核心就是認(rèn)識與地理位置相關(guān)的數(shù)據(jù)間的空間依賴、空間關(guān)聯(lián)或空間自相關(guān),通過空間位置建立數(shù)據(jù)間的統(tǒng)計(jì)關(guān)系 空間要素之間的相關(guān)性分析的任務(wù)是揭示空間要素之間相互關(guān)系的密切成都。 距黃河 150公里范圍內(nèi)的主要城市 ( 6) 地址匹配查詢 根據(jù)街道地址來查詢事物的空間位置和屬性信息是地理信息系統(tǒng)特有的一種查詢功能,這種查詢利用地理編碼,輸入街道門牌號碼,就可知道大致的位置和所在的街區(qū)??刹捎每臻g運(yùn)算,使用點(diǎn)在多邊形內(nèi),線在多邊形內(nèi),或面在多邊形內(nèi)的差別方法。包括點(diǎn)的位置坐標(biāo),兩點(diǎn)間的距離,一個(gè)或一段線目標(biāo)的長度,一個(gè)面狀目標(biāo)的周長或面積等
點(diǎn)擊復(fù)制文檔內(nèi)容
外語相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1