【正文】
borious. In recent years, with the further development of remote sensing technology, it has bee one possibility by use of remote sensing images for specific species information extraction.Ximeng County in Pu39。 Remote Sensing。 Decision Tree Classification。桉樹作為外來樹種人工林中的一種,近20年來發(fā)展十分迅猛,規(guī)模不斷擴(kuò)大,在林業(yè)上具有不可爭議的經(jīng)濟(jì)效能,而且桉樹生長迅速、輪伐期短、耐干旱、耐貧瘠、適應(yīng)性廣、用途廣泛,因此桉樹成為我國南方包括云南在內(nèi)普遍使用的一種造林樹種。已成為我國南方速生豐產(chǎn)林的戰(zhàn)略性樹種(鄭明鏡等,2003)。目前需要解決的關(guān)鍵問題是科學(xué)合理地發(fā)展桉樹人工林,實(shí)現(xiàn)桉樹人工林的可持續(xù)發(fā)展。傳統(tǒng)的森林資源調(diào)查費(fèi)時、費(fèi)力。本論文是利用遙感技術(shù),采用遙感傳統(tǒng)分類方法與目前比較流行的決策樹分類方法,通過分析桉樹與其他土地利用類型的光譜、紋理信息等信息,對中巴遙感影像進(jìn)行分類,從而實(shí)現(xiàn)對桉樹資源分布信息的準(zhǔn)確提取,為桉樹引種規(guī)范化和合理化提供技術(shù)支持。隨著航天遙感技術(shù)的快速發(fā)展, 遙感為地球科學(xué)研究提供數(shù)據(jù)的能力越來越強(qiáng), 已經(jīng)成為資源調(diào)查、環(huán)境監(jiān)測的重要技術(shù)手段[12]。植被不但是環(huán)境的重要組成因子,也是反映區(qū)域生態(tài)環(huán)境的最好標(biāo)志之一,同時也是土壤、水文等要素的解譯標(biāo)志[3]。采用傳統(tǒng)的人工調(diào)查法耗時耗力,無法滿足大區(qū)域的準(zhǔn)確植被信息提取的需要,且遙感技術(shù)具有宏觀觀測等特點(diǎn),在大面積調(diào)查時具有較大優(yōu)勢。植被遙感信息提取的目的是在遙感影像上有效確定植被的分布、類型、長勢等信息以及對植被的生物量作出估算等[6]。之后的計算機(jī)自動分類比目視解譯進(jìn)了一步,后面又發(fā)展采用了遙感信息復(fù)合技術(shù)[8]。遙感數(shù)據(jù)與GIS數(shù)據(jù)的復(fù)合,可視為信息復(fù)合的高級形式。如原始波段合成法、植被指數(shù)提取法、NDVI與波段合成法、HIS融合法、分級分類提取法、基于知識庫提取法等[9]。綠色植物體內(nèi)的葉綠素控制著植物在可見光波段區(qū)間的光譜特征。采用光學(xué)遙感手段進(jìn)行植被信息提取的方法已經(jīng)比較成熟[10]。即可以利用地物在不同地形(如高程、坡度、坡向)出現(xiàn)概率的不同建立判別函數(shù)實(shí)現(xiàn)植被的分類。李國清采用光譜信息、植被指數(shù)、紋理特征和地形因子進(jìn)行決策樹分類,%,%,%,%,%[12]。申廣榮等通過統(tǒng)計和小波分析的方法提取了SPOT影像的綠地紋理特征,并將其引入基于光譜分類的最大似然法進(jìn)行綠地信息的提取分類,相對于面向象元的監(jiān)督分類分類結(jié)果,%%, , [14]。研究表明紋理信息分類的精度最高, 植被指數(shù)次之, 光譜信息中的非監(jiān)督分類最低[15]。向娟采用面向?qū)ο蠓诸惙椒ǎ瑢﹁駱湫畔⑻崛∵M(jìn)行研究,結(jié)果表明采用面向?qū)ο蠓诸惙椒ǚ诸惪偩葹?0%,桉樹的生產(chǎn)者精度為83%,分類精度較傳統(tǒng)分類方法大大提高[17]。LENNEY等(1996)對埃及的農(nóng)業(yè)土地進(jìn)行了監(jiān)測,采用1984年和1993年的TM數(shù)據(jù)NDVI特征進(jìn)行,%[18]。ZarcoTejado等(1999)綜合植被調(diào)查、植被光譜信息和陸地衛(wèi)星資料對地面覆蓋物和森林分布進(jìn)行分類,分類精度有所提高[19]。Griffiths和Lee(2000)采用GIS技術(shù)結(jié)合地物的光譜信息,分類精度在80%~85%[18]。Shefali等(2003)利用多時相的NDVI對中南亞地區(qū)的植被進(jìn)行分類,植被指數(shù)的加入使分類結(jié)果較好[20]。自數(shù)字計算機(jī)在上世紀(jì)五、六十年代出現(xiàn)以來,人們利用計算機(jī)模擬人的智能過程不斷得到各種成就,在這一研究過程中不斷加速了數(shù)據(jù)分析技術(shù)“模式識別”的發(fā)展。決策樹學(xué)習(xí)算法在信息提取問題上呈現(xiàn)了非常巨大的優(yōu)勢,因?yàn)樗坏⑺俣瓤臁⒕雀?,而且可以生成可理解的?guī)則?;跊Q策樹的分類決策樹分類能夠按照一定的方式將多種信息(RS和非遙感數(shù)據(jù))有機(jī)地組合來提高分類精度。國內(nèi)申文明等以河北唐山為研究區(qū),利用Landsat ETM+ 影像數(shù)據(jù)和GIS數(shù)據(jù),,得到?jīng)Q策樹分類方法與傳統(tǒng)自動分類相比,%, Kappa [23]。汪金花等以河北省唐山市為研究區(qū),采用CBERS1影像,運(yùn)用決策樹分層處理結(jié)構(gòu)思想, 構(gòu)建了唐山市土地利用分類體系和數(shù)學(xué)模型[24]。袁林山等以江蘇省徐州市為研究區(qū),采用多特征決策樹方法對CBERS02數(shù)據(jù)分類,并與最大似然法和支持向量機(jī)分類方法進(jìn)行比較,結(jié)果表明,多特征決策樹分類方法在土地利用/覆蓋分類具有較好的分類效果[26]。高玉蓉利用SPOT5影像,引入植被指數(shù)、紋理、高程數(shù)據(jù)和坡度特征數(shù)據(jù)進(jìn)行信息提取,研究表明,其分類相對于相對監(jiān)督分類能明顯提高分類精度[28]。John Durkin(2005)利用決策樹對衛(wèi)星圖像進(jìn)行分析以估計落葉林和針葉林的基部面積值。Friedl等(1997)利用TM影像,通過單因子決策樹、多因子決策樹、混合決策樹與最大似然法和線性分離函數(shù)分類器相比較得出,決策樹的分類精度較高。Yoshikawa Masanobu等(1995)用完全自動構(gòu)造二叉決策樹對遙感數(shù)據(jù)進(jìn)行了土地覆蓋類型分類,并將這種算法與Bayesian分類器進(jìn)行了比較,結(jié)果表明在分類精度和所需要的訓(xùn)練樣本數(shù)量上,該模型都得到了比較滿意的結(jié)果。為彌補(bǔ)上述不足,本文基于決策樹分類技術(shù),嘗試選擇不同的特征組合對遙感影像進(jìn)行分類研究,并與傳統(tǒng)的ISODATA法和最大似然分類法進(jìn)行比較,找到最佳決策樹分類方法,實(shí)現(xiàn)對桉樹分布信息的準(zhǔn)確提取。最后通過與傳統(tǒng)分類方法非監(jiān)督分類ISODATA法和監(jiān)督分類最大似然法在實(shí)驗(yàn)區(qū)的分類結(jié)果對比評價,說明利用決策樹分類方法相對于傳統(tǒng)分類方法的優(yōu)勢所在。利用中巴衛(wèi)星遙感影像,采用基于知識的決策樹分類方法,利用已構(gòu)建的分類特征,對研究區(qū)主要地類進(jìn)行分類識別,研究了一種最佳桉樹分布信息識別方法。并介紹了本文的研究內(nèi)容和技術(shù)路線。遙感圖像計算機(jī)分類技術(shù)本章主要介紹了遙感圖像的計算機(jī)分類技術(shù),論述了非監(jiān)督分類中的ISODATA法和監(jiān)督分類中的最大似然法兩種最常用傳統(tǒng)分類方法,以及目前非傳統(tǒng)分類中比較流行的人工神經(jīng)網(wǎng)絡(luò)法、支持向量機(jī)法和本次試驗(yàn)研究主要采用的決策樹分類方法。并確定了土地利用/覆蓋分類類別,針對研究區(qū)進(jìn)行了各類別的典型樣本選擇,計算各對象的光譜、植被指數(shù)、主成分變換、紋理信息等特征,并對這些特征進(jìn)行分析。最后,用傳統(tǒng)的非監(jiān)督分類(ISODATA法)和監(jiān)督分類(最大似然法)進(jìn)行了研究區(qū)桉樹分布信息提取試驗(yàn),并將其分類結(jié)果和決策樹分類結(jié)果進(jìn)行精度評價和對比。遙感(Remote sensing)是在不直接接觸研究對象的情況下,通過某種傳感器裝置,測量、分析并判定目標(biāo)性質(zhì)的一門科學(xué)和技術(shù)[2932]。遙感技術(shù)具有覆蓋面廣, 成像迅速而且具有周期成像能力, 并且具有多波段、多時相、多應(yīng)用目標(biāo)以及多學(xué)科綜合的特點(diǎn)[22]。遙感圖像分類過程中可以利用計算機(jī)技術(shù),通過數(shù)字處理的方法來增強(qiáng)和提取遙感圖像中的專題信息,從而提高分類精度。利用遙感數(shù)據(jù)的統(tǒng)計值特征與訓(xùn)練樣本數(shù)據(jù)之間的統(tǒng)計關(guān)系來實(shí)現(xiàn)地物分類。隨著遙感圖像解譯和分析的深入研究以及地物類型分布方式的復(fù)雜性,統(tǒng)計模式識別方法逐漸顯現(xiàn)了本身的一些不足之處,因?yàn)橹豢紤]單一分類規(guī)則對影像進(jìn)行分類,而不考慮其他因素,如空間位置、色調(diào)特征等構(gòu)成影像的多種因素,最終影響了傳統(tǒng)分類方法的精度,造成傳統(tǒng)分類方法不足,加上衛(wèi)星遙感光譜數(shù)據(jù)由于空間分辨率比較低(TM影像30米、SPOT5影像10米) ,存在綜合光譜信息如混合像元,致使計算機(jī)分類面臨著諸多模糊對象導(dǎo)致分類出現(xiàn)較多錯分、漏分,使得分類精度達(dá)不到要求。尤其是近年來由于模式識別技術(shù)特別是人工智能的發(fā)展,人們發(fā)展了許多新方法和新技術(shù)來改善分類效果或提高分類精度。本論文主要介紹比較典型人工神經(jīng)網(wǎng)絡(luò)法、支持向量機(jī)法和決策樹分類法。ISODATA法是迭代式自組織數(shù)據(jù)分技術(shù)算法(Iterative SelfOrganizing Data Analysis Techniques Algorithm)的縮寫,簡稱迭代法,是一種重復(fù)自組織數(shù)據(jù)分析技術(shù),首先計算數(shù)據(jù)空間中均勻分布的類均值,然后用最小距離技術(shù)將剩余象元進(jìn)行迭代聚合,每次迭代都重新計算均值,且根據(jù)所得的新均值,對象元進(jìn)行再分類[34]。ISODATA法或迭代法聚類的實(shí)質(zhì)是先給出一個不的初始分類,然后用某種原則反復(fù)修改和調(diào)整分類,以逐步逼近一個正確的分類。并計算各類中央本的距離函數(shù)等指標(biāo)。(3)進(jìn)行迭代運(yùn)算,重新計算各項(xiàng)指標(biāo),判別聚類結(jié)果是否符合要求。ISODATA法作為非監(jiān)督分類優(yōu)勢在于不需要事先對所要分類的區(qū)域有廣泛的了解認(rèn)識,得到的類別只是按照自然光譜獲得,但是如果要想得到具體的分類就需要人工操作將每個類別劃分到相應(yīng)的目標(biāo)類中,這個過程往往需要對研究區(qū)有一些背景資料和認(rèn)識。最大似然分類方法是根據(jù)有關(guān)概率判決函數(shù)的貝葉斯準(zhǔn)則對遙感圖像進(jìn)行的識別分類。最大似然法假設(shè)遙感圖像的每個波段數(shù)據(jù)都為正態(tài)分布。最大似然分類法在多類別分類時,常采用統(tǒng)計學(xué)方法建立起一個判別函數(shù)集。這時的歸屬概率是指對于待分像元x,它從屬于分類類別k的(后驗(yàn))概率,取最大概率對應(yīng)的類為分類結(jié)果。概率p(wi |x)給出了再光譜空間中點(diǎn)x的像元屬于類別wi的概率。這是貝葉斯分類的一個特例。條件概率p(wi |x)和p(x | wi)可以用貝葉斯定律表達(dá):p(wi |x)= p(x | wi)p(wi)/ p(x) (21)式中:p(x | wi)x在類別wi出現(xiàn)的概率;p(wi) 類別wi在整個圖像中出現(xiàn)的概率,并且有p(x)=i=1M p(x |wi)p(wi) (22)p(wi)為先驗(yàn)概率,p(x | wi)為后驗(yàn)概率。在p(x |wi)服從多元正態(tài)分布的假設(shè)下,判別函數(shù)可改寫成gi (x)= lnP(Wi)-ln|Σi |-[ (x-Mi) T (Σi) 1 ( x-Mi)] (24)式中:Mi為類別中wi中像元的均值;Σi 為類別wi中像元的協(xié)方差矩陣;|Σi |表示矩陣Σi的范數(shù);Mi和Σi可以從訓(xùn)練數(shù)據(jù)中獲得。 傳統(tǒng)分類方法的不足傳統(tǒng)方法中的ISODATA法雖可自迭代由少到多地確定類數(shù),但參數(shù)確定困難,一些距離參數(shù)要隨維數(shù)的變化作相應(yīng)的調(diào)整[3941]。然而,在很多實(shí)際的遙感圖像分類問題中取得先驗(yàn)知識很困難,這使得最大似然法取得的效果不理想。(如地面實(shí)測數(shù)據(jù))在很多情況下不具備統(tǒng)計意義。監(jiān)督分類中最大似然分類方法在中低空間分辨率遙感數(shù)據(jù)分類中被認(rèn)為是最佳方法。 計算機(jī)非傳統(tǒng)分類方法傳統(tǒng)的遙感圖像計算機(jī)分類方法是根據(jù)遙感數(shù)據(jù)的統(tǒng)計特征與訓(xùn)練樣本數(shù)據(jù)之間的統(tǒng)計關(guān)系來進(jìn)行地物分類,其分類結(jié)果精度差強(qiáng)人意。近幾年,很多新的研究方法已經(jīng)應(yīng)用在了遙感圖像分類上,比如有人工神經(jīng)網(wǎng)絡(luò)法(ANN)、決策樹分類法以及支持向量機(jī)(SVM)等。人工神經(jīng)網(wǎng)絡(luò)分類方法在分類時綜合考慮了地物的光學(xué)特性、空間特性和時相特性[4243]。能“自然地”實(shí)現(xiàn)各種非線性映射和求解各種分界面十分復(fù)雜和高度非線性的分類和模式識別問題[46]。近年來,不同學(xué)者提出或應(yīng)用BP網(wǎng)絡(luò)、三維Hopfield網(wǎng)絡(luò)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)等對遙感圖像進(jìn)行監(jiān)督分類[4748]。在遙感數(shù)字圖像分類中得到越來越多的重視,并廣泛應(yīng)用于分類研究中。一個基本的神經(jīng)網(wǎng)可分為三層:輸入層、中間層和輸出層。輸入模型就是用于分類的特征數(shù)據(jù)。其他特征數(shù)據(jù),如像元的空間鄰域數(shù)據(jù)或多時相光譜向量數(shù)據(jù)也可以用做輸入。每一層都包括許多節(jié)點(diǎn)。在每一個處理節(jié)點(diǎn)都進(jìn)行求和以及變換運(yùn)算。它建立在統(tǒng)計學(xué)習(xí)理論的VC維和結(jié)構(gòu)風(fēng)險最小化原理基礎(chǔ)上,通過適當(dāng)?shù)剡x擇函數(shù)子集,根據(jù)有限樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中,使學(xué)習(xí)機(jī)的實(shí)際風(fēng)險達(dá)到最小。引入核函數(shù)使解平面從線性擴(kuò)展到非線性。標(biāo)準(zhǔn)的支持向量機(jī)算法是有監(jiān)督的學(xué)習(xí)方法,根據(jù)最優(yōu)分類面情況可分為兩種:線性類別(可分和不可分)和非線性類別。如果這兩類樣本(訓(xùn)練集)是線性可分的,那么機(jī)器學(xué)習(xí)的結(jié)果是一個超平面(二維情況下是直線)或稱為判別函數(shù),該超平面將訓(xùn)練樣本分為正負(fù)兩類。分類間隔是指兩類中離分類超平面最近的樣本且平行于分類超平面的兩個超平面間的距離,或者說是從分類超平面到兩類樣本中最近樣本的距離的和,正是這些樣本確定了最優(yōu)分類超平面,它們就是所謂的支持向量(Support Vectors,SV)。決策樹算法是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí)算法,它從一組無次序、無規(guī)則的事例中推理出決策樹表示的分類規(guī)則[4950]。決策樹由一個根節(jié)點(diǎn)(Root nodes)、一系列內(nèi)部節(jié)點(diǎn)(Intenral nodes)(分支)及終節(jié)點(diǎn)(Terminal nodes)(葉)組成,類似于流程圖的樹狀結(jié)構(gòu)(圖22決策樹示意圖)。其中每個內(nèi)部節(jié)點(diǎn)都包含一個父節(jié)點(diǎn),一個或者幾個子節(jié)點(diǎn)。決策樹內(nèi)部節(jié)點(diǎn)對輸入數(shù)據(jù)的屬性特征進(jìn)行相應(yīng)的判斷,每個分支對判斷后的結(jié)果進(jìn)行相應(yīng)的輸出。使用決策樹進(jìn)行事例決策的過程,就是通過對事例的屬性進(jìn)行一系列的由數(shù)根節(jié)點(diǎn)向下經(jīng)內(nèi)部節(jié)點(diǎn)逐步判斷,直至葉節(jié)點(diǎn)產(chǎn)生最終決策結(jié)果[52]。 決策樹分類的算法原理就是以選定的樣本數(shù)據(jù)為對象逐級找到分類樹的結(jié)點(diǎn),并且在每個結(jié)點(diǎn)上記錄所選的空間數(shù)據(jù)圖層的編號以及相應(yīng)的判別函數(shù)參數(shù),從而有可能反過來從“樹根”到“葉”按照生成的判別規(guī)則,逐級地在每個結(jié)點(diǎn)上對樣本數(shù)據(jù)以外的待分類數(shù)據(jù)進(jìn)行分類[53]。圖 22 決策樹示意圖決策樹分類樹模型早期有CART和CHIAD兩種算法,1997年Loh和Shih對CHIAD算法加以改進(jìn),提出了一種新的二叉樹算法QUEST(Quick,Unbiased,Efficient Statistical Tree的縮寫),該算法不但克服了CHIAD算法的某些缺點(diǎn),在變量選擇上基本無偏,而且將變量選擇和分叉點(diǎn)選擇分開進(jìn)行,可以適用于任