freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計-基于聚類分析的圖像分割的研究和應(yīng)用-在線瀏覽

2025-02-08 03:43本頁面
  

【正文】 分困難的問題 ,是計算機視覺技術(shù)中首要的關(guān)鍵步驟 。 圖象分割是指在一幅彩色 圖像 中分離出主要的色彩一致的區(qū)域 , 隨著技術(shù)的進步 ,圖像 使用的越來越多 ,對 圖像 的分割也越來越引起人們的重視 。 國內(nèi)外研究動態(tài) 1989 年 8 月,在第 11 屆國際人工智能聯(lián)合會議的專題研討會上,首次提出“在數(shù)據(jù)庫中的知識發(fā)現(xiàn)” (KDD: Knowledge Discovery in Database)技術(shù), 199 199 1994 年又相繼舉行了 KDD專題討論會。由于數(shù)據(jù)庫中的數(shù)據(jù)被形象地比喻為礦床,因此,數(shù)據(jù)挖掘一詞很快流傳開來。 KDD 的研究吸引了大量的各個領(lǐng)域的專 家和研究機構(gòu)從事該領(lǐng)域的研究。 我國的數(shù)據(jù)挖掘研究開始于 90 年代中期,到 90年代中后期,初步形成了知識發(fā)現(xiàn)和 2 數(shù)據(jù)挖掘的基本框架。但是基本上還是以學(xué)術(shù)研究為主,實際應(yīng)用上處于起步階段。與國外相比,國內(nèi)對 DMKD 的研究稍晚,沒有形成整體力量。北京系統(tǒng)工程研究所對模糊方法在知識發(fā)現(xiàn)中的應(yīng)用進行了較深入的研究,北京大學(xué)也在開展對數(shù)據(jù)立方體代數(shù)的研究 ; 華中理工大學(xué)、復(fù)旦大學(xué)、浙江大學(xué)、中國科技大學(xué)、中科院數(shù)學(xué)研究所、吉林大學(xué)等單位開展了對關(guān)聯(lián)規(guī)則開采算法的優(yōu)化和改造;南京大學(xué)、四川聯(lián)合大學(xué)和上海交通大學(xué)等單位探討、研究了非結(jié)構(gòu)化數(shù)據(jù)的知識 發(fā)現(xiàn)以及 Web 數(shù)據(jù)挖掘 ;我校數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課題組在數(shù)據(jù)倉庫與數(shù)據(jù)挖掘相結(jié)合方面的研究取得了較大的進展,目前正積極推進研究成果在金融、統(tǒng)計、商業(yè)和制造業(yè)領(lǐng)域的應(yīng)用。 研究的主要內(nèi)容和論文結(jié)構(gòu) 本文主要內(nèi)容就是利用聚類分析中的 KMEANS 算法在 RGB 和 HSV 顏色空間下實現(xiàn)圖像分割系統(tǒng),并 應(yīng)用于 遙感圖像, 其 具體有下面幾方面內(nèi)容: 了解數(shù)據(jù)挖掘的概念,熟悉聚類分析的思想算法,特別掌握 kmeans 算法的思想及句體實現(xiàn)。 研究 RGB 和 HSV 顏色空間的轉(zhuǎn)換關(guān)系, 實現(xiàn) RGB 空間到 HSV 空間轉(zhuǎn)換,從而實現(xiàn) HSV空間下的圖像分割 。 按照本文的主要內(nèi)容,本文的論文結(jié)構(gòu)如下: 第一章 : 前言 。 第二章 :數(shù)據(jù)挖掘技術(shù)中的 聚類 分析 技術(shù)。 3 第三章 :圖像分割系統(tǒng)的實現(xiàn)。 第四章 :遙感圖像在圖像分割系統(tǒng)中的應(yīng)用。 第五章 :總結(jié)。它是一種新的商業(yè)信息處理技術(shù),其主要特點是 對商業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵數(shù)據(jù)。從這個角度數(shù)據(jù)挖掘也可以描述為:按企業(yè)制定的業(yè)務(wù)目標,對大量的企業(yè)數(shù)據(jù)進行探索和分析,揭示隱藏的、未知的或驗證已知的規(guī)律性,并進一步將其模型化的先進有效的方法。根據(jù)挖掘任務(wù),可分為分類或預(yù)測模型發(fā)現(xiàn)、數(shù)據(jù)總結(jié)、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、序列模型發(fā)現(xiàn)、依賴關(guān)系或以來模型發(fā)現(xiàn)、異常和趨勢發(fā)現(xiàn) 等。 ⑴關(guān)聯(lián)分析 (association analysis) 關(guān)聯(lián)規(guī)則挖掘是由 Rakesh Apwal 等人首先提出的。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的、可被發(fā)現(xiàn)的知識。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。 ⑵聚類分析 (clustering) 聚類是把數(shù)據(jù)按照相似性歸納成若 干類別,同一類中的數(shù)據(jù)彼此相似, 不 同類中的數(shù)據(jù)相異。 ⑶分類 (classification) 5 分類就是找出一個類別的概念描述,它代表了這類數(shù)據(jù)的整體信息,即該類的內(nèi)涵描述,并用這種描述來構(gòu)造模型,一般用規(guī)則或決策樹模式表示。分類可被用于規(guī)則描述和預(yù)測。預(yù)測關(guān)心 的是精度和不確定性,通常用預(yù)測方差來度量。與回歸一樣,它也是用己知的數(shù)據(jù)預(yù)測未來的值,但這些數(shù)據(jù)的區(qū)別是變量所處時間的不同。偏差檢驗的基本方法就是尋找觀察結(jié)果與參照之間的差別。數(shù)據(jù)挖掘的基本過程和主要步驟如 圖 : 圖 過程中各步驟的大體內(nèi)容如下: 1.確定業(yè)務(wù)對象,清晰地定義出業(yè)務(wù)問題。 2.?dāng)?shù)據(jù)準備。搜索所有與業(yè)務(wù)對象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù)。研究數(shù)據(jù)的質(zhì)量,進行數(shù)據(jù)的集成、變換、歸約、壓縮等.為進一步的分析作準備,并確定將要進行的挖掘操作的類型。將數(shù)據(jù)轉(zhuǎn)換成一個分析模型,這個分析模型是針對挖掘算法建立的這是數(shù)據(jù)挖掘成功的關(guān)鍵。對所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進行挖掘。 4.結(jié)果分析。其使用的分析方法一般應(yīng)視挖掘操作而定,通常會用到可視化技術(shù)。將分析所得到的知識集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。典型的神經(jīng)網(wǎng)絡(luò)模型主要分 3 大類:以感知機、 BP 反向傳播模型、函數(shù)型網(wǎng)絡(luò)為代表的,用于分類、預(yù)測和模式識別的前饋式神經(jīng)網(wǎng)絡(luò)模型;以 Hopfield 的離散模型和連續(xù)模型為代表的,分別用于聯(lián)想記憶和優(yōu)化計算的反饋式神經(jīng)網(wǎng)絡(luò)模型;以 ART 模型、 Koholon 模型為代表的,用于聚類的自組織映射方法。本 文用到了 Kohonen 自組織神經(jīng)網(wǎng)絡(luò),具體將在后面講述。遺傳算法具有的隱含并行性、易于和其它模型結(jié)合等性質(zhì)使得它在數(shù)據(jù)挖掘中被加以應(yīng)用。它的主要優(yōu)點是描述簡單,分類速度快,特別適合大規(guī)模的數(shù)據(jù)處理。粗集方法有幾個優(yōu)點:不需要給出額外信息;簡化輸 入信息的表達空間;算法簡單,易于操作。 ⑸覆蓋正例排斥反例方法 它是利用覆蓋所有正例、排斥所有反例的思想來尋找規(guī)則。與字段取值構(gòu)成的選擇子相容則舍去,相反則保留。 ⑹統(tǒng)計分析方法 在數(shù)據(jù)庫字段項之間存在兩種關(guān)系:函數(shù)關(guān)系 (能用函數(shù)公式表示的確定性關(guān)系 )和相關(guān)關(guān)系 (不能用函數(shù)公式表示,但仍是相關(guān)確定性關(guān)系 ),對它們的分析可采用統(tǒng)計學(xué)方法,即利用統(tǒng)計學(xué)原理對數(shù) 據(jù)庫中的信息進行分析。 ⑺模糊集方法 即利用模糊集合理論對實際問題進行模糊評判、模糊決策、模糊模式識別和模糊聚類分析。有人在傳統(tǒng)模糊理論和概率統(tǒng)計的基礎(chǔ)上,提出了定性定量不確定性轉(zhuǎn)換模型云模型,并形成 了云理論。 聚類是數(shù)據(jù)挖掘、模式識別等研究方向的重要研究內(nèi)容之一,在識別數(shù)據(jù)的內(nèi)在結(jié)構(gòu)方面具有極其重要的作用,聚類主要應(yīng)用于模式識別中的語音識別、字符識別等,機器學(xué)習(xí)中的聚類算法應(yīng)用于圖像分割和機器視覺,圖像處理中聚類用于數(shù)據(jù)壓縮和信息檢索,聚類的另一個主要應(yīng)用是數(shù)據(jù)挖掘 (多關(guān)系數(shù)據(jù)挖掘 )、時空數(shù)據(jù)庫應(yīng)用 (GIS 等 )、序列和異類數(shù)據(jù)分析等,此外,聚類還應(yīng)用于統(tǒng)計科學(xué),值得一提的是,聚類分析對生物學(xué) 、心理學(xué)、考古學(xué)、地質(zhì)學(xué)、地理學(xué)以及市場營銷等研究也都有重要作用。 聚類過程: 1) 數(shù)據(jù)準備:包括特征標準化和降 維, 2) 特征選擇:從最初的特征中選擇最有效的特征,并將其存儲于向量中, 3) 特征提取:通過對所選擇的特征進行轉(zhuǎn)換形成新的突出特征, 4) 聚類 (或分組 ):首先選擇合適特征類型的某種距離函數(shù) (或構(gòu)造新的距離函數(shù) )進行接近程度的度量; 5) 聚類結(jié)果評估:是指對聚類結(jié)果進行評估,評估主要有 3種:外部有效性評估、內(nèi)部有效性評估和相關(guān) 性測試評估。 聚類算法有多種分類方法, 聚類算法可以分為以下幾大類:分割聚類方法 (Partitioning Method)、層次聚類方法 (Hierarchical Method)、基于密度 (DensityBased)的聚類方法、基于網(wǎng)格 (GridBased)的聚類方法、基于模型 (ModelBased)的聚類方法等等。為了達到全局最優(yōu),基于劃分的聚類會要求窮舉所有可能的劃分。 9 該類方法的典型代表是 KMeans 方法,其次有 KMedoids 方法, PAM 方法, CLARA方法, CLARANS 方法等。根據(jù)層次分解是自底向上還是自頂向下形成,層次的聚類方法可以進一步分為凝聚的 (Agglomeration)和分裂的 (Divisive)層次聚類。凝聚的層次聚類:這種自底向上的策略首先將每個對象作為一個簇,然后合并這些原子簇為越來越大的簇,直到所有的對象都在一個簇中,或者某個終結(jié)條件被滿足。 例如, DIANA 方法的處理過程中,所有的對象初始都放在一個簇中。簇的分裂過程反復(fù)進行,直到最終每個新的簇只包含一個對象。最小距離: ||m i n),( 39。,m in ppCCd CjpCpji i ?? ?? 39。平均值的距離: ||),( jijim ean mmCCd ?? [3]基于密度的方法 基于密度的聚類方法是為了發(fā)現(xiàn)任意形狀的聚類結(jié)果而提出的。 DBSCAN(Density Based Spatial Clustering of Applications with Noise)就是一個基于密度的聚類算法。它定義簇為密度相連的點的最大集合。 10 密度可達是直接密度可達的傳遞閉包,這種關(guān)系是非對 稱的。然而,密度相連性是一個對稱的關(guān)系。不包含在任何簇中的對象被認為是“噪聲”。如果一個點 p 的ε 鄰域包含多于 MinPts 個點,則創(chuàng)建一個以 p 作為核心對象的新簇。這個過程可能涉及一些密度可達簇的合并。 如果采用空間索引 ,DBSCAN的計算復(fù)雜度是 O(nlogn),這里 n是數(shù)據(jù)庫中對象的數(shù)目。 盡管 DBSCAN 能根據(jù)給定輸入?yún)?shù)ε和 MinPts 對對象進行聚類,但它仍將選擇能產(chǎn)生可接受的聚類結(jié)果的參數(shù)值的責(zé)任留給了用戶。對于實際中的高維數(shù)據(jù)集合而言,參數(shù)的設(shè)置通常是依靠經(jīng)驗,難以確定。而且,實際中的高維數(shù)據(jù)集合經(jīng)常分布不均,全局密度參數(shù)不能刻畫其內(nèi)在的聚類結(jié)構(gòu)。它將空間量化為有限數(shù)目的單元,這些單元形成了網(wǎng)格結(jié)構(gòu),所有的聚類操作都在網(wǎng)格上進行。 基于網(wǎng)格方法的有代表性的例子包括: STING,它利用存儲在網(wǎng)格單元中的統(tǒng)計信息; 11 WaveCIuster,它用一種小波轉(zhuǎn)換方法來聚類對象; CLIQUE,它是在高維數(shù)據(jù)空間中基于網(wǎng)格和密度的聚類方法。針對不同級別的分辨率,通常存在多個級別的矩形單元,這些單元形成了一個層次結(jié)構(gòu):高層的每個單元被劃分為多個低一層的單元。高層單元的統(tǒng)計參數(shù)可以很容易地從低層單元的計算得到。首先,在層次結(jié)構(gòu)中選定一層作為查詢處理的開始點。對當(dāng)前層次的每個單元,我們計算置信度區(qū)間(或者估算其概率范圍),用以反映該單元與給定查詢的關(guān)聯(lián)程度。低一層的處理就只檢查剩余的相關(guān)單元。此時,如果查詢要求被滿足,那么返回相關(guān)單元的區(qū)域。 由于 STING 采用了一個多分辨率的方法來進行 聚類分析, STING 聚類的質(zhì)量取決于網(wǎng)格結(jié)構(gòu)的最低層的粒度。而且, STING 在構(gòu)建一個父親單元時沒有考慮孩子單元和其相鄰單元之間的關(guān)系。盡管該技術(shù)有快速的處理速度,但可能降低簇的質(zhì)量和精確性。 WaveC1uster 是一個基于網(wǎng)格和密度的算法。在實驗分析中, WaveCluster在效率和聚類質(zhì)量上優(yōu)于 BIRCH, CLARANS和 DBSCAN。 [5] 基于模型的聚類方法 基于模型的聚類方法試圖優(yōu)化給定的數(shù)據(jù)和某些數(shù)學(xué)模型之間的適應(yīng)性?;谀P偷姆椒ㄖ饕袃深悾航y(tǒng)計學(xué)方法和神經(jīng)網(wǎng)絡(luò)方法。 12 統(tǒng)計學(xué)方法 概念聚類是機器學(xué)習(xí)中的一種聚類方法,給出一組未標記的對象,它產(chǎn)生對象的一個分類模式。因此,概念聚類是一個兩步的過程:首先進行聚類,然后給出特征描述。 概念聚類的絕 大多數(shù)方法采用了統(tǒng)計學(xué)的途徑,在決定概念或聚類時使用概率度量。 COBWEB 是一種流行的簡單增量概念聚類算法。 COBWEB 以一個分類樹的形式創(chuàng)建層次聚類。 COBWEB 的工作過程: COBWEB 將對象增量地加入到分類樹中。這個判定基于將對象臨時置于每個節(jié)點,并計算結(jié)果劃分的分類效用。 如果對象不屬于樹中現(xiàn)有的任何概念, COBWEB 就計算為給定對象創(chuàng)建一個新的節(jié)點所產(chǎn)生的分類效用。根據(jù)產(chǎn)生最高分類效用的劃分,對象被置于一個已存在的類,或者為它創(chuàng)建一個新類。它不需要用戶提供這樣的輸入?yún)?shù)。為了降低它對輸入順序的敏感度, COBWEB 有兩個額外的操作符:合并 (Merging)和分裂 (Splitting)。此外, COBWEB 考慮在現(xiàn)有的分類中分裂最佳的候選節(jié)點的孩子。合并和分裂操作符使得 COBWEB 執(zhí)行一種雙向的搜索,例如,一個合并可以撤消一個以前的分裂。首先,它基于這樣一個假設(shè):在每個屬性上的概率分布是彼此獨立的。此外,聚類的概率分布表示使得更新和存儲聚類相當(dāng)昂貴。而且,分類樹對于 偏斜的輸入數(shù)據(jù)不是高度平衡的,它可能導(dǎo)致時間和空間復(fù)雜性的劇烈變化。它在每個節(jié)點中為每個屬性存儲一個連續(xù)的正態(tài)分布(即平均值和標準偏差),采用一個修正的分類效用度 13 量。但是,它與COBWEB 存在類似的問題,因此不適用于聚類大型數(shù)據(jù)庫的數(shù)據(jù)。將概念聚類方法應(yīng)用到數(shù)據(jù)挖掘中需要進一步的研究 。標本作為聚類的“原型”,不一定對應(yīng)一個特定的數(shù)據(jù)實例或?qū)ο?。被分配給一個簇的對象的屬性可以根據(jù)該簇的標本的屬性來預(yù)測。第一個是競爭學(xué)習(xí) (Competitive Learning),第二個是自組織特征映射(本文還將對其進行更為詳細的討論),這兩種方法都涉及有競爭的神經(jīng)單元。在一個簇中獲勝的單元成為活躍的,而其他是不活躍的
點擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1