freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

改進的模糊c均值法在負荷特性統(tǒng)計數(shù)據(jù)聚類中的應用畢業(yè)論文(已改無錯字)

2022-07-25 15:27:55 本頁面
  

【正文】 挑選出Pareto最優(yōu)模式分類規(guī)則集用于電力負荷模式分類。并在仿真試驗中,將次分類系統(tǒng)用于電力負荷預測,結果表明此分類系統(tǒng)具有較好的分類性能,可為電力負荷預測提供更為充分有效地歷史數(shù)據(jù),從而改善其負荷預測性能。 模糊C均值聚類算法 硬C均值聚類算法(HCM)硬C均值聚類(HCM)算法是經(jīng)典的硬聚類算法之一,能夠?qū)Τ食瑱E球狀的數(shù)值聚類算法進行分類。算法把n個向量分為c個組,并求每組的聚類中心,使得非相似性(或距離)指標的價值函數(shù)(或目標函數(shù))達到最小。當選擇歐氏距離為組j中向量與相應聚類中心間的非相似性指標時,價值函數(shù)可定義為: ()這里是組i內(nèi)的價值函數(shù)。這樣的值依賴于的幾何特性和的位置。一般來說,可用一個通用距離函數(shù)代替組I中的向量,則相應的總價值函數(shù)可表示為: ()為簡單起見,這里用歐氏距離作為向量的非相似性指標,且總的價值函數(shù)表示為()式。劃分過的組一般用一個的二維隸屬矩陣U來定義。如果第j個數(shù)據(jù)點屬于組i,則U中的元素為1;否則,該元素取0。一旦確定聚類中心,可導出如下使式()最?。? ()重申一點,如果是的最近的聚類中心,那么屬于組i。由于一個給定數(shù)據(jù)只能屬于一個組,所以隸屬矩陣U具有如下性質(zhì): ()且 ()另一方面,如果固定則使()式最小的最佳聚類中心就是組I中所有向量的均值: ()這里是的規(guī)?;颉楸阌谂J竭\行,這里給出數(shù)據(jù)集的K均值算法:該算法重復使用下列步驟,確定聚類中心和隸屬矩陣U:步驟1:初始化聚類中心。典型的做法是從所有數(shù)據(jù)點中任取c個點。步驟2:用式()確定隸屬矩陣U。步驟3:根據(jù)式()計算價值函數(shù)。如果它小于某個確定的閥值,或它相對上次價值函數(shù)質(zhì)的改變量小于某個閥值,則算法停止。步驟4:根據(jù)式()修正聚類中心。返回步驟2。該算法本身是迭代的,且不能確保它收斂于最優(yōu)解。K均值算法的性能依賴于聚類中心的初始位置。所以,為了使它可取,要么用一些前端方法求好的初始聚類中心;要么每次用不同的初始聚類中心,將該算法運行多次。此外,上述算法僅僅是一種具有代表性的方法:我們還可以先初始化一個任意的隸屬矩陣,然后再執(zhí)行迭代過程。K均值算法也可以在線方式運行。這時,通過時間平均,導出相應的聚類中心和相應的組。即對于給定的數(shù)據(jù)點x,該算法求最近的聚類中心,并用下面公式進行修正: ()這種在線公式本質(zhì)上嵌入了許多非監(jiān)督學習神經(jīng)元網(wǎng)絡的學習法則。 模糊C均值聚類模糊C均值聚類(FCM),即眾所周知的模糊ISODATA,是用隸屬度確定每個數(shù)據(jù)點屬于某個聚類的程度的一種聚類算法。1973年,Bezdek提出了該算法,作為早期硬C均值聚類(HCM)方法的一種改進。FCM把n個向量分為c個模糊組,并求每組的聚類中心,使得非相似性指標的價值函數(shù)達到最小。FCM與HCM的主要區(qū)別在于FCM用模糊劃分,使得每個給定數(shù)據(jù)點用值在0,1間的隸屬度來確定其屬于各個組的程度。與引入模糊劃分相適應,隸屬矩陣U允許有取值在0,1間的元素。不過,加上歸一化規(guī)定,一個數(shù)據(jù)集的隸屬度的和總等于1: ()那么,F(xiàn)CM的價值函數(shù)(或目標函數(shù))就是式()的一般化形式: ()這里介于0,1間;為模糊組I的聚類中心,為第I和聚類中心與第j個數(shù)據(jù)點間的歐氏距離;且是一個加權指數(shù)。構造如下新的目標函數(shù),可求得使()式達到最小值的必要條件: ()這里,j=1到n,是()式的n個約束式的拉格朗日乘子。對所有輸入?yún)⒘壳髮?,使式()達到最小的必要條件為: ()和 ()有上述兩個必要條件,模糊C均值聚類算法是一個簡單的迭代過程。在批處理方式運行時,F(xiàn)CM用下列步驟確定聚類中心和隸屬矩陣U[1]:步驟1:用值在0,1間的隨機數(shù)初始化隸屬矩陣U,使其滿足式()中的約束條件。步驟2:用式()計算c個聚類中心,i=1,...,c。步驟3:根據(jù)式()計算價值函數(shù)。如果它小于某個確定的閥值,或它相對上次價值函數(shù)值的改變量小于某個閥值,則算法停止。步驟4:用()計算新的U矩陣。返回步驟2。上述算法也可以先初始化聚類中心,然后再執(zhí)行迭代過程。由于不能確保FCM收斂于一個最優(yōu)解。算法的性能依賴于初始聚類中心。因此,我們要么另外的快速算法確定初始聚類中心,要么每次用不同的初始聚類中心啟動該算法,多次運行FCM。 程序流程圖程序流程如圖1所示:變電站的負荷構成矩陣標準化判斷是否滿足誤差要求計算聚類中心矩陣計算隸屬度參數(shù)矩陣初始化聚類參數(shù)給定變電站聚類數(shù)C迭代次數(shù)m和誤差e輸入聚類變電站的負荷構成矩陣U N Y輸出隸屬度矩陣和聚類中心矩陣 圖1:基于模糊C均值聚類算法流程圖 改進的各方案比較FCM算法簡單,如模式分布呈現(xiàn)類內(nèi)鏈聚狀,該算法是能達到很好聚類結果,是目前聚類分析中最受歡迎的算法之一,但它有著致命的弱點:一是模糊聚類目標函數(shù)是一個非凸函數(shù),存在大量的局部極值點,初始化不當將導致算法收斂到局部極值點而得不到數(shù)據(jù)集的最優(yōu)模糊劃分;二是大數(shù)據(jù)量時算法嚴重耗時,制約了其實際應用。因此,一個靠近最優(yōu)解的初始化將以少量的迭代步驟(即少量的時間)收斂于全局最優(yōu)解。為了克服這一嚴重不足之處,擬對該算法進行改進,改進的方向是克服其對初值的敏感性,即正確的選取初始聚類中心。初始聚類中心可按以下幾種方法之一選取。下面我們逐一進行討論:(1) 隨機方式確定。 標準FCM算法就是隨機指定初始聚類中心的。正如前面討論的那樣,容易陷入局部極小點。但是,這種方法簡單,對于數(shù)據(jù)普遍適用。(2) 用戶指定。用戶指定的方法增加了先驗知識。用戶憑借對數(shù)據(jù)集的了解,可以在C個類別中各指定一個數(shù)據(jù)作為初始聚類中心。這樣初始聚類中心的指定基本上可以保證目標函數(shù)陷入局部極小點,達到全局最優(yōu)的目的。缺點是對于每個數(shù)據(jù)集,用戶均需做相應的修改,比較麻煩,普遍適用性降低。(3) 憑經(jīng)驗選擇初始類心。憑經(jīng)驗選擇初始類心的方法,情形和(2)很相似。人們可以憑借對數(shù)據(jù)集的先驗知識的掌握來指導初始聚類中心的選擇??梢赃x擇那些分離性較好的,周圍數(shù)據(jù)分布密度比較大地那些點作為初始類心。缺點同(2),對于每個數(shù)據(jù)集,用戶均需做相應的修改,比較麻煩,普通適用性降低。(4) 將模式隨機地分成C類,計算每類中心,以其作為初始類心。在下面的實驗中我們采用了IRIS數(shù)據(jù)集作為測試數(shù)據(jù),對這種FCM的聚類初始化方法進行了討論??梢钥吹竭@種聚類初始化方法基本上避免了數(shù)據(jù)集陷入局部極小點。但是將模式隨機地分成C類,無疑將花費一定的時間。而且如果數(shù)據(jù)集中數(shù)據(jù)個數(shù)N如果比較小,時間的花費尚可以忽略,但是隨著N值的變大,時間的花費將很快地增加。另外,先將數(shù)據(jù)集分成C類,仍然采用的隨機地策略,無法保證從根本上消除陷入局部極小點的可能性。(5) 求以每個特征點為球心、某一正數(shù)為半徑的球形域中特征點個數(shù),這個數(shù)稱為該點的密度。選取密度最大的特征點作為第一個初始類心然后再與大于某個距離d的那些特征點中選取另一個具有最大密度的特征點作為第二個初始類心以下如此進行,選取C個初始聚類中心。此方法從策略上力求C個初始聚類中心相距較遠,并且在選取每個聚類中心時,采用密度的方法使其具有代表性。基本上可以避免目標函數(shù)陷入局部極小點。缺點是計算量較大,比較費時。(6) 用相距最遠的C個特征點作為初始類心。具體地講,就是在模式特征矢量集中以最大距離原則選取新的聚類中心,以最小距離原則進行模式歸類,如此求取C個初始聚類中心。如果數(shù)據(jù)集中有“孤立點”,或者說“噪聲”,聚類效果將下降。因為“孤立點”很容易當選初始聚類中心,這顯然是不合適的。(7) 通過選舉機制產(chǎn)生初始聚類中心。具體做法是首先計算最大最小模式之間的距離d。指定常整數(shù)p。在N個模式中,找到p個相距較遠的模式。再對p個模式計算以本身為球心,以為半徑的球內(nèi)所包含的模式個數(shù)。選舉個數(shù)較多的前C個模式作為初始聚類中心。此方法實現(xiàn)比較簡單。而且保證了候選初始聚類中心,相距較遠。另外以等球內(nèi)模式個數(shù)作為衡量標準,個數(shù)較多的,也就是比較密集區(qū)域內(nèi)的點方能入選初始聚類中心。 最終改進方案的選定通過上述對聚類中心選取方法的比較,以及聯(lián)系負荷統(tǒng)計數(shù)據(jù)聚類的實際,本文選擇用戶自定義的方法選擇初始聚類中心。具體地做法是,先利用系統(tǒng)聚類法對數(shù)據(jù)初始聚類,然后算出每類的平均距離作為模糊C均值法的初始聚類中心,這樣就可成功的避免數(shù)據(jù)中的“孤立點”或是“噪聲”等原因而導致的聚類效果的下降。使模糊C均值法對初始聚類中心的敏感度大大下降,從而增加模糊C均值法的聚類效果。 聚類實例 原始數(shù)據(jù)聚類數(shù)據(jù)取調(diào)查數(shù)據(jù)中的48個220KV變電站綜合負荷靜態(tài)特性數(shù)據(jù)進行聚類,矩陣U變電站的負荷構成參數(shù),其中行向量為各變電站負荷特征參數(shù),列向量為各行業(yè)在每個變電站的組成比例,待分對象為選取的湖南電網(wǎng)48個變電站負荷構成參數(shù),列對象參數(shù):為各變電站的重工業(yè)、輕工業(yè)、采掘業(yè)、農(nóng)業(yè)、第三工業(yè)、市政生活6大用電行業(yè)的負荷容量百分比(見附錄A)。 未改進的模糊C均值法在實例中的應用利用未改進的模糊C均值法所得的聚類結果如表31所示:(其中表示第i類,表示第j個變電站)下同。表31 未改進模糊C均值法聚類結果類別所含變電站成員其聚類中心為: 改進的模糊C均值法在實例中的應用由于本次設計采用的是MATLAB軟件編程實現(xiàn),而該軟件的工具箱中帶有關于模糊C均值法的工具函數(shù)。在本設計中對該工具函數(shù)進行改動,即去掉其自動生成隸屬度的部分,首先輸入由系統(tǒng)聚類法獲得的初始聚類中心形成的初始隸屬度矩陣。然后利用模糊C均值法工具函數(shù)實現(xiàn)聚類。1。 利用系統(tǒng)聚類法所得結果的冰柱圖為分成七類的結果為:表32 系統(tǒng)聚類法聚類結果類別 所含變電站成員以其每組的平均值為模糊C均值的聚類中心,得到聚類中心為: 2. 利用FCM工具函數(shù)實現(xiàn)將由該聚類中心生成的隸屬度矩陣(見附錄B)輸入改動后的函數(shù)fmc3中(見附錄C)得出改進后的模糊C均值法聚類結果如表33所示:表33 改進的模糊C均值法聚類結果類別 所含變電站成員其聚類中心為: 兩種算法的比較我們知道對于聚類結果好壞的比較可以依據(jù)他們的類間距離和類內(nèi)距離,一般來講聚類效果越好,那他們的類間距離應該越大,類內(nèi)距離應該越小,因此,我們只列出他們的類內(nèi)距離和類間距離以供比較。(1) 類間距離改進的模糊C均值法類間距離矩陣如下:未改進的模糊C均值法類間距離矩陣如下:取矩陣中的每個元素的平均值作比較,較大者則認為聚類效果比較好,反之亦然。矩陣一平均值=矩陣三平均值=(2) 類內(nèi)距離未改進模糊C均值法類數(shù)第一類第二類第三類第四類第五類第六類第七類平均類內(nèi)距離總的平均類內(nèi)距離為:改進后的模糊C均值法類數(shù)第一類第二類第三類第四類第五類第六類第七類平均類內(nèi)距離總的平均類內(nèi)距離為: 結果分析根據(jù)改進前后的聚類結果的類內(nèi)距離與類間距離比較而言,我們可以發(fā)現(xiàn)改進后的模糊C均值法的類內(nèi)距離有所變小,而類內(nèi)距離有所變大,因而可以說明對于模糊C均值法的改進取得了預期的效果。下面用具體數(shù)據(jù)對兩者的結果比較分析:①由改進的模糊C均值聚類得到的分類結果C可知;類變電站以市政生活用電為主,約占50%,重工業(yè)與輕工業(yè)比例相當,約占15%;類變電站以重工業(yè)與農(nóng)業(yè)為主,且兩者比例相當,約占35%;類變電站以重工業(yè)為主,約占40%,農(nóng)業(yè)與市政生活比例相當,約占15%;類變電站以農(nóng)業(yè)為主,約占50%,重工業(yè)與市政生活比例相當,約占15%;類變電站以重工業(yè)為主,但采掘業(yè)的比例相對較大,所以單獨化為一類;類變電站以市政生活用電、重工業(yè)與三產(chǎn)業(yè)為主,分別為35%,20%,20%;類變電站以重工業(yè)為主,占到55%以上,市政生活用電只占15%左右。上述分類結果與變電站實際負荷構成情況相符,同時與基于C均值聚類得到的聚類中心矩陣比較,聚類結果大體一致。②分析表31和33,未改進模糊C均值的聚類把和分為一類,掩蓋了采掘業(yè)所占比重相對較大地特點,比較粗糙;改進的模糊C均值法聚類把單獨列為一類,是把該類變電站的特殊性體現(xiàn)出來。未改進模糊C均值的聚類把分類到市政生活用電為主的類中,忽視了其重工業(yè)與三產(chǎn)業(yè)的比例也不少的特點,比較片面;改進后C均值法聚類把與歸為一類,很好地體現(xiàn)了該類的
點擊復制文檔內(nèi)容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1