【正文】
r39。*39。)。,39。% line(data(index1,1),data(index1,2),39。% hold on。% [center,U,obj_f] = fcm(data,2)。average39。(4) 模糊聚類計(jì)算結(jié)果中的聚類中心矩陣給我們對(duì)建模數(shù)據(jù)的采樣點(diǎn)的選擇即負(fù)荷測(cè)辨裝置的安裝地點(diǎn)提供了可靠依據(jù),我們可根據(jù)聚類結(jié)果,將每類做成一個(gè)通用的模型,并且推廣到同類的其他變電站中,負(fù)荷特性聚類是綜合測(cè)辨法實(shí)用負(fù)荷建模過程的一個(gè)基礎(chǔ)部分,因此,本文研究具有一定的實(shí)用價(jià)值。本文對(duì)模糊C均值法加以改進(jìn)后再對(duì)該數(shù)據(jù)進(jìn)行聚類,并與未改進(jìn)的模糊C均值法加以比較。負(fù)荷測(cè)辨裝置安裝在每一類的典型變電站中,記錄下實(shí)測(cè)數(shù)據(jù)并為理想安裝測(cè)點(diǎn)的典型變電站建立相應(yīng)的負(fù)荷模型,而對(duì)于同類中未布測(cè)點(diǎn)則可以通過數(shù)學(xué)方法確定該類中其它沒有安裝測(cè)辨裝置的變電站的綜合負(fù)荷模型。安裝負(fù)荷測(cè)辨裝置的變電站的數(shù)量和具體位置可通過聚類結(jié)果和聚類中心矩陣獲得。④聚類結(jié)果驗(yàn)證了改進(jìn)FCM方法應(yīng)用于負(fù)荷特性聚類的可行性和有效性。未改進(jìn)模糊C均值的聚類把分類到市政生活用電為主的類中,忽視了其重工業(yè)與三產(chǎn)業(yè)的比例也不少的特點(diǎn),比較片面;改進(jìn)后C均值法聚類把與歸為一類,很好地體現(xiàn)了該類的市政生活、重工業(yè)、三產(chǎn)業(yè)都占較大比例的特點(diǎn)。矩陣一平均值=矩陣三平均值=(2) 類內(nèi)距離未改進(jìn)模糊C均值法類數(shù)第一類第二類第三類第四類第五類第六類第七類平均類內(nèi)距離總的平均類內(nèi)距離為:改進(jìn)后的模糊C均值法類數(shù)第一類第二類第三類第四類第五類第六類第七類平均類內(nèi)距離總的平均類內(nèi)距離為: 結(jié)果分析根據(jù)改進(jìn)前后的聚類結(jié)果的類內(nèi)距離與類間距離比較而言,我們可以發(fā)現(xiàn)改進(jìn)后的模糊C均值法的類內(nèi)距離有所變小,而類內(nèi)距離有所變大,因而可以說(shuō)明對(duì)于模糊C均值法的改進(jìn)取得了預(yù)期的效果。然后利用模糊C均值法工具函數(shù)實(shí)現(xiàn)聚類。 聚類實(shí)例 原始數(shù)據(jù)聚類數(shù)據(jù)取調(diào)查數(shù)據(jù)中的48個(gè)220KV變電站綜合負(fù)荷靜態(tài)特性數(shù)據(jù)進(jìn)行聚類,矩陣U變電站的負(fù)荷構(gòu)成參數(shù),其中行向量為各變電站負(fù)荷特征參數(shù),列向量為各行業(yè)在每個(gè)變電站的組成比例,待分對(duì)象為選取的湖南電網(wǎng)48個(gè)變電站負(fù)荷構(gòu)成參數(shù),列對(duì)象參數(shù):為各變電站的重工業(yè)、輕工業(yè)、采掘業(yè)、農(nóng)業(yè)、第三工業(yè)、市政生活6大用電行業(yè)的負(fù)荷容量百分比(見附錄A)。另外以等球內(nèi)模式個(gè)數(shù)作為衡量標(biāo)準(zhǔn),個(gè)數(shù)較多的,也就是比較密集區(qū)域內(nèi)的點(diǎn)方能入選初始聚類中心。再對(duì)p個(gè)模式計(jì)算以本身為球心,以為半徑的球內(nèi)所包含的模式個(gè)數(shù)。(7) 通過選舉機(jī)制產(chǎn)生初始聚類中心。(6) 用相距最遠(yuǎn)的C個(gè)特征點(diǎn)作為初始類心。選取密度最大的特征點(diǎn)作為第一個(gè)初始類心然后再與大于某個(gè)距離d的那些特征點(diǎn)中選取另一個(gè)具有最大密度的特征點(diǎn)作為第二個(gè)初始類心以下如此進(jìn)行,選取C個(gè)初始聚類中心。但是將模式隨機(jī)地分成C類,無(wú)疑將花費(fèi)一定的時(shí)間。缺點(diǎn)同(2),對(duì)于每個(gè)數(shù)據(jù)集,用戶均需做相應(yīng)的修改,比較麻煩,普通適用性降低。(3) 憑經(jīng)驗(yàn)選擇初始類心。用戶指定的方法增加了先驗(yàn)知識(shí)。 標(biāo)準(zhǔn)FCM算法就是隨機(jī)指定初始聚類中心的。因此,一個(gè)靠近最優(yōu)解的初始化將以少量的迭代步驟(即少量的時(shí)間)收斂于全局最優(yōu)解。由于不能確保FCM收斂于一個(gè)最優(yōu)解。如果它小于某個(gè)確定的閥值,或它相對(duì)上次價(jià)值函數(shù)值的改變量小于某個(gè)閥值,則算法停止。對(duì)所有輸入?yún)⒘壳髮?dǎo),使式()達(dá)到最小的必要條件為: ()和 ()有上述兩個(gè)必要條件,模糊C均值聚類算法是一個(gè)簡(jiǎn)單的迭代過程。FCM與HCM的主要區(qū)別在于FCM用模糊劃分,使得每個(gè)給定數(shù)據(jù)點(diǎn)用值在0,1間的隸屬度來(lái)確定其屬于各個(gè)組的程度。即對(duì)于給定的數(shù)據(jù)點(diǎn)x,該算法求最近的聚類中心,并用下面公式進(jìn)行修正: ()這種在線公式本質(zhì)上嵌入了許多非監(jiān)督學(xué)習(xí)神經(jīng)元網(wǎng)絡(luò)的學(xué)習(xí)法則。所以,為了使它可取,要么用一些前端方法求好的初始聚類中心;要么每次用不同的初始聚類中心,將該算法運(yùn)行多次。步驟4:根據(jù)式()修正聚類中心。典型的做法是從所有數(shù)據(jù)點(diǎn)中任取c個(gè)點(diǎn)。如果第j個(gè)數(shù)據(jù)點(diǎn)屬于組i,則U中的元素為1;否則,該元素取0。當(dāng)選擇歐氏距離為組j中向量與相應(yīng)聚類中心間的非相似性指標(biāo)時(shí),價(jià)值函數(shù)可定義為: ()這里是組i內(nèi)的價(jià)值函數(shù)。再如文獻(xiàn)[11]中根據(jù)數(shù)據(jù)集的基本知識(shí)建立一個(gè)基于模糊規(guī)則的電力負(fù)荷模式分類系統(tǒng),在考慮規(guī)則的分類準(zhǔn)確性和可解釋性的情況下,利用遺傳優(yōu)化算法挑選出Pareto最優(yōu)模式分類規(guī)則集用于電力負(fù)荷模式分類。文獻(xiàn)[18]中依據(jù)模糊聚類理論,提出一種短期負(fù)荷預(yù)測(cè)新方法。文獻(xiàn)[17]中給出了一種利用模糊劃分的迭代自組織數(shù)據(jù)分析技術(shù)(Iterative SelfOrganizing Data Analysis TechniquesAlgorithm,ISODATA)識(shí)別電力系統(tǒng)同調(diào)機(jī)群的算法。 由表可以看出,基于劃分的聚類算法設(shè)計(jì)簡(jiǎn)單,解決問題的范圍廣,以及易于計(jì)算機(jī)實(shí)現(xiàn)的突出優(yōu)點(diǎn)十分合適本文的設(shè)計(jì),因?yàn)殡S著計(jì)算機(jī)技術(shù)的發(fā)展,電力負(fù)荷聚類,更多地要求計(jì)算機(jī)實(shí)現(xiàn)。因此,隨著計(jì)算機(jī)的應(yīng)用和發(fā)展,基于劃分的聚類算法成為新的研究熱點(diǎn)。逐步聚類法,是實(shí)際中受到普遍歡迎的一種方法。標(biāo)本作為聚類的“原型”,不一定對(duì)應(yīng)一個(gè)特定的數(shù)據(jù)實(shí)例或?qū)ο蟆?基于模型的聚類算法基于模型的方法首先是基于這樣一個(gè)假定:目標(biāo)數(shù)據(jù)集是由一系列的概率分布所決定的。即對(duì)于給定簇中的每個(gè)樣本,在一個(gè)給定范圍的區(qū)域中必須至少包含某個(gè)數(shù)目的樣本,但它只能發(fā)現(xiàn)球狀的簇,而基于密度的方法可用來(lái)過濾“噪聲”孤立點(diǎn)數(shù)據(jù),以發(fā)現(xiàn)任意形狀的簇。 最小張樹聚類法 在圖論聚類法中,將各個(gè)模式視為加權(quán)圖G的頂點(diǎn),加權(quán)圖的權(quán)定義為模式之間的距離,當(dāng)取類間最近距離為類間距離時(shí),聚類過程所表示成的樹就是最小張樹[7],第j步合并的兩類正是Kruskal法中第j步取出的je所連結(jié)的兩類,此時(shí)每類各自的最小張樹是G的最小張樹的子集。聚合法則剛好相反,它先是把每一個(gè)數(shù)據(jù)對(duì)象都看成一個(gè)單獨(dú)的類,然后合并相似的數(shù)據(jù)對(duì)象成為一個(gè)新類,直到所有數(shù)據(jù)對(duì)象置于一個(gè)類中,或者達(dá)到某個(gè)終止條件。. 系統(tǒng)聚類法系統(tǒng)聚類算法[5],又稱為等級(jí)聚類法,層次聚類法。自模糊集合論建立以來(lái),聚類分析很快地運(yùn)用了這一新的數(shù)學(xué)方法。模糊聚類方法是通過建立模糊相似關(guān)系而將客觀事物予以分類的方法。C均值聚類分析法是以確定的類數(shù)及選定的初始聚類中心為前提,使各樣本到其所判屬類別中心距離平方之和最小的最佳聚類,受這一前提的影響,其結(jié)果很容易陷入局部最優(yōu)。2)計(jì)算模式和類的距離,調(diào)整模式的類別。將類和合并成一個(gè)新類記為,則任一類與的距離為 再找距離最小兩類并類,直至所有的樣品全歸為一類為止。 譜系數(shù)聚類法除了要定義事物之間的親疏程度指標(biāo),還要定義類與類之間親疏程度指標(biāo)并且要導(dǎo)出求取類間親疏指標(biāo)值的遞推公式。由原樣本矢量集形成新的樣本矢量集,其中: 式中:,即各列數(shù)據(jù)平均值; 即各列數(shù)據(jù)標(biāo)準(zhǔn)方差;i=1,2,?,m, j=1,2,?,n。下面對(duì)這幾種方法做出介紹:1. 譜系數(shù)聚類分析法 這種方法又稱為系統(tǒng)聚類分析法,設(shè)樣本矢量集合為,每個(gè)樣本有n個(gè)特征量表示,表示第k次合并時(shí)的第i類。標(biāo)準(zhǔn)化的方法有很多種,他們可以保證比例的不變性或至少可以試圖使距離度量方法在各種特征下的貢獻(xiàn)達(dá)到一個(gè)最佳的平衡[8]。實(shí)際中,聚類分析前不妨試探地多選擇幾個(gè)距離公式分別進(jìn)行聚類,然后對(duì)聚類分析的結(jié)果進(jìn)行對(duì)比分析,以確定最合適的距離測(cè)度方法。(2) 要綜合考慮對(duì)樣本觀測(cè)數(shù)據(jù)的預(yù)處理和將要采用的聚類分析方法。產(chǎn)生不同結(jié)果的原因,主要是由于不同的距離公式的側(cè)重點(diǎn)和實(shí)際意義都有不同。每個(gè)樣本都由一系列指標(biāo)表示,這些指標(biāo)形成樣本矢量,全體樣本矢量構(gòu)成的集合稱為樣本矢量集,這里設(shè)樣本矢量集合為X={},每一個(gè)對(duì)象(i=?m)都由一組n個(gè)指標(biāo)刻畫:。Q型聚類是對(duì)樣品進(jìn)行分類處理,R型聚類是對(duì)變量進(jìn)行分類處理。這一問題是近來(lái)負(fù)荷建模工作一直不斷探討的熱點(diǎn),目前正在逐步形成一類基于統(tǒng)計(jì)與基于量測(cè)相結(jié)合的負(fù)荷建模新方法。聚類分析還可以作為其他算法(如分類和定性歸納算法)的預(yù)處理步驟。聚類是搜索簇的無(wú)監(jiān)督學(xué)習(xí)過程?! 慕y(tǒng)計(jì)學(xué)的觀點(diǎn)看,聚類分析是通過數(shù)據(jù)建模簡(jiǎn)化數(shù)據(jù)的一種方法。聚類是將數(shù)據(jù)分類到不同的類或者簇這樣的一個(gè)過程,所以同一個(gè)簇中的對(duì)象有很大的相似性,而不同簇間的對(duì)象有很大的相異性。也就是說(shuō),對(duì)彼此不同屬性的事物進(jìn)行辨認(rèn),將具有相似屬性的事物聚為一類,使得同一類的事物具有高度的相似性[8]。這種模型的參數(shù)易于辨識(shí),模型結(jié)構(gòu)統(tǒng)一,便于處理。但與統(tǒng)計(jì)綜合法相比,它具有如下優(yōu)點(diǎn):(1) 無(wú)需知道各個(gè)用戶的負(fù)荷組成及參數(shù),不依賴于用戶統(tǒng)計(jì)資料。他們?cè)O(shè)計(jì)了一套微機(jī)控制的實(shí)時(shí)數(shù)據(jù)采集系統(tǒng),收集了大量的現(xiàn)場(chǎng)實(shí)測(cè)數(shù)據(jù)資料。(5) 負(fù)荷成分往往比較復(fù)雜,包含的用電設(shè)備可達(dá)數(shù)十種,如電動(dòng)機(jī)、電阻負(fù)荷、電壓器、熒光燈等等。(3) 統(tǒng)計(jì)綜合工作不可能隨時(shí)進(jìn)行,甚至不能經(jīng)常進(jìn)行。它不依賴現(xiàn)場(chǎng)試驗(yàn),花費(fèi)的代價(jià)較小。在采用這類方法時(shí),需要3種數(shù)據(jù)資料:①負(fù)荷組成及各類負(fù)荷所占的比重;②配電網(wǎng)絡(luò)的參數(shù);③各類負(fù)荷的平均特性。 實(shí)用化負(fù)荷建模思想 負(fù)荷建模:兩大方法、特點(diǎn)、不足時(shí)至今日,人們已提出了不少負(fù)荷建模方法,這些方法可以歸納為兩大類:一類是“統(tǒng)計(jì)綜合法”,另一類是“總體測(cè)辨法”。一般來(lái)說(shuō),需要考慮以下幾個(gè)方面:(1)精確度;(2)計(jì)算量;(3)物理背景;(4)參數(shù)獲取;(5)應(yīng)用方便。每一種非機(jī)理模型模型都有其普遍適用的范圍, 也正是由于其普遍適用性也掩蓋了它作為具體系統(tǒng)的具體物理機(jī)理。 (2) 動(dòng)態(tài)模型動(dòng)態(tài)負(fù)荷模型又可進(jìn)一步分為機(jī)理模型和非機(jī)理模型。靜態(tài)的負(fù)荷模型主要適用于潮流計(jì)算和以潮流計(jì)算為基礎(chǔ)的穩(wěn)態(tài)分析中。基本的靜態(tài)負(fù)荷模型的結(jié)構(gòu)為:冪函數(shù)模型。建立負(fù)荷模型就是要確定描述負(fù)荷特性的數(shù)學(xué)方程的形式及其中的參數(shù),簡(jiǎn)稱為負(fù)荷建模[19]。1) 照明電器:熒光燈、白熾燈;2) 備餐電器:電爐、電飯鍋、電烤箱、烤爐等等;3) 洗熨電器:洗衣機(jī)、電熨斗、烘干機(jī)等;4) 食品儲(chǔ)存電器:電冰箱及其它冷凍設(shè)備;5) 調(diào)溫電器:電風(fēng)扇、空調(diào)等;6) 電視音響電器:收錄機(jī)、電視機(jī)、錄像機(jī)等。商業(yè)和工業(yè)負(fù)荷是為商業(yè)與工業(yè)服務(wù)的負(fù)荷。電力負(fù)荷就是這些用電設(shè)備的總稱,其中有時(shí)也包括配電網(wǎng)絡(luò),并簡(jiǎn)稱為負(fù)荷。但不同國(guó)家的管理體制和負(fù)荷情況具有明顯差異,國(guó)外的做法不一一定就能夠照搬,國(guó)外的數(shù)據(jù)也不一定能夠照用。 (2)實(shí)用性原則 電力負(fù)荷建模的目的當(dāng)然是為了應(yīng)用。在1995年8月的報(bào)告中推薦了用于電力系統(tǒng)潮流計(jì)算和動(dòng)態(tài)仿真的標(biāo)準(zhǔn)化負(fù)荷模型,為各種仿真程序的使用者指明了方向[7]。 GIGRE和IEEE都設(shè)有負(fù)荷建模工作組,其不定期的發(fā)表一些專題報(bào)告,以指導(dǎo)負(fù)荷建模方面的研究和及時(shí)總結(jié)負(fù)荷建模方面的進(jìn)展。但對(duì)于使用者來(lái)說(shuō),必須提供的只有第一種數(shù)據(jù),后兩種數(shù)據(jù)可以利用該軟件包所給的典型值,這給該軟件包的使用者提供了一定的方便。經(jīng)過多年的努力,到了1987年完成的EL25003計(jì)劃, 一個(gè)在統(tǒng)計(jì)綜合法負(fù)荷建模中最具影響的軟件包EPR I 的LOAD SYN開發(fā)完成了[ 17 ]。根據(jù)該計(jì)劃,研究工作在美國(guó)和加拿大同時(shí)展開。在這樣的背景下, 人們可以采用數(shù)字電子計(jì)算機(jī)對(duì)復(fù)雜的電力系統(tǒng)進(jìn)行精確的仿真研究??傊?,電力負(fù)荷是電力系統(tǒng)的重要組成部分,電力系統(tǒng)運(yùn)行與控制中的大多數(shù)內(nèi)容都與負(fù)荷問題有關(guān)?,F(xiàn)代電力系統(tǒng)穩(wěn)定分析常需把仿真的時(shí)間跨度增大,人們對(duì)低頻率振蕩、頻率穩(wěn)定、中長(zhǎng)期穩(wěn)定性等問題的興趣日增。與之相比,負(fù)荷建模則發(fā)展較慢,顯得有些不相匹配。還有的研究報(bào)導(dǎo),感應(yīng)電動(dòng)機(jī)對(duì)穩(wěn)定極限的影響相當(dāng)大,其誤差有時(shí)可高達(dá)30%。在臨界情況下,還有可能從根本上改變定性的結(jié)論。在進(jìn)行電力系統(tǒng)分析時(shí),不恰當(dāng)?shù)乜紤]負(fù)荷的模型,會(huì)使所得結(jié)果與系統(tǒng)實(shí)際情況不相一致,或偏樂觀,或偏保守,從而構(gòu)成系統(tǒng)的潛在危險(xiǎn)或造成不必要的投資。仿真結(jié)果的誤差是由仿真所用模型的準(zhǔn)確性決定,目前發(fā)電機(jī)組和輸電網(wǎng)絡(luò)的模型已相當(dāng)成熟,比較而言,電力負(fù)荷模型仍相當(dāng)簡(jiǎn)單,往往從基本物理概念出發(fā),采用理想化的模型,如: 恒功率、恒阻抗、恒電流或三者的組合。如果決策基于悲觀的仿真分析結(jié)果,則在規(guī)劃設(shè)計(jì)方面將會(huì)因不必要的加強(qiáng)系統(tǒng)結(jié)構(gòu)和反事故措施而投入過多的資金,造成浪費(fèi)。關(guān)鍵字:電力負(fù)荷;負(fù)荷特性;聚類;模糊C均值法APPLICATION OF IMPROVED FCM TO ELECTRIC LOAD CHARACTERISTICS OF STATISTICAL DATA CLUSTERINGABSTRACTThe power load is an active part in the security and stable operation of the entire electrical power system. It is significantly important to make suitable load model for the power system planning, design and operation. In this paper the practical load modeling method is employed, and the load characteristics is clustered to establish the