【正文】
類心以下如此進(jìn)行,選取C個(gè)初始聚類中心。缺點(diǎn)同(2),對(duì)于每個(gè)數(shù)據(jù)集,用戶均需做相應(yīng)的修改,比較麻煩,普通適用性降低。用戶指定的方法增加了先驗(yàn)知識(shí)。因此,一個(gè)靠近最優(yōu)解的初始化將以少量的迭代步驟(即少量的時(shí)間)收斂于全局最優(yōu)解。如果它小于某個(gè)確定的閥值,或它相對(duì)上次價(jià)值函數(shù)值的改變量小于某個(gè)閥值,則算法停止。FCM與HCM的主要區(qū)別在于FCM用模糊劃分,使得每個(gè)給定數(shù)據(jù)點(diǎn)用值在0,1間的隸屬度來確定其屬于各個(gè)組的程度。所以,為了使它可取,要么用一些前端方法求好的初始聚類中心;要么每次用不同的初始聚類中心,將該算法運(yùn)行多次。典型的做法是從所有數(shù)據(jù)點(diǎn)中任取c個(gè)點(diǎn)。當(dāng)選擇歐氏距離為組j中向量與相應(yīng)聚類中心間的非相似性指標(biāo)時(shí),價(jià)值函數(shù)可定義為: ()這里是組i內(nèi)的價(jià)值函數(shù)。文獻(xiàn)[18]中依據(jù)模糊聚類理論,提出一種短期負(fù)荷預(yù)測(cè)新方法。 由表可以看出,基于劃分的聚類算法設(shè)計(jì)簡(jiǎn)單,解決問題的范圍廣,以及易于計(jì)算機(jī)實(shí)現(xiàn)的突出優(yōu)點(diǎn)十分合適本文的設(shè)計(jì),因?yàn)殡S著計(jì)算機(jī)技術(shù)的發(fā)展,電力負(fù)荷聚類,更多地要求計(jì)算機(jī)實(shí)現(xiàn)。逐步聚類法,是實(shí)際中受到普遍歡迎的一種方法。 基于模型的聚類算法基于模型的方法首先是基于這樣一個(gè)假定:目標(biāo)數(shù)據(jù)集是由一系列的概率分布所決定的。 最小張樹聚類法 在圖論聚類法中,將各個(gè)模式視為加權(quán)圖G的頂點(diǎn),加權(quán)圖的權(quán)定義為模式之間的距離,當(dāng)取類間最近距離為類間距離時(shí),聚類過程所表示成的樹就是最小張樹[7],第j步合并的兩類正是Kruskal法中第j步取出的je所連結(jié)的兩類,此時(shí)每類各自的最小張樹是G的最小張樹的子集。. 系統(tǒng)聚類法系統(tǒng)聚類算法[5],又稱為等級(jí)聚類法,層次聚類法。模糊聚類方法是通過建立模糊相似關(guān)系而將客觀事物予以分類的方法。2)計(jì)算模式和類的距離,調(diào)整模式的類別。 譜系數(shù)聚類法除了要定義事物之間的親疏程度指標(biāo),還要定義類與類之間親疏程度指標(biāo)并且要導(dǎo)出求取類間親疏指標(biāo)值的遞推公式。下面對(duì)這幾種方法做出介紹:1. 譜系數(shù)聚類分析法 這種方法又稱為系統(tǒng)聚類分析法,設(shè)樣本矢量集合為,每個(gè)樣本有n個(gè)特征量表示,表示第k次合并時(shí)的第i類。實(shí)際中,聚類分析前不妨試探地多選擇幾個(gè)距離公式分別進(jìn)行聚類,然后對(duì)聚類分析的結(jié)果進(jìn)行對(duì)比分析,以確定最合適的距離測(cè)度方法。產(chǎn)生不同結(jié)果的原因,主要是由于不同的距離公式的側(cè)重點(diǎn)和實(shí)際意義都有不同。Q型聚類是對(duì)樣品進(jìn)行分類處理,R型聚類是對(duì)變量進(jìn)行分類處理。聚類分析還可以作為其他算法(如分類和定性歸納算法)的預(yù)處理步驟。 從統(tǒng)計(jì)學(xué)的觀點(diǎn)看,聚類分析是通過數(shù)據(jù)建模簡(jiǎn)化數(shù)據(jù)的一種方法。也就是說,對(duì)彼此不同屬性的事物進(jìn)行辨認(rèn),將具有相似屬性的事物聚為一類,使得同一類的事物具有高度的相似性[8]。但與統(tǒng)計(jì)綜合法相比,它具有如下優(yōu)點(diǎn):(1) 無需知道各個(gè)用戶的負(fù)荷組成及參數(shù),不依賴于用戶統(tǒng)計(jì)資料。(5) 負(fù)荷成分往往比較復(fù)雜,包含的用電設(shè)備可達(dá)數(shù)十種,如電動(dòng)機(jī)、電阻負(fù)荷、電壓器、熒光燈等等。它不依賴現(xiàn)場(chǎng)試驗(yàn),花費(fèi)的代價(jià)較小。 實(shí)用化負(fù)荷建模思想 負(fù)荷建模:兩大方法、特點(diǎn)、不足時(shí)至今日,人們已提出了不少負(fù)荷建模方法,這些方法可以歸納為兩大類:一類是“統(tǒng)計(jì)綜合法”,另一類是“總體測(cè)辨法”。每一種非機(jī)理模型模型都有其普遍適用的范圍, 也正是由于其普遍適用性也掩蓋了它作為具體系統(tǒng)的具體物理機(jī)理。靜態(tài)的負(fù)荷模型主要適用于潮流計(jì)算和以潮流計(jì)算為基礎(chǔ)的穩(wěn)態(tài)分析中。建立負(fù)荷模型就是要確定描述負(fù)荷特性的數(shù)學(xué)方程的形式及其中的參數(shù),簡(jiǎn)稱為負(fù)荷建模[19]。商業(yè)和工業(yè)負(fù)荷是為商業(yè)與工業(yè)服務(wù)的負(fù)荷。但不同國家的管理體制和負(fù)荷情況具有明顯差異,國外的做法不一一定就能夠照搬,國外的數(shù)據(jù)也不一定能夠照用。在1995年8月的報(bào)告中推薦了用于電力系統(tǒng)潮流計(jì)算和動(dòng)態(tài)仿真的標(biāo)準(zhǔn)化負(fù)荷模型,為各種仿真程序的使用者指明了方向[7]。但對(duì)于使用者來說,必須提供的只有第一種數(shù)據(jù),后兩種數(shù)據(jù)可以利用該軟件包所給的典型值,這給該軟件包的使用者提供了一定的方便。根據(jù)該計(jì)劃,研究工作在美國和加拿大同時(shí)展開。總之,電力負(fù)荷是電力系統(tǒng)的重要組成部分,電力系統(tǒng)運(yùn)行與控制中的大多數(shù)內(nèi)容都與負(fù)荷問題有關(guān)。與之相比,負(fù)荷建模則發(fā)展較慢,顯得有些不相匹配。在臨界情況下,還有可能從根本上改變定性的結(jié)論。仿真結(jié)果的誤差是由仿真所用模型的準(zhǔn)確性決定,目前發(fā)電機(jī)組和輸電網(wǎng)絡(luò)的模型已相當(dāng)成熟,比較而言,電力負(fù)荷模型仍相當(dāng)簡(jiǎn)單,往往從基本物理概念出發(fā),采用理想化的模型,如: 恒功率、恒阻抗、恒電流或三者的組合。關(guān)鍵字:電力負(fù)荷;負(fù)荷特性;聚類;模糊C均值法APPLICATION OF IMPROVED FCM TO ELECTRIC LOAD CHARACTERISTICS OF STATISTICAL DATA CLUSTERINGABSTRACTThe power load is an active part in the security and stable operation of the entire electrical power system. It is significantly important to make suitable load model for the power system planning, design and operation. In this paper the practical load modeling method is employed, and the load characteristics is clustered to establish the actual load model for substations. Based on the current problems, FCM with hierarchical clustering is used to perform the clustering of the load characteristics data of the different substations on the same area, the improved method is applied for the clustering of Hunan grid substation. The clustering result shows that the improved method is effective paring with the unimproved method.Key Words: power load。本文采用實(shí)用化負(fù)荷建模思想 ,對(duì)負(fù)荷特性進(jìn)行聚類,從而為變電站建立合適的負(fù)荷模型打下基礎(chǔ)。在運(yùn)行方面采取過分保守的策略而限制了功率傳輸?shù)臉O限,使設(shè)備得不到充分的利用。目前,數(shù)字模擬計(jì)算已成為電力系統(tǒng)設(shè)計(jì)、運(yùn)行與控制中不可缺少的輔助手段。此外,負(fù)荷特性對(duì)低頻振蕩也有很大影響。為此,更需要研究相應(yīng)的模型和算法,負(fù)荷模型當(dāng)然也應(yīng)考慮在內(nèi)。而精確的仿真的基礎(chǔ)便是精確的模型, 同其他系統(tǒng)元件模型一樣, 負(fù)荷建模工作有了相當(dāng)?shù)倪M(jìn)展, 除提出了最常用的恒阻抗、恒電流、恒功率模型以外,還在計(jì)算中采用了感應(yīng)電動(dòng)機(jī)負(fù)荷模型和多項(xiàng)式、冪函數(shù)靜態(tài)負(fù)荷模型。該軟件包使用時(shí)雖然需要三種數(shù)據(jù): 負(fù)荷組成, 即各類負(fù)荷(民用、商業(yè)、工業(yè)等)所占的比例。1990年GIGRE發(fā)表的專題報(bào)告,結(jié)合荷蘭FGO電網(wǎng)對(duì)各種負(fù)荷模型的暫態(tài)穩(wěn)定計(jì)算效果為例論證了負(fù)荷模型的重要性,并對(duì)建立實(shí)際負(fù)荷模型的方法及負(fù)荷測(cè)試的有關(guān)問題進(jìn)行了論證。這就要求模型在能夠反映負(fù)荷本質(zhì)的前提下要盡量簡(jiǎn)單,最好與現(xiàn)有電力系統(tǒng)計(jì)算程序能夠銜接。電力系統(tǒng)中有各式各樣的負(fù)荷,可以從不同的角度進(jìn)行分類。 工業(yè)負(fù)荷中電力設(shè)備種類更多,最主要的是感應(yīng)電動(dòng)機(jī)和同步電動(dòng)機(jī),其它還有整流型負(fù)荷、電弧爐、阻抗型負(fù)荷(如工廠照明)等等。多項(xiàng)式模型。其中機(jī)理模型通常就是感應(yīng)電動(dòng)機(jī)模型??梢哉f,目前沒有一種統(tǒng)一的負(fù)荷模型在各方面都可以適用。一般來說,后兩種數(shù)據(jù)變化較小,而第一種數(shù)據(jù)變化較大。而負(fù)荷特性是經(jīng)常變化的,甚至變化很大。在此基礎(chǔ)上,離線或在線辨識(shí)出負(fù)荷特性系數(shù)。(5) 總體測(cè)辨法實(shí)質(zhì)上是將負(fù)荷看作“灰色系統(tǒng)”或“黑色系統(tǒng)”,而現(xiàn)代系統(tǒng)理論為總體測(cè)辨法提供了有力的理論依據(jù)和分析工具[19] 。 聚類分析的目標(biāo)就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類。與分類不同,無監(jiān)督學(xué)習(xí)不依賴預(yù)先定義的類或帶類標(biāo)記的訓(xùn)練實(shí)例,需要由聚類學(xué)習(xí)算法自動(dòng)確定標(biāo)記,而分類學(xué)習(xí)的實(shí)例或數(shù)據(jù)對(duì)象有類別標(biāo)記。在初步探討了聚類分析技術(shù)在負(fù)荷建模中的應(yīng)用現(xiàn)狀的基礎(chǔ)上,重點(diǎn)研究了模糊C均值法的基本原理和實(shí)現(xiàn)過程,并將其用于統(tǒng)計(jì)負(fù)荷特性數(shù)據(jù)的分類,從而驗(yàn)證了聚類技術(shù)在負(fù)荷特性分類中應(yīng)用的工程實(shí)用性,為統(tǒng)計(jì)綜合法和總體測(cè)辨法的融合提供了有效的途徑。定義為樣本與的距離,常用的距離有:1. 閔氏距離 如 當(dāng)q=l時(shí),稱為絕對(duì)值距離。如在進(jìn)行聚類分析之前已經(jīng)對(duì)變量作了標(biāo)準(zhǔn)化處理,則通常就可采用歐氏距離。 聚類方法 聚類分析的方法有很多種,經(jīng)典的聚類方法有譜系數(shù)聚類分析法,動(dòng)態(tài)聚類分析法,由于新的理論不斷提出,現(xiàn)在又有了模糊聚類分析法和灰色聚類分析法。2) 初始分類。可以看出最長距離法與最短距離法只有兩點(diǎn)不同:一是類與類之間的距離定義不同;另一是計(jì)算新類與其他類的距離所用的公式不同。3. 灰色聚類分析法 灰色聚類分析法屬于灰色系統(tǒng)理論中灰色評(píng)估范疇,灰色系統(tǒng)理論是一種新的分析系統(tǒng)的理論,它以“部分信息已知,部分信息未知”的“小樣本”、“貧信息”不確定系統(tǒng)為研究對(duì)象,主要通過對(duì)“部分”已知信息的生成、開發(fā),提取有價(jià)值的信息,實(shí)現(xiàn)對(duì)系統(tǒng)運(yùn)行行為的正確認(rèn)識(shí)和有效控制,有很多系統(tǒng)可以看成是貧信息不確定系統(tǒng),因此,這一新的理論具有十分廣闊的應(yīng)用前景。E.H.Ruspinid 1969年在聚類分析中引入了模糊劃分的概念。實(shí)際中的絕大多數(shù)層次聚類算法屬于聚合法。 這種方法首先將數(shù)據(jù)空間劃分成為有限個(gè)單元(cell)的網(wǎng)絡(luò)結(jié)構(gòu),所有的處理都是以單個(gè)的單元為對(duì)象的。根據(jù)某些距離度量,新的對(duì)象可以被分配給標(biāo)本與其最相似的簇。基于劃分的聚類方法中最有代表性的算法是C均值算法(C均值算法有時(shí)又稱為K均值算法,C或者K是聚類類別的個(gè)數(shù)),和K中心點(diǎn)算法,C均值算法又可分為硬C均值算法和模糊C均值算法。該方法原理簡(jiǎn)單,計(jì)算量小,適用于快速的電力系統(tǒng)分析。并在仿真試驗(yàn)中,將次分類系統(tǒng)用于電力負(fù)荷預(yù)測(cè),結(jié)果表明此分類系統(tǒng)具有較好的分類性能,可為電力負(fù)荷預(yù)測(cè)提供更為充分有效地歷史數(shù)據(jù),從而改善其負(fù)荷預(yù)測(cè)性能。一旦確定聚類中心,可導(dǎo)出如下使式()最?。? ()重申一點(diǎn),如果是的最近的聚類中心,那么屬于組i。返回步驟2。 模糊C均值聚類模糊C均值聚類(FCM),即眾所周知的模糊ISODATA,是用隸屬度確定每個(gè)數(shù)據(jù)點(diǎn)屬于某個(gè)聚類的程度的一種聚類算法。在批處理方式運(yùn)行時(shí),F(xiàn)CM用下列步驟確定聚類中心和隸屬矩陣U[1]:步驟1:用值在0,1間的隨機(jī)數(shù)初始化隸屬矩陣U,使其滿足式()中的約束條件。算法的性能依賴于初始聚類中心。正如前面討論的那樣,容易陷入局部極小點(diǎn)。憑經(jīng)驗(yàn)選擇初始類心的方法,情形和(2)很相似。而且如果數(shù)據(jù)集中數(shù)據(jù)個(gè)數(shù)N如果比較小,時(shí)間的花費(fèi)尚可以忽略,但是隨著N值的變大,時(shí)間的花費(fèi)將很快地增加。具體地講,就是在模式特征矢量集中以最大距離原則選取新的聚類中心,以最小距離原則進(jìn)行模式歸類,如此求取C個(gè)初始聚類中心。選舉個(gè)數(shù)較多的前C個(gè)模式作為初始聚類中心。 未改進(jìn)的模糊C均值法在實(shí)例中的應(yīng)用利用未改進(jìn)的模糊C均值法所得的聚類結(jié)果如表31所示:(其中表示第i類,表示第j個(gè)變電站)下同。下面用具體數(shù)據(jù)對(duì)兩者的結(jié)果比較分析:①由改進(jìn)的模糊C均值聚類得到的分類結(jié)果C可知;類變電站以市政生活用電為主,約占50%,重工業(yè)與輕工業(yè)比例相當(dāng),約占15%;類變電站以重工業(yè)與農(nóng)業(yè)為主,且兩者比例相當(dāng),約占35%;類變電站以重工業(yè)為主,約占40%,農(nóng)業(yè)與市政生活比例相當(dāng),約占15%;類變電站以農(nóng)業(yè)為主,約占50%,重工業(yè)與市政生活比例相當(dāng),約占15%;類變電站以重工業(yè)為主,但采掘業(yè)的比例相對(duì)較大,所以單獨(dú)化為一類;類變電站以市政生活用電、重工業(yè)與三產(chǎn)業(yè)為主,分別為35%,20%,20%;類變電站以重工業(yè)為主,占到55%以上,市政生活用電只占15%左右。另一方面,改進(jìn)FCM方法的聚類精度和計(jì)算速度可以通過綜合采用多種聚類算法的復(fù)合型聚類方法予以提高。這個(gè)過程考慮了負(fù)荷時(shí)變性特性,為綜合測(cè)辨法應(yīng)用于實(shí)用化負(fù)荷建模工作開辟了一條嶄新的途徑。參考文獻(xiàn)[1] [M].國防科技大學(xué)出版社,2001.[2] [M].北京大學(xué)出版社,2005.[3] [M].華南理工大學(xué)出版社,2005.[4] [D].華北電力大學(xué)博士學(xué)位論文,1997.[5] [D]. 華北電力大學(xué)博士文,2003.[6] [J].,28(1): 6468[7] [J].,23(19):1216.[8] [D]. .[9] .[10] 賀仁睦,魏孝銘,[J].中國電機(jī)工程學(xué)報(bào),1996(3):151154. [13] 李力,朱守真,[J].,Aug,1999:610,19.[14] 陳柔伊,張堯,武至剛,陳澤懷 17卷.[15] 王天行,[M].成都::199~214.[16] 吳元奇,:.[17] 王成山,曹旌,,2005.[18] 徐南榮,宋文忠,:東南大學(xué)出版社,1991.[19] 鞠平,馬大強(qiáng)。% plot(data(:,1), data(:,2),39。marker39。% line(data(index2,1),data(index2,2),39。)。,39。*39。)。Z=linkage(Y,39。,采用實(shí)用化負(fù)荷建模