freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

管理決策模型與方法——聚類分析(完整版)

2025-02-16 11:58上一頁面

下一頁面
  

【正文】 首先定義樣品間的距離 ( 或相似系數(shù) ) 和類與類之間的距離 ,一開始將 m個樣品各自自成一類 , 這里類間的距離與樣品間的距離是等價的;然后將距離最近的兩類合并 , 并計算新類與其它類的類間距離 , 再按最小距離準則并類 。 在上式中, ix和 jx分別為聚類對象(樣 品) 各要素標準化數(shù)據(jù)的平均值 。 工商管理學院信息管理教研室 斜交空間距離 工商管理學院信息管理教研室 由于變量之間存在著不同程度的相關關系 , 在這種情況下 , 用正交空間距離來計算樣品間的距離 , 易產生形變 , 從而使得用聚類分析進行分類時的譜系結構發(fā)生變形 。 關于距離的說明: 用 工商管理學院信息管理教研室 表示樣品 和 ijd )(iX )( jX之間的距離 , 一 般要求: (1) ijd≥ 0,對于一切 i,j。,2,1(0l og*njmixxx ijijij?????? 要求 此外 , 還有平方根變換 , 立方根變換等 。,2,1(m a x* njmixxxijiijij ?? ???極差正規(guī)化變換 (規(guī)格化變換 ) 即 工商管理學院信息管理教研室 經過這種標準化所得的新數(shù)據(jù) , 各要素的極大值為 1, 極小值為 0;極差為 1, 其余的數(shù)值均在 0與 1之間 。 它們所對應的要素數(shù)據(jù)可用表 3— 1給出 。 工商管理學院信息管理教研室 上述四類變量中 , 名義變量和有序變量也稱為屬性變量 (或定性變量 ), 有時也稱為離散變量;而區(qū)間變量和比率變量稱為定量變量 , 有時也稱為連續(xù)變量 。 例如 ,性別 、 汽車品牌 、 職業(yè) 、 血型 、 是否患病 、喜愛的顏色等等都是名義變量 。 Q型聚類分析的目的主要是對樣品進行分類 。 這種方法適用于有序樣品的分類問題 , 也稱為有序樣品的聚類法 。 工商管理學院信息管理教研室 分類的問題可以分成兩種: 一種是對當前所研究的問題已知它的類別數(shù)目 , 且知道各類的特征 (如分布規(guī)律 、 或知道來自各類的訓練樣本 ), 我們的目的是要將另一些未知類別的個體正確歸屬于其中某一類 , 這是判別分析所要解決的問題 。 另一種是事先不知道研究問題應分成幾類 , 更不知道觀測的個體的具體分類情況 ,我們的目的正是需要通過對觀測數(shù)據(jù)所進行的分析處理 , 選定一種度量個體接近程度的統(tǒng)計量 、 確定分類數(shù)目 、 建立一種分類方法 , 工商管理學院信息管理教研室 并按親近程度對觀測對象給出合理的分類 。 模糊聚類法:利用模糊集理論來處理分類問題 , 它對經濟領域中具有模糊特征的兩態(tài)數(shù)據(jù)或多態(tài)數(shù)據(jù)具有明顯的分類效果 。 分類的結果是直觀的 , 且比傳統(tǒng)分類方法更細致 、 全面 、 合理 。 有序變量: 變量值是嚴格有次序的不同狀態(tài) 。 不同類型的變量在定義距離或相似性質測度時有很大差異 。 工商管理學院信息管理教研室 表 3— 1 觀測數(shù)據(jù)及特征值 變量 樣品 X1 … Xj … Xn X(1) x11 … x1j … x1n ? ? ? ? X(i) xi1 … xij … xin ? ? ? ? X(m) xm1 … xmj … xmn 均 值 … … 標準差 s1 … sj … sn 工商管理學院信息管理教研室 1x jx nx表 31中 均值 工商管理學院信息管理教研室 ),2,1(11njxmxmiijj ??? ??標準差 ),2,1()(1112 njxxmsmijijj ????? ??中心化變換 (標準化 ) 分別求出各聚類要素所對應的均值 , 以各要素的數(shù)據(jù)減去相應要素的均值 , 即 工商管理學院信息管理教研室 ),2,1。 數(shù)據(jù)是無量綱的量 。它們的主要作用是把非線性數(shù)據(jù)結構變?yōu)榫€性數(shù)據(jù)結構 , 以適應某些統(tǒng)計方法的需要 。當 ijd=0時 )(iX= )( jX; jiij dd ?(2) ,對于一切 i,j; kjikij ddd ??(3) ,對于一切 i,j,k(三角不等式 ). 對于定量變量 , 常用的距離有 : 絕對值距離 工商管理學院信息管理教研室 ),2,1,( 1mjixxdnkjkikij ???? ??歐氏距離 工商管理學院信息管理教研室 ????nkjkikij xxd12)(mji ,2,1, ??明科夫斯基 (Minkowski)距離 工商管理學院信息管理教研室 pnkpjkikijxxd11???????? ??mji ,2,1, ??切比雪夫距離 工商管理學院信息管理教研室 當明科夫斯基距離 p→∞ 時 , 有 jkiknkij xxd ?? ??1m a xmji ,2,1, ?? 蘭氏距離 工商管理學院信息管理教研室 這是由 Lance和 Williams最早提出的 ,故稱為 蘭氏距離 , 定義為 mji ,2,1, ???? ???nk jkikjkikijxxxxnLd1 )(1)( 這是一個無量綱的量 , 克服了明氏距離與各指標的量綱有關的缺點 , 且蘭氏距離對在的奇異值不敏感 , 這樣使得它特別適合高度偏倚的數(shù)據(jù) 。 在 n維空間中 , 為使具有相關性變量的譜系結構不發(fā)生變形 , 采用斜交空間距離 , 即令 在數(shù)據(jù)標準化處理下 , 工商管理學院信息管理教研室 211 12))((1????????? ? ?? ?nknlkljliljkikij rxxxxndmji ,2,1, ??為變量 和 kX之間的 相關系數(shù) 。 當 時 , =1, 表示兩個樣品線性相關 , ji ?ijr一般情況下 1?ijr舉例 據(jù)表 3— 3中的數(shù)據(jù) , 用夾角余弦公式計算 , 可得如下的相似系數(shù)矩陣: 工商管理學院信息管理教研室 ???????????????????????????????1)(99ijrR三、變量間相似系數(shù)和距離的計算 (略 ) 聚類分析方法不僅用來對樣品進行分類 ,有時需要對變量進行分類 。 這樣每次縮小一類 , 直到所有的樣品都并成一類為止 。 ⑥ 畫譜系聚類圖; ⑦ 決定分類個數(shù)及類的成員 。 : )3(D)5(X4CL3CL)5(X4CL3CL 0 6 [2] 0 0 工商管理學院信息管理教研室 此時類的總個數(shù) k減少 1類,變?yōu)?k=2, 故把此步得到的新類記為 CL2。 工商管理學院信息管理教研室 間的距離。 工商管理學院信息管理教研室 再按照最短距離法遞推公式計算 1G 13G15G, 與 離矩陣 D(7) : 之間的距離 , 可得到一個新的 3 3階距 工商管理學院信息管理教研室 G1 G13 G15 G1 0 G13 0 G15 0 第七步 , 在第六步中所得到的新的 3 3階距離矩陣中 , 非對角線元素中最小者為 d1,15=,故將 G1和 G15歸并為一類 ,記為 G16,即 G16={G1,G15}={G1,((G2,G8),(G3,(G4, G9)))}。 工商管理學院信息管理教研室 再按照最長距離法遞推公式計算 1G12G6G13G11G, , , 與 的 5 5階距離矩陣 D(5) : 之間的距離 , 可得到一個新 工商管理學院信息管理教研室 G1 G6 G11 G12 G13 G1 0 G6 0 G11 0 G12 0 G13 0 第五步 , 在第四步中所得到的新的 5 5階距離矩陣中 , 非對角線元素中最小者為 d1,12=, 故將 G1和 G12歸并為一類 , 記為G14, 即 G14={G1, G12}={G1, ( G2, G8) }。 如果其中一個分類對象已歸于一類 , 則把另一個也歸入該類;如果一對分類對象正好屬于已歸的兩類 , 則把這兩類并為一類 。 以下給出的聚類方法 , 僅作為了解 。 顯然有 設某一類 工商管理學院信息管理教研室 )(1 )()()( qqpprr XmXmmX ??的距離是 kG),( qpk ? )(kXrG的重心為 , 它 與新類 ? ?)()( , krrk XXdD ?如果樣品間的距離定義為歐氏距離 , 則有 ),()()(222)()()()(2qpkDmmmmDmmDmmXXXXDpqrqrpqkrqpkrprkTrkrk??????? 類 (組 )平均法 (AVErage linkage) 重心法雖然有較好的代表性 , 但并未充分利用各個樣品的信息 , 有人提出用兩類樣品兩兩之間平方距離的平均作為類之間的距離 , 即 工商管理學院信息管理教研室 ????qp GjGiijqppq dmmD,22 1采用這種類間距離的聚類方法 ,稱為類平均法 。它基于方差分析思想,如果類分得正確,則同類樣品之間的離差平方和應當較小,不同樣品之間的離差平方和應當較大。 這表明 Ward法定義 工商管理學院信息管理教研室 pG qG和 的距離定義為如下遞推公式: kGrG與其它類 當 合并為 rG后 , 可變法把 2222pqkrkqkkrqkpkkrpkrk DmmmDmmmmDmmmmD???????? 在實際應用中,離差平方和法應用比較廣泛,分類效果較好??梢宰C明,最短距離法、最長距離法、類平均法、可變類平均法、 kD k11 ?D ?D 23 ?D ?D4321 DDDD ???? ?1,2,1, ?? mkD k ?設 表示系統(tǒng)聚類法中 離 ,如前述 5個產品聚類之例 ,用最短距離時有 : , , , 。 一個系統(tǒng)聚類法若能 保證 次并類時的距 是嚴格單調上升 離差平方和法都具有單調性,只有重心法和中間距離法不具有單調性。 除上述這些系統(tǒng)聚類方法外 , 還有幾種系 統(tǒng) 聚 類 分 析 方 法 在 SAS/STAT 軟 件 的CLUSTER過程中給出 。 )()(tiX)(tX n tW其中 , 為 維向量 , 個類的總離差平方和為 k? ??? ??????ktttiTmittiktt XXXXWWt1)()()(1)()()(1)()(達到極小的分類。 ),(222 qpkDmmDmmD qkrqpkrprk ??? 可變類平均法 (FLExiblebeta method) 類平均法的類間距離遞推公式中 , 沒有反映 工商管理學院信息管理教研室 pG qG和 之間距離 pqD的影響 , 可變類平均法 將合并后新類 距離公式進一 kGrG與其它類 步推廣為 ),()1( 2222 qpkDDmmDmmD pqqkrqpkrprk ?????????????? 1??其中 是可變參數(shù) , 一般取 。
點擊復制文檔內容
公司管理相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1