freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

聚類方法(clustering)-預(yù)覽頁

2025-08-25 13:50 上一頁面

下一頁面
 

【正文】 的個(gè)數(shù)不需事先定好 ?需確定距離矩陣 ?運(yùn)算量要大,適用于處理小樣本數(shù)據(jù) 廣泛采用的類間距離: ? 最小距離法( single linkage method) ?極小異常值在實(shí)際中不多出現(xiàn),避免極大值的影響 廣泛采用的類間距離: ? 最大距離法( plete linkage method) ?可能被極大值扭曲,刪除這些值之后再聚類 廣泛采用的類間距離: ? 類平均距離法( average linkage method)類間所有樣本點(diǎn)的平均距離 ?該法利用了所有樣本的信息,被認(rèn)為是較好的系統(tǒng)聚類法 廣泛采用的類間距離: ? 重心法( centroid hierarchical method) ?類的重心之間的距離 ?對異常值不敏感,結(jié)果更穩(wěn)定 廣泛采用的類間距離 ? 離差平方和法( ward method) ? D2=WM- WK- WL ? 即 ? 對異常值很敏感;對較大的類傾向產(chǎn)生較大的距離,從而不易合并,較符合實(shí)際需要。如需要知道白金持卡人和金卡持卡人的流動率,各自平均消費(fèi)水平有多少,等; ? 聚類分析可以輔助企業(yè)進(jìn)行客戶細(xì)分,但是 Data mining的客戶細(xì)分不等同于商業(yè)領(lǐng)域的細(xì)分,看不懂結(jié)果,也可能造成企業(yè)管理層無法對結(jié)果善加利用。 什么是聚類 ? 早在孩提時(shí)代,人就通過不斷改進(jìn)下意識中的聚類模式來學(xué)會如何區(qū)分貓和狗,動物和植物 聚類分析無處不在 ? 誰經(jīng)常光顧商店,誰買什么東西,買多少? ?按忠誠卡記錄的光臨次數(shù)、光臨時(shí)間、性別、年齡、職業(yè)、購物種類、金額等變量分類 ?這樣商店可以 … . ?識別顧客購買模式(如喜歡一大早來買酸奶和鮮肉,習(xí)慣周末時(shí)一次性大采購) ?刻畫不同的客戶群的特征(用變量來刻畫,就象刻畫貓和狗的特征一樣) 什么情況下需要聚類 ?為什么這樣分類? ?因?yàn)槊恳粋€(gè)類別里面的人消費(fèi)方式都不一樣,需要針對不同的人群,制定不同的關(guān)系管理方式,以提高客戶對公司商業(yè)活動的相應(yīng)率。在同一個(gè)類內(nèi)對象之間具有較高的相似度,不同類之間的對象差別較大。 ? 大量的數(shù)據(jù)不等于大量的垃圾,我們需要針對客戶市場細(xì)分所需要的資料。 ? 分裂的方法( divisive)(自頂向下) 思想:一開始將所有的對象置于一類,在迭代的每一步中,一個(gè)類不斷地分為更小的類,直到每個(gè)對象在單獨(dú)的一個(gè)類中,或達(dá)到一個(gè)終止條件。不斷重復(fù)這個(gè)過程,直到所有的樣本都不能再分配為止。 不穩(wěn)定的聚類方法 ? 輸入?yún)?shù)憑主觀導(dǎo)致難以控制聚類的質(zhì)量 ? 很多聚類算法要求輸入一定的參數(shù),如希望產(chǎn)生的類的數(shù)目,使得聚類的質(zhì)量難以控制,尤其是對于高維的,沒有先驗(yàn)信息的龐大數(shù)據(jù)。 不穩(wěn)定的聚類方法 ? 聚類分析中權(quán)重的確定 ?當(dāng)各指標(biāo)重要性不同的時(shí)候,需要根據(jù)需要調(diào)整權(quán)
點(diǎn)擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1