freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

自動集群偵測(存儲版)

2024-11-21 03:02上一頁面

下一頁面
  

【正文】 非直接的資料採礦技術(shù),主要目的是將複雜的資料簡化。 ? 凝聚性集群每筆資料皆屬各自的集群開始,然後再將集群漸漸擴(kuò)大,合併這些集群,至最後,全部資料皆屬同一集群。6號真的口味接近 , 1amp。 資料庫行銷 — 集群偵測分析 大貓 大魚 小魚 小貓 (圖 ) 曼哈頓距離 ? 算法有如紐約曼哈頓市區(qū)的方形格子的型態(tài) ? 在幾何上,曼哈頓距離是行經(jīng)所有變數(shù)軸之和。 ? 兩兩資料 (集群 )之間的距離或相似度之矩陣 (若有 n筆資料,則需 n2次的計算 ) ? 步驟二:找出相似性矩陣的最小值。 ? KMeans是自動集群偵測最常使用的方法。 ? 與決策樹的差異 ? 凝聚 集群樹狀圖並沒有敘述為何資料歸為同一集群,而以最短距離來分成集群的 ? 決策樹由根部出發(fā),以發(fā)展出所預(yù)定之葉 (目標(biāo)),凝聚性集群法則是相反的由葉出發(fā),以集群為目的,往最終的根部前進(jìn) 資料庫行銷 — 集群偵測分析 集群之間的距離量測方式 資料庫行銷 — 集群偵測分析 X1 X2 C2 C3 C1 用單一連結(jié)方法 最接近的集群 用完整連結(jié)方法 最接近的集群 用質(zhì)心點方法 最接近的集群 Divisive clustering —階層式分裂演算法 ? 以決策樹的觀念來做集群分類 ? 階層式分裂演算法由根部出發(fā),往葉子邁進(jìn);凝聚性集群法是相反的由葉出發(fā),往最終的根部前進(jìn) 資料庫行銷 — 集群偵測分析 集群的評估 ? 問題一:如何決定 Kmean中 K的數(shù)目 ? 問題二:如何決定那一個層級的集群擁有較佳的集群 (凝聚與層級分裂法 ) ? 問題三:到底怎樣才算是一個好的集群 資料庫行銷 — 集群偵測分析 集群的內(nèi)外部 資料庫行銷 — 集群偵測分析 X1 X2 ?集群內(nèi)部 ?集群內(nèi)部裡面, 差異越小越好 ?平均數(shù) ?變異數(shù) ?集群外部 ?集群之間差異越大越好 集群分析與區(qū)別分析的差異 (補(bǔ)充 ) ? 區(qū)別分析 — 群落、市場區(qū)隔為已知 (選擇題、是非題 ) ? 集群分析 — 群落、市場區(qū)隔的分佈為未知 (問答題 ) 資料庫行銷 — 集群偵測分析 其他集群分析的應(yīng)用 資料庫行銷 — 集群偵測分析 主要目的:使銷售人員能在第一時間經(jīng)由顧客的 臉型、 表情、長相區(qū)分出顧客可能的購物情形 其他集群分析的應(yīng)用 資料庫行銷 — 集群偵測分析 主要目的:區(qū)分出不同品牌的 Pizza不同的特色 Case study— 報紙編輯區(qū)的集群 資料庫行銷 — 集群偵測分析 ? Boston Globe是 Boston與 Boston週遭地區(qū)Massachusetts、 New Hampshire最主要的日報 ? 面臨問題 : ? 主要市場 Boston讀者數(shù)下降 ? 郊區(qū)市場受到地區(qū)性報紙的競爭威脅而造成閱讀的移轉(zhuǎn) ? Boston Globe希望將現(xiàn)行不理想的 12個地理區(qū)域的編輯區(qū) ,做出更好的分類,每個編輯區(qū)中每周會有兩天報導(dǎo)當(dāng)?shù)氐男侣? 編輯區(qū)的限制 ? 編輯區(qū)應(yīng)擁有地理區(qū)域上的連續(xù)性 ? 編輯區(qū)的緊密性 ,以及編輯區(qū)中人口的充足與否將會直接影響到報導(dǎo)內(nèi)容 ? 編輯區(qū)會因為地理區(qū)域而調(diào)整使用的廣告 受到上面的限制, Boston Globe希望將擁有共同特性的城市,設(shè)計合適的編輯區(qū)。 ? Responsibility在下一階段被當(dāng)作的權(quán)重 Gaussian mixture高斯演算法 ? 步驟二:最大化 ? 新的中心點被計算出,以進(jìn)一步算出更新 Responsibility ? 步驟三:重複以上動作直到達(dá)成穩(wěn)定 資料庫行銷 — 集群偵測分析 X1 X2 Agglomerative clustering 凝聚集群法 ? KMeans的集群法在開始時便有設(shè)好 K(集群數(shù))為多少。但這些轉(zhuǎn)換有可能造成資料真實性降低 (將冰淇淋編號 128號 … 難道 5amp。(有時此法較歐幾里得距離好用,因為距離不需平方,所以不會因為一個構(gòu)面(變項)的小小差異因為平方而造成對總距離有主導(dǎo)性的影響) 資料庫行銷 — 集群偵測分析 量測相似性的共同特性 ? 當(dāng)資料是類別尺度時,幾何方法並非最好,較好的方法是資料間重疊的程度 ? 將所有的資料是一個範(fàn)圍與一個範(fàn)圍的比較是否相配 ? 衡量所有變數(shù)相符的比例 資料庫行銷 — 集群偵測分析 集群的事前的準(zhǔn)備工作 ? 單位的一致性 (Scaling for consistency) 若欲以幾何距離量測相似性,頇先將資料轉(zhuǎn)換成同一單位基準(zhǔn),以下有三種常用方式: ? 常態(tài)化 (Normalizing):將資料案全距劃分成
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1