freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

機器學習經(jīng)典算法-資料下載頁

2025-01-18 17:32本頁面
  

【正文】 的簇或者大小差別很大的簇。 ? 對于“躁聲”和孤立點數(shù)據(jù)是敏感的,因為簇的中心是通過計算數(shù)據(jù)的平均值得到的,這些數(shù)據(jù)的存在會使聚類的中心發(fā)生很大的偏移。 八、 EM 九、 Apriori算法 ? Apriori算法是一種最有影響的挖掘 布爾 關聯(lián)規(guī)則頻繁項集的算法。 Apriori算法使用頻繁項集的先驗知識,使用一種稱作逐層搜索的迭代方法, k項集用于探索 (k+1)項集。首先,通過掃描事務(交易)記錄,找出所有的頻繁 1項集,該集合記做 L1,然后利用 L1找頻繁 2項集的集合 L2, L2找 L3,如此下去,直到不能再找到任何頻繁 k項集。最后再在所有的頻繁集中找出強規(guī)則,即產(chǎn)生用戶感興趣的關聯(lián)規(guī)則。 步驟 1:發(fā)現(xiàn)頻繁項集 ? 頻繁項集發(fā)現(xiàn)過程: ? ( 1)掃描 ? ( 2)計數(shù) ? ( 3)比較 ? ( 4)產(chǎn)生頻繁項集 ? ( 5)連接、剪枝,產(chǎn)生候選項集 ? 重復步驟( 1) ~( 5)直到不能發(fā)現(xiàn)更大頻集 步驟 2:產(chǎn)生關聯(lián)規(guī)則 ? 根據(jù)前面提到的置信度的定義,關聯(lián)規(guī)則的產(chǎn)生如下: ? ( 1)對于每個頻繁項集 L,產(chǎn)生 L的所有非空子集; ? ( 2)對于 L的每個非空子集 S,如果 則輸出規(guī)則“ S → L - S” 。 注: L- S表示在項集 L中除去 S子集的項集。 ? Apriori算法可以提高數(shù)據(jù)訪問效率,提升發(fā)現(xiàn)頻繁項集的速度 局限性: ? 可能產(chǎn)生大量的候選集 ? 可能需要重復掃描數(shù)據(jù)庫 十、 Pagerank ? 基本思想:如果網(wǎng)頁 T存在一個指向網(wǎng)頁 A的連接,則表明 T的所有者認為 A比較重要,從而把 T的一部分重要性得分賦予 A。這個重要性得分值為: PR( T) /C(T) 其中 PR( T)為 T的 PageRank值,C(T)為 T的出鏈數(shù),則 A的 PageRank值為一系列類似于 T的頁面重要性得分值的累加。 ? 優(yōu)點:是一個與查詢無關的靜態(tài)算法,所有網(wǎng)頁的PageRank值通過離線計算獲得;有效減少在線查詢時的計算量,極大降低了查詢響應時間。 ? 不足:人們的查詢具有主題特征, PageRank忽略了主題相關性,導致結果的相關性和主題性降低;另外, PageRank有很嚴重的對新網(wǎng)頁的歧視 本次課題結束,謝謝 演講完畢,謝謝觀看!
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1