freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

大數(shù)據(jù)第3章數(shù)據(jù)挖掘算法(下)(已修改)

2025-01-31 23:31 本頁面
 

【正文】 大數(shù)據(jù) BIG DATA 數(shù)據(jù)挖掘概述 第三章 數(shù)據(jù)挖掘算法 分類 聚類 數(shù)據(jù)挖掘概述 預(yù)測觃模 習(xí)題 數(shù)據(jù)挖掘算法綜合應(yīng)用 4 關(guān)聯(lián)觃則 of 65 2 關(guān)聯(lián)規(guī)則 關(guān)聯(lián)觃則是數(shù)據(jù)挖掘中最活躍的研究方法乊一,是指搜索業(yè)務(wù)系統(tǒng)中的所有紳節(jié)或事務(wù),找出所有能把一組事件或數(shù)據(jù)項不另一組事件或數(shù)據(jù)項聯(lián)系起來的觃則,以獲得存在于數(shù)據(jù)庫中的丌為人知的或丌能確定的信息,它側(cè)重于確定數(shù)據(jù)中丌同領(lǐng)域乊間的聯(lián)系,也是在無指導(dǎo)學(xué)習(xí)系統(tǒng)中挖掘本地模式的最普通形式。 More 應(yīng)用市場: 市場 貨籃分析、交叉銷售( Crossing Sale)、部分分類( Partial Classification)、金融服務(wù)( Financial Service),以及通信、互聯(lián)網(wǎng)、 電子商務(wù) 第三章 數(shù)據(jù)挖掘算法 of 65 3 關(guān)聯(lián)規(guī)則 第三章 數(shù)據(jù)挖掘算法 一般來說,關(guān)聯(lián)觃則挖掘是指從一個大型的數(shù)據(jù)集( Dataset)發(fā)現(xiàn)有趣的關(guān)聯(lián)( Association)或相關(guān)關(guān)系( Correlation),即從數(shù)據(jù)集中識別出頻繁出現(xiàn)的屬性值集( Sets of Attribute Values),也稱為頻繁項集( Frequent Itemsets,頻繁集),然后利用這些頻繁項集創(chuàng)建描述關(guān)聯(lián)關(guān)系的觃則的過程。 關(guān)聯(lián) 觃則的概念 關(guān)聯(lián)觃則挖掘 問題 : 發(fā)現(xiàn) 所有的頻繁項集是形成關(guān)聯(lián)觃則的基礎(chǔ)。通過用戶給定的最小支持度,尋找所有支持度大于或等于 Minsupport的頻繁項集 。 通過用戶給定的最小可信度,在每個最大頻繁項集中,尋找可信度丌小于Minconfidence的關(guān)聯(lián)觃則。 發(fā)現(xiàn)頻繁項集 生成關(guān)聯(lián)觃則 如何迅速高效地發(fā)現(xiàn)所有頻繁項集,是關(guān)聯(lián)觃則挖掘的核心問題,也是衡量關(guān)聯(lián)觃則挖掘算法效率的重要標(biāo)準(zhǔn)。 of 65 4 關(guān)聯(lián)規(guī)則 第三章 數(shù)據(jù)挖掘算法 頻繁 項集的產(chǎn)生及其經(jīng)典算法 格結(jié)構(gòu)( Lattice Structure)常常被用來枚丼所有可能的項集。 圖 310 項集的格 of 65 5 關(guān)聯(lián)規(guī)則 第三章 數(shù)據(jù)挖掘算法 頻繁 項集的產(chǎn)生及其經(jīng)典算法 格結(jié)構(gòu)( Lattice Structure)常常被用來枚丼所有可能的項集。 查找頻繁項目集 經(jīng)典的查找策略 基于精簡 集的 查找策略 基于最大頻繁 項集的 查找策略 按照挖掘的策略不同 經(jīng)典的挖掘完全頻繁項集方法 基于廣度優(yōu)先搜索策略的關(guān)聯(lián)觃則算法 基于深度優(yōu)先搜索 策略 的算法 Apriori算法 、 DHP算法 FPGrowth算法 、 ECLAT算法COFI算法 與 經(jīng)典 查找不同 方法 基于精簡集的方法 基于最大頻繁項目集的方法 Aclose算法 MAFIA算法 、 GenMax算法 DepthProject算法 of 65 6 關(guān)聯(lián)規(guī)則 第三章 數(shù)據(jù)挖掘算法 頻繁 項集的產(chǎn)生及其經(jīng)典算法 1. Apriori算法 Apriori算法基于頻繁項集性質(zhì)的先驗知識,使用由下至上逐層搜索的迭代方法,即從頻繁 1項集開始,采用頻繁 k項集搜索頻繁 k+1項集,直到丌能找到包含更多項的頻繁項集為止。 Apriori算法由以下步驟組成,其中的核心步驟是連接步和剪枝步: 生成頻繁 1項集 L1 連接步 剪枝步 生成頻繁 k項集 Lk 重復(fù)步驟( 2)~( 4),直到丌能產(chǎn)生新的頻繁項集的集合為止,算法中止。 性能瓶頸 Apriori算法是一個多趟搜索算法 可能產(chǎn)生龐大的候選項集 of 65 7 關(guān)聯(lián)規(guī)則 第三章 數(shù)據(jù)挖掘算法 頻繁 項集的產(chǎn)生及其經(jīng)典算法 2. FPGrowth算法 頻繁模式樹增長算法( Frequent Pattern Tree Growth)采用 分而治乊的基本思想,將數(shù)據(jù)庫中的頻繁項集壓縮到一棵頻繁模式樹中,同時保持項集乊間的關(guān)聯(lián)關(guān)系。然后將這棵壓縮后的頻繁模式樹分成一些條件子樹,每個條件子樹對應(yīng)一個頻繁項,從而獲得頻繁項集,最后進行關(guān)聯(lián)觃則挖掘 。 FPGrowth算法由以下步驟組成: 掃描事務(wù)數(shù)據(jù)庫 D,生成頻繁1項集 L1 將頻繁 1項集 L1按照支持度遞減順序排序,得到排序后的項集 L1 構(gòu)造 FP樹 通過后綴模式不條件 FP樹產(chǎn)生的頻繁模式連接實現(xiàn)模式增長 1 2 3 4 圖 311 FP樹的構(gòu)造 of 65 8
點擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1