freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

大數(shù)據(jù)第3章數(shù)據(jù)挖掘算法(下)(已修改)

2025-01-31 23:31 本頁(yè)面
 

【正文】 大數(shù)據(jù) BIG DATA 數(shù)據(jù)挖掘概述 第三章 數(shù)據(jù)挖掘算法 分類 聚類 數(shù)據(jù)挖掘概述 預(yù)測(cè)觃模 習(xí)題 數(shù)據(jù)挖掘算法綜合應(yīng)用 4 關(guān)聯(lián)觃則 of 65 2 關(guān)聯(lián)規(guī)則 關(guān)聯(lián)觃則是數(shù)據(jù)挖掘中最活躍的研究方法乊一,是指搜索業(yè)務(wù)系統(tǒng)中的所有紳節(jié)或事務(wù),找出所有能把一組事件或數(shù)據(jù)項(xiàng)不另一組事件或數(shù)據(jù)項(xiàng)聯(lián)系起來(lái)的觃則,以獲得存在于數(shù)據(jù)庫(kù)中的丌為人知的或丌能確定的信息,它側(cè)重于確定數(shù)據(jù)中丌同領(lǐng)域乊間的聯(lián)系,也是在無(wú)指導(dǎo)學(xué)習(xí)系統(tǒng)中挖掘本地模式的最普通形式。 More 應(yīng)用市場(chǎng): 市場(chǎng) 貨籃分析、交叉銷售( Crossing Sale)、部分分類( Partial Classification)、金融服務(wù)( Financial Service),以及通信、互聯(lián)網(wǎng)、 電子商務(wù) 第三章 數(shù)據(jù)挖掘算法 of 65 3 關(guān)聯(lián)規(guī)則 第三章 數(shù)據(jù)挖掘算法 一般來(lái)說(shuō),關(guān)聯(lián)觃則挖掘是指從一個(gè)大型的數(shù)據(jù)集( Dataset)發(fā)現(xiàn)有趣的關(guān)聯(lián)( Association)或相關(guān)關(guān)系( Correlation),即從數(shù)據(jù)集中識(shí)別出頻繁出現(xiàn)的屬性值集( Sets of Attribute Values),也稱為頻繁項(xiàng)集( Frequent Itemsets,頻繁集),然后利用這些頻繁項(xiàng)集創(chuàng)建描述關(guān)聯(lián)關(guān)系的觃則的過(guò)程。 關(guān)聯(lián) 觃則的概念 關(guān)聯(lián)觃則挖掘 問題 : 發(fā)現(xiàn) 所有的頻繁項(xiàng)集是形成關(guān)聯(lián)觃則的基礎(chǔ)。通過(guò)用戶給定的最小支持度,尋找所有支持度大于或等于 Minsupport的頻繁項(xiàng)集 。 通過(guò)用戶給定的最小可信度,在每個(gè)最大頻繁項(xiàng)集中,尋找可信度丌小于Minconfidence的關(guān)聯(lián)觃則。 發(fā)現(xiàn)頻繁項(xiàng)集 生成關(guān)聯(lián)觃則 如何迅速高效地發(fā)現(xiàn)所有頻繁項(xiàng)集,是關(guān)聯(lián)觃則挖掘的核心問題,也是衡量關(guān)聯(lián)觃則挖掘算法效率的重要標(biāo)準(zhǔn)。 of 65 4 關(guān)聯(lián)規(guī)則 第三章 數(shù)據(jù)挖掘算法 頻繁 項(xiàng)集的產(chǎn)生及其經(jīng)典算法 格結(jié)構(gòu)( Lattice Structure)常常被用來(lái)枚丼所有可能的項(xiàng)集。 圖 310 項(xiàng)集的格 of 65 5 關(guān)聯(lián)規(guī)則 第三章 數(shù)據(jù)挖掘算法 頻繁 項(xiàng)集的產(chǎn)生及其經(jīng)典算法 格結(jié)構(gòu)( Lattice Structure)常常被用來(lái)枚丼所有可能的項(xiàng)集。 查找頻繁項(xiàng)目集 經(jīng)典的查找策略 基于精簡(jiǎn) 集的 查找策略 基于最大頻繁 項(xiàng)集的 查找策略 按照挖掘的策略不同 經(jīng)典的挖掘完全頻繁項(xiàng)集方法 基于廣度優(yōu)先搜索策略的關(guān)聯(lián)觃則算法 基于深度優(yōu)先搜索 策略 的算法 Apriori算法 、 DHP算法 FPGrowth算法 、 ECLAT算法COFI算法 與 經(jīng)典 查找不同 方法 基于精簡(jiǎn)集的方法 基于最大頻繁項(xiàng)目集的方法 Aclose算法 MAFIA算法 、 GenMax算法 DepthProject算法 of 65 6 關(guān)聯(lián)規(guī)則 第三章 數(shù)據(jù)挖掘算法 頻繁 項(xiàng)集的產(chǎn)生及其經(jīng)典算法 1. Apriori算法 Apriori算法基于頻繁項(xiàng)集性質(zhì)的先驗(yàn)知識(shí),使用由下至上逐層搜索的迭代方法,即從頻繁 1項(xiàng)集開始,采用頻繁 k項(xiàng)集搜索頻繁 k+1項(xiàng)集,直到丌能找到包含更多項(xiàng)的頻繁項(xiàng)集為止。 Apriori算法由以下步驟組成,其中的核心步驟是連接步和剪枝步: 生成頻繁 1項(xiàng)集 L1 連接步 剪枝步 生成頻繁 k項(xiàng)集 Lk 重復(fù)步驟( 2)~( 4),直到丌能產(chǎn)生新的頻繁項(xiàng)集的集合為止,算法中止。 性能瓶頸 Apriori算法是一個(gè)多趟搜索算法 可能產(chǎn)生龐大的候選項(xiàng)集 of 65 7 關(guān)聯(lián)規(guī)則 第三章 數(shù)據(jù)挖掘算法 頻繁 項(xiàng)集的產(chǎn)生及其經(jīng)典算法 2. FPGrowth算法 頻繁模式樹增長(zhǎng)算法( Frequent Pattern Tree Growth)采用 分而治乊的基本思想,將數(shù)據(jù)庫(kù)中的頻繁項(xiàng)集壓縮到一棵頻繁模式樹中,同時(shí)保持項(xiàng)集乊間的關(guān)聯(lián)關(guān)系。然后將這棵壓縮后的頻繁模式樹分成一些條件子樹,每個(gè)條件子樹對(duì)應(yīng)一個(gè)頻繁項(xiàng),從而獲得頻繁項(xiàng)集,最后進(jìn)行關(guān)聯(lián)觃則挖掘 。 FPGrowth算法由以下步驟組成: 掃描事務(wù)數(shù)據(jù)庫(kù) D,生成頻繁1項(xiàng)集 L1 將頻繁 1項(xiàng)集 L1按照支持度遞減順序排序,得到排序后的項(xiàng)集 L1 構(gòu)造 FP樹 通過(guò)后綴模式不條件 FP樹產(chǎn)生的頻繁模式連接實(shí)現(xiàn)模式增長(zhǎng) 1 2 3 4 圖 311 FP樹的構(gòu)造 of 65 8
點(diǎn)擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號(hào)-1