freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

apriori算法及其改進(jìn)算法(完整版)

  

【正文】 :OnAppAbout() { CAboutDlg aboutDlg。 // Dialog Data //{{AFX_DATA(CAboutDlg) enum { IDD = IDD_ABOUTBOX }。 AddDocTemplate(pDocTemplate)。 ///////////////////////////////////////////////////////////////////////////// // CAprioriApp initialization BOOL CAprioriApp::InitInstance() { AfxEnableControlContainer()。第二,改進(jìn)的算法對(duì)數(shù)據(jù)庫(kù)進(jìn)行了掃描后的重新生成 (‘刪除’一些不能支持頻繁集的記錄,這里所謂的刪除實(shí)際上是把不符合再次掃描比較條件的記錄通過(guò)交換記錄內(nèi)容的方式移到數(shù)據(jù)庫(kù)的末端,把末端新記錄填入該記錄的位置。得到了這個(gè)候選項(xiàng)目集后,可以對(duì)數(shù)據(jù)庫(kù) D 的每一個(gè)事務(wù) tid進(jìn)行掃描,若該事務(wù)中至少含有候選項(xiàng)目集 CK 中的一員,則保留該項(xiàng)事務(wù),否則把該事物記錄與數(shù)據(jù)庫(kù)末端沒(méi)有作刪除標(biāo)記的事務(wù)記錄對(duì)換,并對(duì)移到數(shù)據(jù)庫(kù)末端的事務(wù)記錄作刪除標(biāo)一記,整個(gè)數(shù)據(jù)庫(kù)掃描完畢后為新 的事務(wù)數(shù)據(jù)庫(kù) D’ 中。而這種代價(jià)是隨著數(shù)據(jù)庫(kù)的記錄的增加呈現(xiàn)出幾何級(jí)數(shù)的增加。 用集合表 示 :Ck=={X∈ Ck39。 (11) next (12) resultset=resultset∪ Lk 其中 , D 表示數(shù)據(jù)庫(kù) 。例如, R6“嬰兒爽身粉→尿布”有很高的置信度,是合理可理解的, R3有很高的置信度將提示進(jìn)一 步的調(diào)查分析,本例中是因?yàn)橛?xùn)練資料太少引起的失真。 單項(xiàng)統(tǒng)計(jì) 支持度 {啤酒 } 4/5 {尿布 } 4/5 {嬰兒爽身粉 } 2/5 {牛奶 } 2/5 表 32 表 33 從單項(xiàng)統(tǒng)計(jì)中看出 80%的顧客買(mǎi)了啤酒、 80%的顧客買(mǎi)了尿布。 (3) XK是 K 維頻繁項(xiàng)集,如果所有 K1維 頻繁項(xiàng)集集合 XK1中包含 XK 的 K1維子項(xiàng)集的個(gè)數(shù)小于 K,則 XK不可能是 K維最大頻繁數(shù)據(jù)項(xiàng)集。如果顧客買(mǎi)牛奶,他也購(gòu)買(mǎi)面包的可能性有多大? 什么商品組或集合顧客多半會(huì)在一次購(gòu)物時(shí)同時(shí)購(gòu)買(mǎi)?例如,買(mǎi)牛奶的顧客有 80%也同時(shí)買(mǎi)面包,或買(mǎi)鐵錘的顧客中有 70%的人同時(shí)也買(mǎi)鐵釘,這就是從購(gòu)物籃數(shù)據(jù)中提取的關(guān)聯(lián)規(guī)則。然而不管怎樣,如果沒(méi)有數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則在這里的應(yīng)用,你是無(wú)論如何想象不出這樣有點(diǎn)驚人的“笑話”。 數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別 數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析 (如查詢(xún)、報(bào)表、聯(lián)機(jī)應(yīng)用分析 )的本質(zhì)區(qū)別是數(shù)據(jù)挖掘是在沒(méi)有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí) .數(shù)據(jù)挖掘所得到的信息應(yīng)具有先未知 ,有效和可實(shí)用三個(gè)特征 . 陜西理工學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)系開(kāi)放性實(shí)驗(yàn)結(jié)題報(bào)告 3 先前未知的信息是指該信息是預(yù)先未曾預(yù)料到的 ,既數(shù)據(jù)挖掘是要發(fā) 現(xiàn)那些不能靠直覺(jué)發(fā)現(xiàn)的信息或知識(shí) ,甚至是違背直覺(jué)的信息或知識(shí) ,挖掘出的信息越是出乎意料 ,就可能越有價(jià)值 .在商業(yè)應(yīng)用中最典型的例子就是一家連鎖店通過(guò)數(shù)據(jù)挖掘發(fā)現(xiàn)了小孩尿布和啤酒之間有著驚人的聯(lián)系 . 數(shù)據(jù)挖掘不能干什么 DM 不能告訴你某個(gè)模型對(duì)你的企業(yè)的實(shí)際價(jià)值 DM 是一個(gè)工具,他只是幫助商業(yè)人士更深入、更容易地分析數(shù)據(jù),但是無(wú)法告訴你某個(gè)模型對(duì)你的企業(yè)的實(shí)際價(jià)值, DM 中得到的模型必須在現(xiàn)實(shí)生活中進(jìn)行驗(yàn)證, DM 不會(huì)在缺乏指導(dǎo)的情況下自動(dòng)的發(fā)現(xiàn)模型。最好能用自然語(yǔ)言表達(dá)所發(fā)現(xiàn)的結(jié)果。人們把數(shù)據(jù)看作是形成知識(shí)的源泉,好像從礦石中采礦或淘金一樣。 本文 通過(guò)對(duì)參與候選集的元素計(jì)數(shù)的方法來(lái)減少產(chǎn)生候選集的組合和減少數(shù)據(jù)庫(kù)的掃描次數(shù)來(lái)達(dá)到要求。這有利于提高挖掘的速度和減少數(shù)據(jù)庫(kù)的 I/O操作時(shí)間的開(kāi)銷(xiāo)。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù);也可以是半結(jié)構(gòu)化的,如文本、圖形和圖 像數(shù)據(jù);甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。 商業(yè)角度的定義 數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點(diǎn)是對(duì)商業(yè)數(shù)據(jù)庫(kù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)分析者必須知道你所選用的 DM 工具是如何工作的,采用的算 法的原理是什么。本文在后面將就該規(guī)則作一詳細(xì)的闡述與討論。分析結(jié)果可以幫助經(jīng)理設(shè)計(jì)不同的商店布局。 證明 : 很明顯,數(shù)據(jù)項(xiàng)集 XK1:的 K1 維子項(xiàng)集的個(gè)數(shù)為 K1。從雙項(xiàng)統(tǒng)計(jì)中看出, 60%的顧客同時(shí)買(mǎi)了啤酒和尿布, 40%的顧客買(mǎi)了啤酒和牛奶, 40%的顧客買(mǎi)了尿布和爽身粉。 關(guān)聯(lián)規(guī)則問(wèn)題的分解 關(guān)聯(lián)規(guī)則挖掘問(wèn)題可分解為以下兩個(gè)子問(wèn)題 : 1. 找出事務(wù)數(shù)據(jù)庫(kù) D 中所有大于等于用戶(hù)指定最小支持度的項(xiàng)目集 (itemset). 具有最小支持度的項(xiàng)目集稱(chēng)為最大項(xiàng)目集 .項(xiàng)目集的支持度指包含該項(xiàng)目集的數(shù)目 . 2. 利用最大項(xiàng)目集生成所需要的關(guān)聯(lián)規(guī)則 對(duì) 每 一 最 大 項(xiàng) 目 集 A, 找到 A 的 所 有 非 空 子 集 a, 如 果 比 率support(A)/support(a)=minconfidence,就生 成關(guān)聯(lián)規(guī)則 a=(Aa).support(A)/support(a) 即規(guī)則 a=(Aa)的 置信度 . 事實(shí)上 ,挖掘關(guān)聯(lián)規(guī)則的整個(gè)執(zhí)行過(guò)程中第一個(gè)子問(wèn)題是核心問(wèn)題 .當(dāng)找到所有的最大項(xiàng)目集后 ,相應(yīng)的關(guān)聯(lián)規(guī)則將很容易生成 .在本文中將對(duì)關(guān)聯(lián)規(guī)則的第一個(gè)問(wèn)題進(jìn)行探討、研究 。 minsupport 表示給定的最小支持度 。|X 的所有 k1 維子集在 Lk1中 } 在此函數(shù)中需要說(shuō)明以下幾點(diǎn) : (1) 最大項(xiàng)目集的子集必為最大項(xiàng)目集 . 這是該算法中隱含的最基本的一條性質(zhì) . 因?yàn)樽畲箜?xiàng)目集定義為不小于最小支持度 (minsupport)的項(xiàng)目集 . 若最大項(xiàng)目集為 c, 則即 =minsupport, 若 c 的子集為 c39。因此人們開(kāi)始尋求一種能減少這種系統(tǒng) 1/O 開(kāi)銷(xiāo)的更為快捷的算法。因此隨著 K 的增大, D’中事務(wù)記錄量大大地減少,對(duì)于下一次事務(wù)掃描可以大大節(jié)約 I/0 開(kāi)銷(xiāo)。同時(shí)對(duì)數(shù)據(jù)庫(kù) 中 的 記錄數(shù)邏輯地減少。 // Standard initialization // If you are not using these features and wish to reduce the size // of your final executable, you should remove from the following // the specific initialization routines you do not need. ifdef _AFXDLL Enable3dControls()。 // Parse mand line for standard shell mands, DDE, file open CCommandLineInfo cmdInfo。 //}}AFX_DATA // ClassWizard generated virtual function overrides //{{AFX_VIRTUAL(CAboutDlg) protected: virtual void DoDataExchange(CDataExchange* pDX)。 CAboutDlg::CAboutDlg() : CDialog(CAboutDlg::IDD) { //{{AFX_DATA_INIT(CAboutDlg) //}}AFX_DATA_INIT 陜西理工學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)系開(kāi)放性實(shí)驗(yàn)結(jié)題報(bào)告 23 } void CAboutDlg::DoDataExchange(CDataExchange* pDX) { CDialog::DoDataExchange(pDX)。 陜西理工學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)系開(kāi)放性實(shí)驗(yàn)結(jié)題報(bào)告 22 // Dispatch mands specified on the mand line if (!ProcessShellCommand(cmdInfo)) return FALSE。 // Call this when linking to MFC statically endif // Change the registry key under which our settings are stored. // TODO: You should modify this string to be something appropriate // such as the name of your pany or anization. SetRegistryKey(_T(Local AppWiz
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1