freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)分析與挖掘?qū)嶒?yàn)報(bào)告-資料下載頁(yè)

2025-08-04 01:37本頁(yè)面
  

【正文】 (D,4)。[m4,n4]=size(co4)。count_co4_sup=zeros(m4,1)。for i=1:m4 for j=1:m1 if(shw(j,co4(i,1))==1) amp。amp。 (shw(j,co4(i,2))==1) amp。amp。 (shw(j,co4(i,3))==1) amp。amp。 (shw(j,co4(i,4))==1) count_co4_sup(i)=count_co4_sup(i)+1。 end j=j+1。 endendtemp=find((count_co4_sup)=sup)。co4=co4(temp,:)。count_co4_sup=count_co4_sup(temp,:)。L4=[co4 count_co4_sup]。C4 = Empty matrix: 0by5,由于C4是空集,所以算法終止,共找到頻繁項(xiàng)集L1,L2,L3。運(yùn)行程序Apriori,進(jìn)入關(guān)聯(lián)規(guī)則主界面, 關(guān)聯(lián)規(guī)則主界面點(diǎn)擊“載入”選擇“g:/”,選擇“打開(kāi)”,載入到j(luò)ava界面中, 載入界面載入完成后的界面, 載入完成界面輸入最小支持度閾值,如2,點(diǎn)擊“生成頻繁項(xiàng)集”,生成所有頻繁項(xiàng)集, 頻繁項(xiàng)集 輸入最小可信度的值,點(diǎn)擊生成關(guān)聯(lián)規(guī)則, 關(guān)聯(lián)規(guī)則刪除小于支持度的鍵創(chuàng)建并返回L1的結(jié)果集創(chuàng)建并返回L2的結(jié)果集創(chuàng)建并返回L3的結(jié)果集在健集keyset里查找健值為a,b,c的健判斷在健集keyset里是否已經(jīng)包含了健值為a,b,c的健創(chuàng)建關(guān)聯(lián)規(guī)則,返回關(guān)聯(lián)規(guī)則表求a與L的差集,并返回差集獲取setN的子集。假設(shè)setN={a,b,c},則生成的子集為XXX實(shí)驗(yàn)總結(jié)在上述基于Matlab和Java的Apriori算法的編寫(xiě)中均存在以下不足:(1) 在生成候選項(xiàng)集的時(shí)候會(huì)產(chǎn)生許多最后證明不是頻繁項(xiàng)集的候選項(xiàng)集,如果能在生成候選頻繁項(xiàng)集之前能判斷出某些候選集不是頻繁項(xiàng)集,則這樣可以避免在掃描數(shù)據(jù)庫(kù)時(shí)的開(kāi)銷(xiāo);(2) 連接程序中相同的項(xiàng)目重復(fù)比較的太多,如果能避免這些重復(fù)的比較,則可以提高算法的效率;(3) 有些事務(wù)項(xiàng)在一次掃描之后可以判斷出下次不必再掃描,但結(jié)果又被多次掃描。如果能避免這些稍描,則可以提高算法效率??梢愿倪M(jìn)的方面有:(1)基于散列(hash)的技術(shù) 這種散列的技術(shù)可用于壓縮候選k項(xiàng)集Ck。在由C1中的候選1項(xiàng)集產(chǎn)生頻繁1項(xiàng)集L1時(shí),可使用散列函數(shù)將每個(gè)事務(wù)的所有項(xiàng)集散列到不同的桶中,并對(duì)對(duì)應(yīng)的桶進(jìn)行計(jì)數(shù),通過(guò)桶的計(jì)數(shù)尋找候選頻繁項(xiàng)集。這種技術(shù)可以大大壓縮待考察的K項(xiàng)集,尤其有利于改進(jìn)頻繁2項(xiàng)集的生成效率,這就是DHP算法。(2) 基于劃分的方法 使用劃分技術(shù),可以只需要對(duì)數(shù)據(jù)庫(kù)進(jìn)行兩遍掃描,就可以發(fā)現(xiàn)全部頻繁集,從而大大降低對(duì)數(shù)據(jù)庫(kù)的掃描遍數(shù)。(3) 選樣 該方法的基本思想是,選取給定數(shù)據(jù)庫(kù)D的隨機(jī)樣本S,然后在S中而非是D中搜索頻繁項(xiàng)集。這種方法是以精度的犧牲換取搜索速度和效率。為避免丟失全局頻繁項(xiàng)集,可以使用比全局支持度閥值低的樣本支持度閥值來(lái)對(duì)樣本尋找頻繁項(xiàng)集。數(shù)據(jù)挖掘是一門(mén)比較新興的課程,隨著現(xiàn)在信息化的快速發(fā)展發(fā)揮著越來(lái)越重要的作用。通過(guò)學(xué)習(xí)數(shù)據(jù)挖掘這門(mén)課程,使我對(duì)于數(shù)據(jù)挖掘有了更深一步的理解。數(shù)據(jù)挖掘吸納了許多其他學(xué)科的精華知識(shí),且具有自己獨(dú)特的體系,非常具有深度,想要深入研究數(shù)據(jù)挖掘有一定難度。這次實(shí)驗(yàn)通過(guò)數(shù)據(jù)挖掘的一個(gè)重要方法——關(guān)聯(lián)規(guī)則作為切入點(diǎn)來(lái)學(xué)習(xí)數(shù)據(jù)挖掘,從一個(gè)較淺的層面來(lái)理解數(shù)據(jù)挖掘。關(guān)聯(lián)規(guī)則是指在交易數(shù)據(jù)庫(kù)中,挖掘出不同項(xiàng)集的關(guān)聯(lián)關(guān)系,在實(shí)際交易中很很廣泛的應(yīng)用。學(xué)習(xí)關(guān)聯(lián)規(guī)則過(guò)程中,首先,老師講解關(guān)聯(lián)規(guī)則的基礎(chǔ)知識(shí),以及基于Matlab的關(guān)聯(lián)規(guī)則代碼,使本人對(duì)于關(guān)聯(lián)規(guī)則產(chǎn)生興趣,并開(kāi)始研究;然后,本人在課后通過(guò)查找資料以及閱讀書(shū)籍編寫(xiě)基于Java的關(guān)聯(lián)規(guī)則代碼。通過(guò)這一過(guò)程本人牢固掌握了關(guān)聯(lián)規(guī)則,但是也存在不足之處,比如編寫(xiě)的代碼普遍只適用于較少的數(shù)據(jù)量,對(duì)于大量的數(shù)據(jù)無(wú)能為力,這需要在今后的學(xué)習(xí)中不斷去優(yōu)化。另外,關(guān)聯(lián)規(guī)則只是數(shù)據(jù)挖掘中的幾個(gè)基本方法,還有如粗糙集,遺傳算法,神經(jīng)網(wǎng)絡(luò)等非常實(shí)用的方法,由于課時(shí)有限,沒(méi)有機(jī)會(huì)學(xué)習(xí)。這次的實(shí)驗(yàn)提供了一個(gè)契機(jī),對(duì)于本人今后的學(xué)習(xí)有很大幫助。19
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1