freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

《數(shù)據(jù)挖掘概述》ppt課件-全文預覽

2025-06-02 08:33 上一頁面

下一頁面
  

【正文】 估計。 :若 np是整數(shù),則位于 np和 np+1位置的數(shù)據(jù)均符合要求,此時取這兩個數(shù)的平均值作為 xp; x( [np]+1) 當 np不是整數(shù)( x( np) +x( np+1) )/2 當 np是整數(shù)與分位數(shù)有關(guān)常用術(shù)語一、極差: x(n) x(1)。B:至多有 n( 1p)個觀察值大于或等于 xp。對于連續(xù)屬性,按照目前的定義,眾數(shù)通常沒有用(為什么?),但在某些情況下,眾數(shù)可能提供關(guān)于值的性質(zhì)或關(guān)于出現(xiàn)遺漏值的重要信息。x=( 1 0 0 0 1 0 1 0 0 1)y=( 1 0 1 0 1 1 0 0 1 1)解: f00= 3 f01= 3 f10= 1 f11= 3因此, SMC=6/10,J=3/7例 x和 y購買的商品如下,計算 它們的相似系數(shù) SMC和 J。設(shè) x和 y是兩個對象,都由 n個二元屬性組成。簡單屬性的相似度和相異度 區(qū)間或比率屬性的相異度和相似度d=|xy|相異度 較常用的相似度有: s=1/(1+d),例如,考慮如下的身高數(shù)據(jù)S=1(dmin_d)/(max_dmin_d)學生S1 S2 S3 S4 S5 S6 S7身高156178166170185168180可以計算學生身高的相異度矩陣如下:學生 S1 S2 S3 S4 S5 S6 S7身高 156 178166 170 185 168 180S1 S2 S3 S4 S5 S6 S7S1 0 22 10 14 29 12 24S2 0 12 8 7 10 2S3 0 4 19 2 14S4 0 15 2 10S5 0 17 5S6 0 12S7 0二元屬性:屬性的值只接受兩個值:如真 /假,男 /女、是 /否等,通常用 0/1表示。如距離矩陣,協(xié)方差矩陣,相關(guān)系數(shù)矩陣等。012 232 0 020 121 2 027 165 24 0 你做了相關(guān)的工作后再與數(shù)據(jù)提供者交流,字段 1只是一個標號不代表任何實際意義,而字段4中 0表示缺失值,在錄入數(shù)據(jù)時偏偏所有的 10都變成了 0.? !二、數(shù)據(jù)屬性及其類型屬性( Attitude)是對象的性質(zhì)或特性。當一個新的交易到達時就與之比較。主要應用包括檢測欺詐、網(wǎng)絡(luò)攻擊、疾病的不尋常模式等。例如?想象一下,如果后人希望了解現(xiàn)在人們的生活狀況,他們面臨的已不再是信息缺失,而是需要從浩如煙海的資料中有選擇性的收集他們認為有用的信息,若沒有一定技術(shù)支持,其難度恐怕可以用 “浪里淘金 ”或 “大海撈針 ”來形容。 “摩爾定律 ”。例 Roth在聯(lián)合國世界電信論壇上又提出了一個關(guān)于網(wǎng)絡(luò)科技的一個觀點:互聯(lián)網(wǎng)寬帶每 9個月會增加一倍的容量,但成本降低一半,比芯片的變革速度還快。簡單的說,數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中發(fā)現(xiàn)有用的信息。置信度為 5/6規(guī)則 2: “買尿布 ” “買啤酒 ”。 ” 然后就可以在網(wǎng)頁的某個位置看到幾本新書或 VCD的名字及其相關(guān)鏈接。講授:吳雄華第一章 數(shù)據(jù)挖掘概述電話: 13752460206Email:一、引例網(wǎng)站這種推薦并非漫無邊際,而是有一定技術(shù)依據(jù)的,這種技術(shù)就是數(shù)據(jù)挖掘技術(shù)( DM)。如果你在當當?shù)馁彆W(wǎng)站并購買過書籍或音像制品,以后再瀏覽該網(wǎng)站時經(jīng)??吹筋愃频奶崾荆?“歡迎你,下面是我們給您推薦的新書和 VCD。規(guī)則 1: “買啤酒 ” “買尿布 ”。二、數(shù)據(jù)挖掘的定義三、數(shù)據(jù)挖掘技術(shù)產(chǎn)生的動力 數(shù)據(jù)挖掘的定義有多種不同的定義方式,現(xiàn)在為大家廣泛采用的是如下定義:數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中挖掘出隱含的、未知的、用戶可能感興趣的和對決策有潛在價值的知識和規(guī)則。現(xiàn)在已成事實。他據(jù)此推斷,按此趨勢發(fā)展下去,在較短時間內(nèi)計算能力將呈指數(shù)增長。是在信息的潮流中隨波逐流還是 “到中流擊水,浪遏飛舟 ”?數(shù)據(jù)挖掘技術(shù)的另一個產(chǎn)生動力現(xiàn)代人了解古代的主要方式主要是通過前人留下的記錄,但是這些記錄往往是零碎的、不完全的。異常檢測:識別其特征顯著不同于其他數(shù)據(jù)的觀測值(異常點)。由于與合法交易相比,欺詐行為的數(shù)目相對較少,因此異常檢測技術(shù)可以用來構(gòu)造合法交易的輪廓。有人給你如下數(shù)據(jù),每行包含一個病人的信息,用前 4個字段預測后一個字段。如Tid Rufund MaritalStatusTaxableIneDefaulted Borrower1 Yes Single 125K No2 No Married 100K No3 Yes devorce 189K Yes三、數(shù)據(jù)集的類型事務數(shù)據(jù)(購物籃數(shù)據(jù)),如顧 客 購買 商品1 面包,黃油,尿布,啤酒2 咖啡,糖,小甜 餅 , 鮭魚 ,啤酒3 面包,黃油,咖啡,尿布,啤酒, 雞 蛋4 面包,黃油, 鮭魚 , 雞5 雞 蛋,面包,黃油6 鮭魚 ,尿布,啤酒7 面包,茶,糖 雞 蛋8 咖啡,糖, 雞 , 雞 蛋9 面包,尿布,啤酒, 鹽10 茶, 雞 蛋,小甜 餅 ,尿布,啤酒三、數(shù)據(jù)集的類型矩陣數(shù)據(jù)。 標稱屬性的相異度和相似度d=0,如果 x=y1,如果 x y相異度相似度: s=1d例如,如果只考慮顧客的性別屬性,如果都是 “男 ”,則他們的相似度為 1,相異度
點擊復制文檔內(nèi)容
教學課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1