freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘概述ppt課件(2)(編輯修改稿)

2025-05-27 18:14 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 是按照分析對(duì)象的屬性,建立類組 (class)。它根據(jù)一些變量的數(shù)值做計(jì)算,再依照結(jié)果作分類。 (計(jì)算的結(jié)果最后會(huì)是幾個(gè)少數(shù)離散值,然后按不同值分類,例如將一組資料分為 “可能會(huì)響應(yīng) ”或是 “可能不會(huì)響應(yīng) ”兩類 )。分類44? 分類常常被用來(lái)處理郵寄對(duì)象篩選的問題。我們會(huì)用一些已經(jīng)分好類的資料來(lái)研究它們的特征,然后再根據(jù)這些特征對(duì)其他未經(jīng)分類或是新的數(shù)據(jù)做預(yù)測(cè)。? 這些我們用來(lái)尋找特征的已分類資料可能是來(lái)自我們的現(xiàn)有的歷史性資料,或是將一個(gè)完整數(shù)據(jù)庫(kù)做部份取樣,再經(jīng)由實(shí)際的運(yùn)作來(lái)測(cè)試分類例子45? 譬如利用一個(gè)大的郵寄對(duì)象數(shù)據(jù)庫(kù)的部份取樣來(lái)建立一個(gè)分類模型 (Classification Model),以后再利用這個(gè)模型來(lái)對(duì)數(shù)據(jù)庫(kù)的其它資料或是新的資料作預(yù)測(cè)。? 例如,將信用申請(qǐng)者的風(fēng)險(xiǎn)屬性,區(qū)分為高度風(fēng)險(xiǎn)申請(qǐng)者,中度風(fēng)險(xiǎn)申請(qǐng)者及低度風(fēng)險(xiǎn)申請(qǐng)者。使用的技術(shù)有決策樹 (decision tree),記憶基礎(chǔ)推理(memorybased reasoning)等。 2.聚類 (clustering) 46? 面對(duì)海量的資料? 首要的任務(wù)是將它合理地歸類。? 如果已知要求,于是對(duì)資料可以設(shè)問,按回答的不同給予分類,這就是上面所說(shuō)的分類。? 如果事先沒有任何要求,象全國(guó)各地環(huán)境監(jiān)測(cè)的資料,就只能按資料反映的情況,比較接近的劃歸一類,這種歸類的方法稱之為聚類 (clustering)。聚類47? 聚類分析的算法往往按距離的遠(yuǎn)近來(lái)歸類,也可以按相似程度的大小來(lái)歸類。只有合理地聚類后,每一類內(nèi)就可以找出有關(guān)的特征,否則是難于發(fā)現(xiàn)真正有用的信息。聚類48? 很自然,不同類型的問題可以給出不同的聚類原則,從而找到不同的特征。例如世界上的居民可以按民族歸類,可以按膚色歸類,可以按國(guó)家歸類,也可以按宗教信仰歸類, …… 這些不同的聚類原則自然會(huì)找出不同的特征。3.估計(jì)與預(yù)測(cè) (Estimation and Prediction) 49? 估計(jì) (estimation)是根據(jù)已有的長(zhǎng)期累積的資料來(lái)推測(cè)某一屬性未知的真值。? 例如按照信用卡申請(qǐng)者的教育程度、行為和性別來(lái)推估其信用卡的消費(fèi)量。? 使用的技巧包括統(tǒng)計(jì)方法中的相關(guān)分析、回歸分析及人工神經(jīng)網(wǎng)絡(luò)方法。估計(jì)與預(yù)測(cè)50? 預(yù)測(cè) (prediction)是根據(jù)對(duì)象屬性之過去觀察值來(lái)估計(jì)該屬性未來(lái)之值。? 例如,由顧客過去的刷卡消費(fèi)量來(lái)預(yù)測(cè)其未來(lái)刷卡消費(fèi)量。使用的技巧包括回歸分析、時(shí)間序列分析及人工神經(jīng)網(wǎng)絡(luò)方法等。 回歸51? 回歸是使用一系列的現(xiàn)有數(shù)值來(lái)預(yù)測(cè)一個(gè)定量指標(biāo)的可能值。若將范圍擴(kuò)大亦可利用邏輯斯蒂回歸(Logistic Regression)來(lái)預(yù)測(cè)定性變量,特別在廣泛運(yùn)用現(xiàn)代分析技術(shù)如人工神經(jīng)網(wǎng)絡(luò)或決策樹理論等工具,預(yù)測(cè)的模式已不受傳統(tǒng)線性的局限,在預(yù)測(cè)的功能上大大增加了選擇工具的彈性與應(yīng)用范圍的廣度。 時(shí)間序列預(yù)測(cè)52? 時(shí)間序列預(yù)測(cè)是用指標(biāo)本身現(xiàn)有的歷史數(shù)值來(lái)預(yù)測(cè)未來(lái)的數(shù)值。? TimeSeries Forecasting的特點(diǎn)在于它所分析的數(shù)值都與時(shí)間有關(guān),可以處理有關(guān)時(shí)間的一些特性,譬如時(shí)間的階段性 (例如每個(gè)禮拜五個(gè)或六個(gè)工作天 )、季節(jié)性、節(jié)日、以及其它的一些特別因素如過去與未來(lái)的關(guān)連性有多少等等。 4.關(guān)聯(lián) (Association)和序列發(fā)現(xiàn)(Sequence Discovery)53? 關(guān)聯(lián)是要找出在某一事件或是資料中會(huì)同時(shí)出現(xiàn)的東西。?關(guān)聯(lián) (Association)主要是要找出下面這樣的信息:如果A是某一事件的一部份,則B也出現(xiàn)在該事件中的機(jī)率有 X%。關(guān)聯(lián)和序列發(fā)現(xiàn)54?例如:如果一個(gè)顧客買了低脂乳酪,那么這個(gè)顧客同時(shí)也買低脂牛奶的機(jī)率是 85%。?確定那些相關(guān)對(duì)象應(yīng)該放在一起。例如超市中相關(guān)之盥洗用品 (牙刷、牙膏和牙線 ),放在同一間貨架上。?在客戶行銷系統(tǒng)上,此種功能可以用來(lái)確認(rèn)交叉銷售 (crossselling)的機(jī)會(huì),以設(shè)計(jì)出吸引人的產(chǎn)品群組。 序列發(fā)現(xiàn) (Sequence Discovery)與關(guān)聯(lián) (Association)關(guān)系55? 序列發(fā)現(xiàn) (Sequence Discovery)與關(guān)聯(lián) (Association)關(guān)系很密切,所不同的是序列發(fā)現(xiàn) (Sequence Discovery)中相關(guān)的對(duì)象是以時(shí)間區(qū)分開來(lái)?例如:如果做了 X手術(shù),則 Y病菌在手術(shù)后感染的機(jī)率是 45%。?例如:如果 A股票在某一天上漲 12%,而且當(dāng)天股市加權(quán)指數(shù)下降,則 B股票在兩天之內(nèi)上漲的機(jī)率是 68% )。 5. 描述 (Description)56? 描述的功能是對(duì)復(fù)雜的數(shù)據(jù)庫(kù)提供簡(jiǎn)要的描述。最簡(jiǎn)單的例子就是變量的均值和方差。? 這個(gè)功能的主要目的是為了在使用別的功能時(shí)對(duì)數(shù)據(jù)先有較好的了解。? 在建立任何模型之前先做數(shù)據(jù)描述的工作是十分重要的,因?yàn)檫@會(huì)告訴我們?cè)鯓尤ソ?。描?7? 許多的商業(yè)數(shù)據(jù)挖掘軟件包也提供有用的畫圖軟件來(lái)幫你對(duì)數(shù)據(jù)作可視化處理。? 另外,經(jīng)理們經(jīng)常使用更加復(fù)雜的采掘工具 (比如 market basket analysis, treebased models)來(lái)更好地理解數(shù)據(jù)和開發(fā)模型。實(shí)現(xiàn)數(shù)據(jù)挖掘的方法一些統(tǒng)計(jì)分析方法58?回歸分析?時(shí)間序列?判別分析?因子分析?聚類分析實(shí)現(xiàn)數(shù)據(jù)挖掘的方法59?粗集 (rough set)?模糊邏輯 (fuzzy logic)?人工神經(jīng)網(wǎng)絡(luò) (Neural Network)?決策樹理論 (Decision Trees)?規(guī)則歸納法 (Rules Induction)為基礎(chǔ)的方法等表 數(shù)據(jù)挖掘功能及常用的工具舉例功 能 采掘工具 舉 例 應(yīng) 用 舉 例Classification Neural works, logistic regression, treebased model
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1