freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘概述ppt課件(2)(編輯修改稿)

2025-05-27 18:14 本頁面
 

【文章內(nèi)容簡介】 是按照分析對象的屬性,建立類組 (class)。它根據(jù)一些變量的數(shù)值做計算,再依照結(jié)果作分類。 (計算的結(jié)果最后會是幾個少數(shù)離散值,然后按不同值分類,例如將一組資料分為 “可能會響應(yīng) ”或是 “可能不會響應(yīng) ”兩類 )。分類44? 分類常常被用來處理郵寄對象篩選的問題。我們會用一些已經(jīng)分好類的資料來研究它們的特征,然后再根據(jù)這些特征對其他未經(jīng)分類或是新的數(shù)據(jù)做預(yù)測。? 這些我們用來尋找特征的已分類資料可能是來自我們的現(xiàn)有的歷史性資料,或是將一個完整數(shù)據(jù)庫做部份取樣,再經(jīng)由實際的運作來測試分類例子45? 譬如利用一個大的郵寄對象數(shù)據(jù)庫的部份取樣來建立一個分類模型 (Classification Model),以后再利用這個模型來對數(shù)據(jù)庫的其它資料或是新的資料作預(yù)測。? 例如,將信用申請者的風(fēng)險屬性,區(qū)分為高度風(fēng)險申請者,中度風(fēng)險申請者及低度風(fēng)險申請者。使用的技術(shù)有決策樹 (decision tree),記憶基礎(chǔ)推理(memorybased reasoning)等。 2.聚類 (clustering) 46? 面對海量的資料? 首要的任務(wù)是將它合理地歸類。? 如果已知要求,于是對資料可以設(shè)問,按回答的不同給予分類,這就是上面所說的分類。? 如果事先沒有任何要求,象全國各地環(huán)境監(jiān)測的資料,就只能按資料反映的情況,比較接近的劃歸一類,這種歸類的方法稱之為聚類 (clustering)。聚類47? 聚類分析的算法往往按距離的遠(yuǎn)近來歸類,也可以按相似程度的大小來歸類。只有合理地聚類后,每一類內(nèi)就可以找出有關(guān)的特征,否則是難于發(fā)現(xiàn)真正有用的信息。聚類48? 很自然,不同類型的問題可以給出不同的聚類原則,從而找到不同的特征。例如世界上的居民可以按民族歸類,可以按膚色歸類,可以按國家歸類,也可以按宗教信仰歸類, …… 這些不同的聚類原則自然會找出不同的特征。3.估計與預(yù)測 (Estimation and Prediction) 49? 估計 (estimation)是根據(jù)已有的長期累積的資料來推測某一屬性未知的真值。? 例如按照信用卡申請者的教育程度、行為和性別來推估其信用卡的消費量。? 使用的技巧包括統(tǒng)計方法中的相關(guān)分析、回歸分析及人工神經(jīng)網(wǎng)絡(luò)方法。估計與預(yù)測50? 預(yù)測 (prediction)是根據(jù)對象屬性之過去觀察值來估計該屬性未來之值。? 例如,由顧客過去的刷卡消費量來預(yù)測其未來刷卡消費量。使用的技巧包括回歸分析、時間序列分析及人工神經(jīng)網(wǎng)絡(luò)方法等。 回歸51? 回歸是使用一系列的現(xiàn)有數(shù)值來預(yù)測一個定量指標(biāo)的可能值。若將范圍擴(kuò)大亦可利用邏輯斯蒂回歸(Logistic Regression)來預(yù)測定性變量,特別在廣泛運用現(xiàn)代分析技術(shù)如人工神經(jīng)網(wǎng)絡(luò)或決策樹理論等工具,預(yù)測的模式已不受傳統(tǒng)線性的局限,在預(yù)測的功能上大大增加了選擇工具的彈性與應(yīng)用范圍的廣度。 時間序列預(yù)測52? 時間序列預(yù)測是用指標(biāo)本身現(xiàn)有的歷史數(shù)值來預(yù)測未來的數(shù)值。? TimeSeries Forecasting的特點在于它所分析的數(shù)值都與時間有關(guān),可以處理有關(guān)時間的一些特性,譬如時間的階段性 (例如每個禮拜五個或六個工作天 )、季節(jié)性、節(jié)日、以及其它的一些特別因素如過去與未來的關(guān)連性有多少等等。 4.關(guān)聯(lián) (Association)和序列發(fā)現(xiàn)(Sequence Discovery)53? 關(guān)聯(lián)是要找出在某一事件或是資料中會同時出現(xiàn)的東西。?關(guān)聯(lián) (Association)主要是要找出下面這樣的信息:如果A是某一事件的一部份,則B也出現(xiàn)在該事件中的機(jī)率有 X%。關(guān)聯(lián)和序列發(fā)現(xiàn)54?例如:如果一個顧客買了低脂乳酪,那么這個顧客同時也買低脂牛奶的機(jī)率是 85%。?確定那些相關(guān)對象應(yīng)該放在一起。例如超市中相關(guān)之盥洗用品 (牙刷、牙膏和牙線 ),放在同一間貨架上。?在客戶行銷系統(tǒng)上,此種功能可以用來確認(rèn)交叉銷售 (crossselling)的機(jī)會,以設(shè)計出吸引人的產(chǎn)品群組。 序列發(fā)現(xiàn) (Sequence Discovery)與關(guān)聯(lián) (Association)關(guān)系55? 序列發(fā)現(xiàn) (Sequence Discovery)與關(guān)聯(lián) (Association)關(guān)系很密切,所不同的是序列發(fā)現(xiàn) (Sequence Discovery)中相關(guān)的對象是以時間區(qū)分開來?例如:如果做了 X手術(shù),則 Y病菌在手術(shù)后感染的機(jī)率是 45%。?例如:如果 A股票在某一天上漲 12%,而且當(dāng)天股市加權(quán)指數(shù)下降,則 B股票在兩天之內(nèi)上漲的機(jī)率是 68% )。 5. 描述 (Description)56? 描述的功能是對復(fù)雜的數(shù)據(jù)庫提供簡要的描述。最簡單的例子就是變量的均值和方差。? 這個功能的主要目的是為了在使用別的功能時對數(shù)據(jù)先有較好的了解。? 在建立任何模型之前先做數(shù)據(jù)描述的工作是十分重要的,因為這會告訴我們怎樣去建模。描述57? 許多的商業(yè)數(shù)據(jù)挖掘軟件包也提供有用的畫圖軟件來幫你對數(shù)據(jù)作可視化處理。? 另外,經(jīng)理們經(jīng)常使用更加復(fù)雜的采掘工具 (比如 market basket analysis, treebased models)來更好地理解數(shù)據(jù)和開發(fā)模型。實現(xiàn)數(shù)據(jù)挖掘的方法一些統(tǒng)計分析方法58?回歸分析?時間序列?判別分析?因子分析?聚類分析實現(xiàn)數(shù)據(jù)挖掘的方法59?粗集 (rough set)?模糊邏輯 (fuzzy logic)?人工神經(jīng)網(wǎng)絡(luò) (Neural Network)?決策樹理論 (Decision Trees)?規(guī)則歸納法 (Rules Induction)為基礎(chǔ)的方法等表 數(shù)據(jù)挖掘功能及常用的工具舉例功 能 采掘工具 舉 例 應(yīng) 用 舉 例Classification Neural works, logistic regression, treebased model
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1