【摘要】2021/6/141數(shù)據(jù)預(yù)處理2021年4月27日2021/6/142數(shù)據(jù)預(yù)處理的原因?正確性(Correctness)?一致性(Consistency)?完整性(Completeness)?可靠性(Reliability)數(shù)據(jù)質(zhì)量的含義2021/6
2025-05-19 11:37
【摘要】2020/9/151數(shù)據(jù)預(yù)處理2020年4月27日2020/9/152數(shù)據(jù)預(yù)處理的原因?正確性(Correctness)?一致性(Consistency)?完整性(Completeness)?可靠性(Reliability)數(shù)據(jù)質(zhì)量的含義2020/9
2025-08-05 09:43
【摘要】1第2章:數(shù)據(jù)預(yù)處理?為什么預(yù)處理數(shù)據(jù)??數(shù)據(jù)清理?數(shù)據(jù)集成?數(shù)據(jù)歸約?離散化和概念分層產(chǎn)生?小結(jié)2為什么數(shù)據(jù)預(yù)處理??現(xiàn)實世界中的數(shù)據(jù)是臟的?不完全:缺少屬性值,缺少某些有趣的屬性,或僅包含聚集數(shù)據(jù)?例,occupation=―‖?噪音:包含錯誤或孤
2024-10-22 19:44
【摘要】1、數(shù)據(jù)預(yù)處理的意義2、數(shù)據(jù)清理3、數(shù)據(jù)集成與變換4、數(shù)據(jù)歸約第三章數(shù)據(jù)預(yù)處理1、數(shù)據(jù)質(zhì)量問題:?噪聲數(shù)據(jù)?空缺數(shù)據(jù)?不一致數(shù)據(jù)第一節(jié)數(shù)據(jù)預(yù)處理的意義預(yù)處理數(shù)據(jù)提高數(shù)據(jù)質(zhì)量提高挖掘結(jié)果2、數(shù)據(jù)預(yù)處理的基本方法:?數(shù)據(jù)清理
2025-03-11 09:10
【摘要】數(shù)據(jù)挖掘教科書和參考書?教科書?數(shù)據(jù)挖掘:概念與技術(shù),JiaweiHan和MichelineKamber著,機械工業(yè)出版社(2021)?參考書?數(shù)據(jù)挖掘原理,DavidHand,HeikkiMannila和PadhraicSmyth著,機械工業(yè)出版社(2021)中文版英文影
2025-01-20 12:37
【摘要】第二篇地球化學(xué)數(shù)據(jù)處理第四章地球化學(xué)數(shù)據(jù)分析?第一節(jié)地球化學(xué)數(shù)據(jù)的誤差分析一、誤差的來源1.取樣產(chǎn)生誤差取樣產(chǎn)生的誤差是影響地球化學(xué)數(shù)據(jù)質(zhì)量的最重要的也是最不易被發(fā)現(xiàn)的誤差。產(chǎn)生這種誤差的途徑可能有:1)錯誤地將同一空間產(chǎn)出的不同單元作為同一單元。2)沒有正確確定不同空間的巖石是同一系列的同一單元還
2025-01-11 16:11
【摘要】第2課數(shù)據(jù)預(yù)處理技術(shù)徐從富,副教授浙江大學(xué)人工智能研究所浙江大學(xué)本科生《數(shù)據(jù)挖掘?qū)д摗氛n件內(nèi)容提綱?Whypreprocessthedata??Datacleaning?Dataintegrationandtransformation?Datareduction?Discretizati
2024-10-15 13:44
【摘要】2020-11-6數(shù)據(jù)挖掘:概念和技術(shù)1數(shù)據(jù)挖掘:概念和技術(shù)—Chapter6—?張曉輝復(fù)旦大學(xué)(國際)數(shù)據(jù)庫研究中心2020-11-6數(shù)據(jù)挖掘:概念和技術(shù)2第6章:從大數(shù)據(jù)庫中挖掘關(guān)聯(lián)規(guī)則?關(guān)聯(lián)規(guī)則挖掘?從交易數(shù)據(jù)庫中挖掘一維的布爾形關(guān)聯(lián)規(guī)則?從交易數(shù)據(jù)庫中
2024-09-04 09:03
【摘要】任課教師評語:簽名:年月日南京理工大學(xué)課程考核課題課程名稱:數(shù)據(jù)挖掘與處理
2025-01-09 06:19
【摘要】數(shù)據(jù)挖掘原語、語言和系統(tǒng)結(jié)構(gòu)為什么要數(shù)據(jù)挖掘原語和語言??一個完全自動(不需要人為干預(yù)或指導(dǎo))的數(shù)據(jù)挖掘機器只可能是“一只瘋了的怪獸”。?會產(chǎn)生大量模式(重新把知識淹沒)?會涵蓋所有數(shù)據(jù),使得挖掘效率低下?大部分有價值的模式集可能被忽略?挖掘出的模式可能難以理解,缺乏有效性、新穎性和實用性——令人不感興趣。?沒有
2025-05-19 11:33
【摘要】姜素芳第7章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘本章學(xué)習(xí)目標了解數(shù)據(jù)倉庫的概念及特點了解數(shù)據(jù)挖掘的應(yīng)用和功能熟悉數(shù)據(jù)挖掘的幾種主要技術(shù)姜素芳第7章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘數(shù)據(jù)倉庫概述數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘的主要技術(shù)數(shù)據(jù)倉庫和挖掘?qū)RM的影響姜素芳第7章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘
2025-05-19 00:05
【摘要】引言?數(shù)據(jù)是知識的源泉。但是,擁有大量的數(shù)據(jù)與擁有許多有用的知識完全是兩回事。過去幾年中,從數(shù)據(jù)庫中發(fā)現(xiàn)知識這一領(lǐng)域發(fā)展的很快。廣闊的市場和研究利益促使這一領(lǐng)域的飛速發(fā)展。計算機技術(shù)和數(shù)據(jù)收集技術(shù)的進步使人們可以從更加廣泛的范圍和幾年前不可想象的速度收集和存儲信息。收集數(shù)據(jù)是為了得到信息,然而大量的數(shù)據(jù)本身并不意味信息。盡管現(xiàn)代的數(shù)據(jù)庫技術(shù)使我們很容易
2025-05-19 00:04
【摘要】SPSS19統(tǒng)計分析使用教程電子工業(yè)出版社1第二章統(tǒng)計數(shù)據(jù)的收集與預(yù)處理SPSS19統(tǒng)計分析使用教程
2024-08-23 17:24
【摘要】數(shù)據(jù)挖掘?qū)д摳=ㄡt(yī)科大學(xué)鄭偉成支持向量機?支持向量機(SupportVectorMachine,SVM)是CorinnaCortes和Vapnik等亍1995年首先提出的,它在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,幵能夠推廣應(yīng)用到函數(shù)擬合等其他機器學(xué)習(xí)問題中。?在機器學(xué)習(xí)中,支持向量機
2025-07-22 17:51
【摘要】習(xí)題一?假定用于分析的數(shù)據(jù)包含屬性age值(以遞增序)是:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70.?(a)使用min-max規(guī)范化將age值35變換到[,]區(qū)間。