freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘概念與技術(shù)數(shù)據(jù)預(yù)處理-免費(fèi)閱讀

  

【正文】 Prediction ), clustering,還未包含 characterization, discrimination , association modeling 等。customer表的 ine,age屬性。 ? 系統(tǒng)應(yīng)具備自動(dòng)選取相關(guān)屬性的機(jī)制,比如通過(guò)評(píng)估各屬性與特定操作的相關(guān)程度。 ? CRISPDM (CRossIndustry Standard Process for Data Mining) ? 是一個(gè)國(guó)際性項(xiàng)目,包含數(shù)據(jù)庫(kù)公司,數(shù)據(jù)倉(cāng)庫(kù)公司,用戶(hù)公司(user panies) ? 目的在于提供有效數(shù)據(jù)挖掘的平臺(tái)和過(guò)程結(jié)構(gòu) (process structure) ? 強(qiáng)調(diào)運(yùn)用數(shù)據(jù)挖掘技術(shù)來(lái)解決商業(yè)問(wèn)題 挖掘原語(yǔ),語(yǔ)言和體系結(jié)構(gòu) ? 數(shù)據(jù)挖掘原語(yǔ) ? 數(shù)據(jù)挖掘語(yǔ)言 ? 數(shù)據(jù)挖掘系統(tǒng)體系結(jié)構(gòu) ? 總結(jié) 數(shù)據(jù)挖掘系統(tǒng)體系結(jié)構(gòu) ? 數(shù)據(jù)挖掘系統(tǒng)與 DB/DW 系統(tǒng)的耦合程度 ? 零耦合 —用文件作為數(shù)據(jù)源和存放結(jié)果數(shù)據(jù) ,不推薦 ? 松散耦合 ? 用 DB/DW作數(shù)據(jù)源,查詢(xún)結(jié)果寫(xiě)入文件或 DB/DW;但不使用DB/DW的提供的數(shù)據(jù)結(jié)構(gòu)和查詢(xún)優(yōu)化方法。 Virmani’99) ? MineRule (Meo Psaila and Ceri’96) ? Query flocks 基于 Datalog 語(yǔ)法 (Tsur et al’98) ? OLEDB for DM (Microsoft’2020) ? 和 OLE DB, OLE DB for OLAP一起致力于 DB,DW,DM的標(biāo)準(zhǔn)化 ? 到 2020年 3月止,已經(jīng)完成了 predictive modeling( classification amp。 ? 方法 ? 由用戶(hù)和專(zhuān)家在模式級(jí)顯式的說(shuō)明屬性的部分序 ? 通過(guò)顯式的數(shù)據(jù)分組說(shuō)明分層結(jié)構(gòu)的一部分 ? 說(shuō)明屬性集,但不說(shuō)明他們的偏序 ? 只說(shuō)明部分的屬性集 挖掘原語(yǔ),語(yǔ)言和體系結(jié)構(gòu) ? 數(shù)據(jù)挖掘原語(yǔ) ? 數(shù)據(jù)挖掘語(yǔ)言 ? 數(shù)據(jù)挖掘系統(tǒng)體系結(jié)構(gòu) ? 總結(jié) 數(shù)據(jù)挖掘原語(yǔ)劃分 ? 挖掘相關(guān)的數(shù)據(jù) ? 挖掘的知識(shí)類(lèi)型 ? 背景知識(shí) ? 模式的興趣度量 ? 結(jié)果的表示與可視化 任務(wù)相關(guān)數(shù)據(jù) ? 數(shù)據(jù)庫(kù)(或數(shù)據(jù)倉(cāng)庫(kù))名稱(chēng) ? 例如: AllElectronics_db ? 數(shù)據(jù)庫(kù)表(或數(shù)據(jù)倉(cāng)庫(kù)的立方體) ? 例如:表 item,customer,purchase,items_sold ? 數(shù)據(jù)選擇條件 ? 例如:選取本年度加拿大地區(qū)購(gòu)買(mǎi)商品的數(shù)據(jù) ? 選取條件可能在概念上層次高于 DB/DW的數(shù)據(jù) ? 如: ” type=home entertainment”, DB/DW中數(shù)據(jù) {tv,cd player,vcr} ? 有關(guān)的屬性(或維) ? 例如: item表的 name,price屬性 。 ? 數(shù)據(jù)分組的標(biāo)準(zhǔn) ? 例如:根據(jù)日期進(jìn)行分組 挖掘的知識(shí)類(lèi)型 ? 描述 (characterization) ? 區(qū)別分析 (discrimination) ? 關(guān)聯(lián) (association) ? 分類(lèi) /預(yù)測(cè) (classification/prediction) ? 聚類(lèi) (clustering) ? 例 : 用戶(hù)如果想發(fā)掘 AllElectronics數(shù)據(jù)庫(kù)中用戶(hù)的購(gòu)買(mǎi)習(xí)慣,可能會(huì)選擇下面關(guān)聯(lián)規(guī)則: P(X:customer,W)^Q(X,Y)=buys(X,Z) X是 customer表的主鍵, P,Q是謂詞變量 (在相關(guān)數(shù)據(jù)中定義 ), W,Y,Z是目標(biāo)變量。 ? 半緊耦合 —提升挖掘系統(tǒng)性能 ? 部分挖掘原語(yǔ)在 DB/DW中實(shí)現(xiàn),如 sorting, indexing, aggregation , histogram analysis, multiway join, preputation of some statistic functions such as count ,sum,max,min,standard deviation.
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1