freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘標準規(guī)范工具和發(fā)展趨勢概述-資料下載頁

2025-01-01 15:56本頁面
  

【正文】 nts. ?UIMA: The UIMA (Unstructured Information Management Architecture) is a ponent framework for analyzing unstructured content such as text, audio and video – originally developed by IBM. ?Weka: A suite of machine learning software applications written in the Java programming language. 數(shù)據(jù) 挖掘工具 Commercial datamining software and applications ?IBM SPSS Modeler: data mining software provided by IBM. ?Microsoft Analysis Services: data mining software provided by Microsoft. ?Oracle Data Mining: data mining software by Oracle. ?SAS Enterprise Miner: data mining software provided by the SAS Institute. ?STATISTICA Data Miner: data mining software provided by StatSoft. 數(shù)據(jù) 挖掘工具 數(shù)據(jù) 挖掘工具 Main Features ?49 data preprocessing tools ?76 classification/regression algorithms ?8 clustering algorithms ?3 algorithms for finding association rules ?15 attribute/subset evaluators + 10 search algorithms for feature selection Main GUI ?“The Explorer” (exploratory data analysis) ?“The Experimenter” (experimental environment) ?“The KnowledgeFlow” (new process model inspired interface) 數(shù)據(jù) 挖掘工具 WEKA only deals with “flat” files 數(shù)據(jù)挖掘工具 relation heartdiseasesimplified attribute age numeric attribute sex { female, male} attribute chest_pain_type { typ_angina, asympt, non_anginal, atyp_angina} attribute cholesterol numeric attribute exercise_induced_angina { no, yes} attribute class { present, not_present} data 63,male,typ_angina,233,no,not_present 67,male,asympt,286,yes,present 67,male,asympt,229,yes,present 38,female,non_anginal,?,no,not_present ... Flat file in ARFF format 例子 1 :關(guān)聯(lián)規(guī)則分析 ? 數(shù)據(jù) 集: (菜單 Tools\Arffviewer) ? Pattern過濾: department\d; department\d\d;department\d\d\d ? 最小 支持 度: , 最小 置信 度: 數(shù)據(jù)挖掘工具 例子 2 :決策樹分類 ? 數(shù)據(jù)集: (菜單 Tools\Arffviewer) ? sepal length: 花萼長度 ? sepal width: 花萼寬度 ? Petal length: 花瓣 長度 ? Petal width: 花瓣寬度 ? Class: Iris setosa 山鳶尾; Iris versicolor變色 鳶尾; Iris virginica維吉尼亞 鳶尾 ? 分類器: J48 ? 10折交叉 驗證 ? 決策樹可視化 ? 評測 數(shù)據(jù)挖掘工具 本章內(nèi)容 數(shù)據(jù)挖掘標準與規(guī)范 數(shù)據(jù)挖掘工具 數(shù)據(jù)挖掘的 研究 趨勢 數(shù)據(jù)挖掘領(lǐng)域?qū)<以?ICDM2023列出了 10大挑戰(zhàn)性問題 1. 發(fā)展 統(tǒng)一的數(shù)據(jù)挖掘理論 2. 多維 的數(shù)據(jù)挖掘和高速流的數(shù)據(jù) 挖掘 ?具有可擴展性,支持 millions、 billions級維度的數(shù)據(jù)分類,支持超高速流數(shù)據(jù)的挖掘 3. 時序系列的數(shù)據(jù)挖掘 4. 從 復(fù)雜數(shù)據(jù)中的復(fù)雜知識的 挖掘 ?圖數(shù)據(jù) 挖掘 ?不滿足 (independent and identically distributed) 的數(shù)據(jù)、 異構(gòu) 數(shù)據(jù)、 相互關(guān)聯(lián) 的數(shù)據(jù)進行挖掘 數(shù)據(jù)挖掘的研究 趨勢 5. 網(wǎng)絡(luò)數(shù)據(jù)挖掘 ?Web、社會網(wǎng)絡(luò)、物理 網(wǎng)絡(luò) … 6. 分布式數(shù)據(jù)挖掘和多代理的數(shù)據(jù) 挖掘 ?物聯(lián)網(wǎng)數(shù)據(jù) ?多源數(shù)據(jù)關(guān)聯(lián)挖掘 7. 生物 和環(huán)境問題的數(shù)據(jù)挖掘 8. 相關(guān) 問題的數(shù)據(jù)挖掘 過程 ?如何實現(xiàn)挖掘過程的 自動化 數(shù)據(jù)挖掘的研究 趨勢
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1