freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

外文翻譯----什么是數(shù)據(jù)挖掘-文庫吧資料

2025-05-22 11:45本頁面
  

【正文】 術(shù)語是數(shù)據(jù)挖掘。 我們同意數(shù)據(jù)挖掘是知識發(fā)現(xiàn)過程中的一個步驟。把有趣的模式提供給用戶,或作為新的知識存放在知識庫中。知識發(fā)現(xiàn)的過程由以下步驟組成: 1)數(shù)據(jù)清理:消除噪聲或不一致數(shù)據(jù), 2)數(shù)據(jù)集成:多種數(shù)據(jù)可以組合在一起, 3)數(shù)據(jù)選擇:從數(shù)據(jù)庫中檢索與分析任務相關(guān)的數(shù)據(jù), 4)數(shù)據(jù)變換:數(shù)據(jù)變換或統(tǒng)一成適合挖掘的形式,如通過匯總或聚集操作, 5)數(shù)據(jù)挖掘:基本步驟,使用智能方法提取數(shù)據(jù)模式, 6)模式評估:根據(jù)某種興趣 度度量,識別表示知識的真正有趣的模式, 7)知識表示:使用可視化和知識表示技術(shù),向用戶提供挖掘的知識。 許多人把數(shù)據(jù)挖掘視為另一個常用的術(shù)語 — 數(shù)據(jù)庫中的知識發(fā)現(xiàn)或 KDD 的同義詞。這樣,這種用詞不當攜帶了“數(shù)據(jù)”和“挖掘”,就成了流行的選擇?!爸R挖掘”是一個短術(shù)語,可能它不能反映出從大量數(shù)據(jù)中挖掘的意思。注意,從礦石或砂子中挖掘黃金叫做黃金挖掘,而不是叫做礦石挖掘。什么是數(shù)據(jù)挖掘? 簡單地說,數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中提取或“挖掘”知識。該術(shù)語實際上有點兒用詞不當。這樣,數(shù)據(jù)挖掘應當更準確地命名為“從數(shù)據(jù)中挖掘知識”,不幸的是這個有點兒長。畢竟,挖掘是一個很生動的術(shù)語,它抓住了從大量的、未加工的材料中發(fā)現(xiàn)少量金塊這一過程的特點。還有一些術(shù)語,具有和數(shù)據(jù)挖掘類似但稍有不同的含義,如數(shù)據(jù) 庫中的知識挖掘、知識提取、數(shù)據(jù) /模式分析、數(shù)據(jù)考古和數(shù)據(jù)捕撈。而另一些人只是把數(shù)據(jù)挖掘視為數(shù)據(jù)庫中知識發(fā)現(xiàn)過程的一個基本步驟。 數(shù)據(jù)挖掘的步驟可以與用戶或知識庫進行交互。注意,根據(jù)這種觀點,數(shù)據(jù)挖掘只是整個過程中的一個步驟,盡管是最重要的一步,因為它發(fā)現(xiàn)隱藏的模式。然而,在產(chǎn)業(yè)界、媒體和數(shù)據(jù)庫研究界,“數(shù)據(jù)挖掘”比那個較長的術(shù)語“數(shù)據(jù)庫中知識發(fā)現(xiàn)”更為流行。我們采用數(shù)據(jù)挖掘的廣義觀點:數(shù)據(jù)挖掘是 從存放在數(shù)據(jù)庫中或其他信息庫中的大量數(shù)據(jù)中挖掘出有趣知識的過程??梢栽跀?shù)據(jù)上進行數(shù)據(jù)清理和集成。 知識庫:這是領(lǐng)域知識,用于指導搜索,或評估結(jié)果模式的興趣度。用戶確信方面的知識也可以包含在內(nèi)。領(lǐng)域知識的其他例子有興趣度限制或閾值和元數(shù)據(jù)(例如,描述來自多個異種數(shù)據(jù)源的數(shù)據(jù))。 模式評估模塊:通常,此成分使用興趣度度量,并與數(shù)據(jù)挖掘模塊交互,以便將搜索聚集在有趣的模式上。模式評估模塊也可以與挖掘模塊集成在一起,這依賴于所用的數(shù)據(jù)挖掘方法的實現(xiàn)。 圖形用戶界面:本模塊在用戶和數(shù)據(jù)挖掘系統(tǒng)之間進行通信,允許用戶與系統(tǒng)進行交互,指定數(shù)據(jù)挖掘查詢或任務,提供信息、幫助搜索聚焦,根據(jù)數(shù)據(jù)挖掘的中間結(jié)果進行探索式數(shù)據(jù)挖掘。 從數(shù)據(jù)倉庫觀點,數(shù)據(jù)挖掘可以看作聯(lián)機分析處理( OLAP)的高級階段。 盡管市場上已有許多“數(shù)據(jù)挖掘系統(tǒng)”,但是并非所有系統(tǒng)的都能進行真正的數(shù) 據(jù)挖掘。一個系統(tǒng)只能夠進行數(shù)據(jù)或信息檢索,包括在大型數(shù)據(jù)庫中找出聚集的值或回答演繹查詢,應當歸類為數(shù)據(jù)庫系統(tǒng),或信息檢索系統(tǒng),或演繹數(shù)據(jù)庫系統(tǒng)。在本書討論數(shù)據(jù)挖掘的時候,我們采用數(shù)據(jù)庫的觀點。一個算法是可伸縮的,如果給定內(nèi)存和磁盤空間等可利用的系統(tǒng)資源,其運行時間應當隨數(shù)據(jù)庫大小線性增加。發(fā)現(xiàn)的知識可以用于決策、過程控制、信息管理、查詢處理,等等。 數(shù)據(jù)挖掘是一個交叉學科的領(lǐng)域,受到多個學科的影響,包括數(shù)據(jù)庫系統(tǒng)、統(tǒng)計學、機器學習、可視化和信息科學。依賴于所挖掘的數(shù)據(jù)類型或給定的數(shù)據(jù)挖掘應用,數(shù)據(jù)挖掘系統(tǒng)也可以集成空間數(shù)據(jù)分析、信息檢索、模式識別、圖形分析、信號處理、計算機圖形學、 Web 技術(shù)、經(jīng)濟、商業(yè)、生物信息學或心理學領(lǐng)域的技術(shù)。這樣,就需要對數(shù)據(jù)挖掘系統(tǒng)給出一個清楚的分類。根據(jù)不同的標準,數(shù)據(jù)挖掘系統(tǒng)可以有如下分類: 1)根據(jù)挖掘的數(shù)據(jù)庫類 型進行分類。數(shù)據(jù)庫系統(tǒng)本身可以根據(jù)不同的標準(如數(shù)據(jù)模型,或數(shù)據(jù)或所涉及的應用類型)來分類,每一類都可能需要自己的數(shù)據(jù)挖掘技術(shù)。 例如,如果是根據(jù)數(shù)據(jù)模型來分類,我們可以有關(guān)系的、事務的、面向?qū)ο蟮摹ο?關(guān)系的或數(shù)據(jù)倉庫的數(shù)據(jù)挖掘系統(tǒng)。 2)根據(jù)挖掘的知識類型進行分類。即根據(jù)數(shù)據(jù)挖掘的功能,如特征化、區(qū)分、關(guān)聯(lián)、分類聚類、孤立點分析和演變分析、偏差分析、類似性分析等進行分類。 此外,數(shù)據(jù)挖掘系統(tǒng)也可以根據(jù)所挖掘的知識的粒度或抽象層進行區(qū)分,包括概化知識(在高抽象層),原始層知識(在原始數(shù)據(jù)層),或多層知識(考慮若干抽象層)。 數(shù)據(jù)挖掘系統(tǒng)還可以分類為挖掘數(shù)據(jù)規(guī)則性(通常出現(xiàn)的模式)和數(shù)據(jù)不規(guī)則性(如異?;蚬铝Ⅻc)這幾種。這些方法也能幫助檢測孤立點。 數(shù)據(jù)挖掘系統(tǒng)也可以根據(jù)所用的數(shù)據(jù)挖掘技術(shù)進行分類。復雜的數(shù)據(jù)挖掘系統(tǒng)通常采用多種數(shù)據(jù)挖掘技術(shù),或是采用有效的、集成的技術(shù),結(jié)合一些方法的優(yōu)點。 data cleaning: to remove noise or irrelevant data, data selection : where data relevant to the analysis task are retrieved from the database, data mining: an essential process where intelligent methods are applied in order to extract data patterns, knowledge presentation: where visualization and knowledge representation techniques are used to present the mined knowledge to the user . The data mining step may interact with the user or a knowledge base. The interesting patterns are presented to the user, and may be stored as new knowledge in the knowledge base. Note that according to this view, data mining is only one step in the entire process, albeit an essential one since it uncovers hidden patterns for evaluation. We agree that data mining is a knowledge discovery pr
點擊復制文檔內(nèi)容
畢業(yè)設(shè)計相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1