freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計開題報告--數(shù)據(jù)挖掘在教學(xué)系統(tǒng)中的應(yīng)用-資料下載頁

2025-04-11 22:52本頁面
  

【正文】 對象逐步擴大到半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),這主要是指文本數(shù)據(jù)、圖像和視頻數(shù)據(jù),以及Web數(shù)據(jù)等。3. 數(shù)據(jù)挖掘過程 數(shù)據(jù)挖掘過程包括對問題的理解和提出、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評估、知識表示等過程,以上的過程不是一次完成的,其中某些步驟或者全過程可能要反復(fù)進行。 對問題的理解和提出:在開始數(shù)據(jù)挖掘之前,最基礎(chǔ)的工作就是理解數(shù)據(jù)和實際的業(yè)務(wù)問題,在這個基礎(chǔ)之上提出問題,對目標(biāo)作出明確的定義。 數(shù)據(jù)收集:廣泛收集用戶的各種信息,建立數(shù)據(jù)庫與數(shù)據(jù)表,為數(shù)據(jù)挖掘做準(zhǔn)備。 數(shù)據(jù)處理:對收集的信息進行如“去噪”等處理,確保數(shù)據(jù)能夠真實反映待要挖掘的對象。 數(shù)據(jù)變換:將經(jīng)過“去噪”的數(shù)據(jù)進行一定的格式轉(zhuǎn)換,使其適應(yīng)數(shù)據(jù)挖掘系統(tǒng)或挖掘軟件的處理要求。 數(shù)據(jù)挖掘:可以單獨利用也可以綜合利用各種數(shù)據(jù)挖掘方法對數(shù)據(jù)進行分析,挖掘用戶所需要的各種規(guī)則、趨勢、類別、模型等。 模式評估:對發(fā)現(xiàn)的規(guī)則、趨勢、類別、模型進行評估,從而保證發(fā)現(xiàn)的模式的正確性。 知識表示:將挖掘結(jié)果以可視化的形式展現(xiàn)在用戶面前。 4.?dāng)?shù)據(jù)挖掘任務(wù)數(shù)據(jù)挖掘任務(wù)有6項:關(guān)聯(lián)分析、時序模式、聚類、分類、偏差檢測、預(yù)測。關(guān)聯(lián)分析是從數(shù)據(jù)庫中發(fā)現(xiàn)知識的一類重要方法。若兩個或多個數(shù)據(jù)項的取值之問重復(fù)出現(xiàn)且概率很高時.就存在某種關(guān)聯(lián),可以建立起這些數(shù)據(jù)項的關(guān)聯(lián)規(guī)則。例如,買面包的顧客有90%的人還買牛奶,這是一條關(guān)聯(lián)規(guī)則。若商店中將面包和牛奶放在一起銷售.將會提高它們的{=『l=i量。時序模式通過時問序列搜索出重復(fù)發(fā)生概率較高的模式。聚類數(shù)據(jù)庫中的數(shù)據(jù)可以劃分為一系列有意義的子集.即類。在同一類別巾.個體之問的距離較小,而不同類別的個體之間的距離偏大。聚類增強了人們對客觀現(xiàn)實的認(rèn)識.即通過聚類建立宏觀概念。回歸分析是統(tǒng)計分析中應(yīng)用最多、最廣泛的一個分支,它起源于19世紀(jì)高斯的最dx乘法,2O世紀(jì)初形成了回歸分析。隨著新的想法和技巧不斷被加入,它充滿了活力。5.?dāng)?shù)據(jù)挖掘分類數(shù)據(jù)挖掘涉及多個學(xué)科方向,主要包括:數(shù)據(jù)庫、統(tǒng)計學(xué)和機器學(xué)習(xí)等。數(shù)據(jù)挖掘可按數(shù)據(jù)庫類型、挖掘?qū)ο?、挖掘任?wù)、挖掘方法與技術(shù)以及應(yīng)用等幾方面進行分類。按數(shù)據(jù)庫類型分類:關(guān)系數(shù)據(jù)挖掘、模糊數(shù)據(jù)挖掘、歷史數(shù)據(jù)挖掘、空間數(shù)據(jù)挖掘等多種不同數(shù)據(jù)庫的數(shù)據(jù)挖掘類型。按數(shù)據(jù)挖掘?qū)ο蠓诸悾何谋緮?shù)據(jù)挖掘、多媒體數(shù)據(jù)挖掘、Web數(shù)據(jù)挖掘。按數(shù)據(jù)挖掘的任務(wù)有:關(guān)聯(lián)分析、時序模式、聚類、分類、偏差檢測、預(yù)測等。按數(shù)據(jù)挖掘方法和技術(shù)分類:歸納學(xué)習(xí)類、仿生物技術(shù)類、公式發(fā)現(xiàn)類、統(tǒng)計分析類、模糊數(shù)學(xué)類、可視化技術(shù)類。6. 數(shù)據(jù)挖掘的主要功能 概念/類描述、特征化和區(qū)分:對每個類的匯總、簡潔、精確的描述可以通過數(shù)據(jù)特征化、數(shù)據(jù)區(qū)分和數(shù)據(jù)比較來實現(xiàn)。數(shù)據(jù)特征化是指目標(biāo)類數(shù)據(jù)的一般特征或特征的匯總,如一年的成績匯總;數(shù)據(jù)區(qū)分是將目標(biāo)類對象的一般特征與一個或多個對比類對象的一般性比較,如A學(xué)校和B學(xué)校的比較。關(guān)聯(lián)分析:目的在于發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,這些規(guī)則揭示屬性與屬性值在數(shù)據(jù)集中一起出現(xiàn)的條件。這種關(guān)聯(lián)規(guī)則可以是單維關(guān)聯(lián)規(guī)則或多維關(guān)聯(lián)規(guī)則。 分類與預(yù)測:利用某種數(shù)據(jù)挖掘算法的某種規(guī)則自動對海量數(shù)據(jù)進行分類,其間較少有人工干預(yù),目的是為數(shù)據(jù)挖掘基礎(chǔ)上的預(yù)測服務(wù)。 聚類分析:聚類是根據(jù)最大化類內(nèi)的相似性、最小化類間的相似性原則對海量數(shù)據(jù)進行聚類或分組,從而產(chǎn)生屬性相近的各個類。 孤立點分析:所謂孤立點,是指數(shù)據(jù)集合中與多數(shù)數(shù)據(jù)的特征或行為完全不一致的數(shù)據(jù)。在最初的挖掘算法中,人們總是將孤立點從數(shù)據(jù)集合中刪除,以保證數(shù)據(jù)的純潔性。然而,刪除孤立點可能會導(dǎo)致忽略某些非常有用的特殊規(guī)則,因而對孤立點需作特殊處理。 演變分析:可以根據(jù)數(shù)據(jù)的特征對數(shù)據(jù)的發(fā)展變化作出相應(yīng)的預(yù)測與分析。主要應(yīng)用于對時間序列數(shù)據(jù)的分析、序列或周期模式匹配和基于類似性的數(shù)據(jù)分析 畢 業(yè) 設(shè) 計(論 文)開 題 報 告指導(dǎo)教師意見:1.對“文獻綜述”的評語:2.對本課題的深度、廣度及工作量的意見和對設(shè)計(論文)結(jié)果的預(yù)測: 指導(dǎo)教師: 年 月 日所在專業(yè)審查意見: 負(fù)責(zé)人: 年 月 日
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1