freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘及其應(yīng)用-展示頁

2025-07-03 21:30本頁面
  

【正文】 師所擁有知識的有局限性,所以對于獲得知識的可信度就應(yīng)該打個折扣。盡管現(xiàn)代的數(shù)據(jù)庫技術(shù)使我們很容易存儲大量的數(shù)據(jù)流,但現(xiàn)在還沒有一種成熟的技術(shù)幫助我們分析、理解并使數(shù)據(jù)以可理解的信息表示出來。計算機(jī)技術(shù)和數(shù)據(jù)收集技術(shù)的進(jìn)步使人們可以從更加廣泛的范圍和幾年前不可想象的速度收集和存儲信息。過去幾年中,從數(shù)據(jù)庫中發(fā)現(xiàn)知識這一領(lǐng)域發(fā)展的很快。關(guān)鍵字:數(shù)據(jù)挖掘;分類方法;數(shù)據(jù)分析l 引言數(shù)據(jù)是知識的源泉。目前隨著新技術(shù)和新領(lǐng)域的不斷出現(xiàn),對分類方法提出了新的要求。分類技術(shù)是數(shù)據(jù)挖掘中應(yīng)用領(lǐng)域極其廣泛的重要技術(shù)之一?!稊?shù)據(jù)挖掘論文》數(shù)據(jù)挖掘分類方法及其應(yīng)用課程名稱:數(shù)據(jù)挖掘概念與技術(shù) 姓 名 學(xué) 號: 指導(dǎo)教師: 數(shù)據(jù)挖掘分類方法及其應(yīng)用作 者: 來 煜摘要:社會的發(fā)展進(jìn)入了網(wǎng)絡(luò)信息時代,各種形式的數(shù)據(jù)海量產(chǎn)生,在這些數(shù)據(jù)的背后隱藏這許多重要的信息,如何從這些數(shù)據(jù)中找出某種規(guī)律,發(fā)現(xiàn)有用信息,越來越受到關(guān)注。為了適應(yīng)信息處理新需求和社會發(fā)展各方面的迫切需要而發(fā)展起來一種新的信息分析技術(shù),這種局勢稱為數(shù)據(jù)挖掘。各種分類算法有其自身的優(yōu)劣,適合于不同的領(lǐng)域。但是,擁有大量的數(shù)據(jù)與擁有許多有用的知識完全是兩回事。廣闊的市場和研究利益促使這一領(lǐng)域的飛速發(fā)展。收集數(shù)據(jù)是為了得到信息,然而大量的數(shù)據(jù)本身并不意味信息。在過去,我們常用的知識獲取方法是由知識工程師把專家經(jīng)驗(yàn)知識經(jīng)過分析、篩選、比較、綜合、再提取出知識和規(guī)則。目前,傳統(tǒng)的知識獲取技術(shù)面對巨型數(shù)據(jù)倉庫無能為力,數(shù)據(jù)挖掘技術(shù)就應(yīng)運(yùn)而生。數(shù)據(jù)挖掘正是為了解決傳統(tǒng)分析方法的不足,并針對大規(guī)模數(shù)據(jù)的分析處理而出現(xiàn)的。目前,在需要處理大數(shù)據(jù)量的科研領(lǐng)域中,數(shù)據(jù)挖掘受到越來越多的關(guān)注,同時,在實(shí)際問題中,大量成功運(yùn)用數(shù)據(jù)挖掘的實(shí)例說明了數(shù)據(jù)挖掘?qū)茖W(xué)研究具有很大的促進(jìn)作用。分類技術(shù)是數(shù)據(jù)挖掘中應(yīng)用領(lǐng)域極其廣泛的重要技術(shù)之一。大部分技術(shù)都是使用學(xué)習(xí)算法確定分類模型,擬合輸入數(shù)據(jù)中樣本類別和屬性集之間的聯(lián)系,預(yù)測未知樣本的類別。1.?dāng)?shù)據(jù)挖掘概述數(shù)據(jù)挖掘又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn),是目前人工智能和數(shù)據(jù)庫領(lǐng)域研究的熱點(diǎn)問題,所謂數(shù)據(jù)挖掘是指從數(shù)據(jù)庫的大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價值的信息的非平凡過程。數(shù)據(jù)挖掘是通過分析每個數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù),主要有數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示3個步驟。分類技術(shù)是數(shù)據(jù)挖掘中應(yīng)用領(lǐng)域極其廣泛的重要技術(shù)之一。目前隨著新技術(shù)和新領(lǐng)域的不斷出現(xiàn),對分類方法提出了新的要求。下面對若干分類問題進(jìn)行簡要分析。決策樹是一個類似于流程圖的樹結(jié)構(gòu),其每個內(nèi)部節(jié)點(diǎn)表示在一個屬性上的測試,每個分枝代表一個測試輸出,每個葉節(jié)點(diǎn)代表類或類分布。開始時所有的訓(xùn)練樣本在根部,基于最高信息增益自頂向下遞歸地劃分?jǐn)?shù)據(jù)集,生成決策樹。如果葉結(jié)點(diǎn)上的樣本不屬于同一類,則根據(jù)大多數(shù)樣本的分類來確定葉結(jié)點(diǎn)的類別。剪枝方法可以剪去不可靠的分枝,提高分類速度和分類的準(zhǔn)確度。前者通過提前停止樹的構(gòu)造而對樹剪枝;后者在完全創(chuàng)建好的樹上剪去分枝。最為典型的決策樹學(xué)習(xí)算法是ID3,它采用自頂向下不回溯策略,能保證找到一個簡單的樹。在決策樹中,從根到樹葉的每條路徑以IF—THEN形式表示一條分類規(guī)則,沿著給定路徑上的每個屬性一值對形成規(guī)則前件的一個合取項(xiàng),葉結(jié)點(diǎn)包含類預(yù)測,形成規(guī)則后件。決策樹很擅長處理非數(shù)值型數(shù)據(jù),從決策樹中可以方便地提取分類規(guī)則。不足之處是ID3算法偏向于選擇屬性較多的屬性,而屬性較多的屬性往往不是最優(yōu)的屬性:學(xué)習(xí)簡單的邏輯表達(dá)能力較差。它們可以預(yù)測類成員關(guān)系的可能性,
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1