freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘08分類和預(yù)測-文庫吧

2025-04-19 03:06 本頁面


【正文】 類 ? 對于預(yù)測,沒有“類標(biāo)號屬性” ? 要預(yù)測的屬性是連續(xù)值,而不是離散值,該屬性可簡稱“預(yù)測屬性” ? . 銀行貸款員需要預(yù)測貸給某個顧客多少錢是安全的 ? 預(yù)測器可以看作一個映射或函數(shù) y=f(X) ? 其中 X是輸入; y是輸出,是一個連續(xù)或有序的值 ? 與分類類似,準(zhǔn)確率的預(yù)測,也要使用單獨的測試集 準(zhǔn)備分類和預(yù)測的數(shù)據(jù) ? 通過對數(shù)據(jù)進(jìn)行預(yù)處理,可以提高分類和預(yù)測過程的準(zhǔn)確性、有效性和可伸縮性 ? 數(shù)據(jù)清理 ? 消除或減少噪聲,處理空缺值,從而減少學(xué)習(xí)時的混亂 ? 相關(guān)分析 ? 數(shù)據(jù)中的有些屬性可能與當(dāng)前任務(wù)不相關(guān);也有些屬性可能是冗余的;刪除這些屬性可以加快學(xué)習(xí)步驟,使學(xué)習(xí)結(jié)果更精確 ? 數(shù)據(jù)變換與歸約 ? 數(shù)據(jù)可以通過規(guī)范化進(jìn)行變換,將所給屬性的所有值按比例進(jìn)行縮放,使其落入一個較小的指定區(qū)間,例 [, ]( ANN和設(shè)計距離的度量方法中常用) ? 可以將數(shù)據(jù)概化到較高層概念 比較分類方法 ? 使用下列標(biāo)準(zhǔn)比較分類和預(yù)測方法 ? 預(yù)測的準(zhǔn)確率:模型正確預(yù)測新數(shù)據(jù)的類編號的能力 ? 速度:產(chǎn)生和使用模型的計算花銷 ? 健壯性:給定噪聲數(shù)據(jù)或有空缺值的數(shù)據(jù),模型正確預(yù)測的能力 ? 可伸縮性:對大量數(shù)據(jù),有效的構(gòu)建分類器或預(yù)測器的能力 ? 可解釋性:學(xué)習(xí)模型提供的理解和洞察的層次 用決策樹歸納分類 (1) ? 什么是決策樹? ? 類似于流程圖的樹結(jié)構(gòu) ? 每個內(nèi)部節(jié)點表示在一個屬性上的測試 ? 每個分枝代表一個測試輸出 ? 每個樹葉節(jié)點存放一個類編號 age? student? credit rating? no yes fair excellent youth senior no no yes yes yes Middle aged 決策樹:Buys_puter 用決策樹歸納分類 (2) ? 使用決策樹分類 ? 給定一個類標(biāo)號未知的元組 X,在決策樹上測試元組的屬性值,跟蹤一條由根到葉節(jié)點的路徑,葉節(jié)點存放該元組的類預(yù)測。 ? 決策樹容易轉(zhuǎn)換為分類規(guī)則 ? 決策樹的生成由兩個階段組成 ? 決策樹構(gòu)建 ? 使用屬性選擇度量來選擇將元組最好的劃分為不同的類的屬性 ? 遞歸的通過選定的屬性,來劃分樣本 (必須是離散值) ? 樹剪枝 ? 決策樹建立時,許多分枝反映的是訓(xùn)練數(shù)據(jù)中的噪聲和離群點點,樹剪枝試圖識別并剪去這種分枝,以提高對未知數(shù)據(jù)分類的準(zhǔn)確性 決策樹歸納策略 (1) ? 輸入 ? 數(shù)據(jù)劃分 D是訓(xùn)練元組和對應(yīng)類標(biāo)號的集合 ? attribute_list,候選屬性的集合 ? Attribute_selection_method,指定選擇屬性的啟發(fā)性過程 算法步驟 1. 樹以代表訓(xùn)練樣本的單個節(jié)點( N)開始 2. 如果樣本都在同一個類,則該節(jié)點成為樹葉,并用該類標(biāo)記 3. 否則,算法調(diào)用 Attribute_selection_method,選擇能夠最好的將樣本分類的屬性;確定“分裂準(zhǔn)則”,指出“分裂點”或“分裂子集”。 決策樹歸納策略 (2) 4. 對測試屬性每個已知的值,創(chuàng)建一個分支,并以此劃分元組 5. 算法使用同樣的過程,遞歸的形成每個劃分上的元組決策樹。一旦一個屬性出現(xiàn)在一個節(jié)點上,就不在該節(jié)點的任何子節(jié)點上出現(xiàn) 6. 遞歸劃分步驟停止的條件 劃分 D(在 N節(jié)點提供)的所有元組屬于同一類 沒有剩余屬性可以用來進(jìn)一步劃分元組 ——使用多數(shù)表決 沒有剩余的樣本 給定分支沒有元組,則以 D中多數(shù)類創(chuàng)建一個樹葉 屬性選擇度量 ? 屬性選擇度量是一種選擇分裂準(zhǔn)則,將給定類標(biāo)號的訓(xùn)練元組最好的進(jìn)行
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1