freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘08分類和預(yù)測(已修改)

2025-05-25 03:06 本頁面
 

【正文】 分類和預(yù)測 分類 VS. 預(yù)測 ? 分類和預(yù)測是兩種數(shù)據(jù)分析形式,用于提取描述重要數(shù)據(jù)類或預(yù)測未來的數(shù)據(jù)趨勢 的模型 ? 分類: ? 預(yù)測類對象的分類標(biāo)號(或離散值) ? 根據(jù)訓(xùn)練數(shù)據(jù)集和類標(biāo)號屬性,構(gòu)建模型來分類現(xiàn)有數(shù)據(jù),并用來分類新數(shù)據(jù) ? 預(yù)測: ? 建立連續(xù)函數(shù)值模型 ? 比如預(yù)測空缺值,或者預(yù)測顧客在計(jì)算機(jī)設(shè)備上的花費(fèi) ? 典型應(yīng)用 ? 欺詐檢測、市場定位、性能預(yù)測、醫(yī)療診斷 分類和預(yù)測 示例 ? 分類 ? 銀行貸款員需要分析數(shù)據(jù),來弄清哪些貸款申請者是安全的,哪些是有風(fēng)險(xiǎn)的(將貸款申請者分為“安全”和“有風(fēng)險(xiǎn)”兩類) ? 我們需要構(gòu)造一個(gè)分類器來預(yù)測類屬編號,比如預(yù)測顧客屬類 ? 預(yù)測 ? 銀行貸款員需要預(yù)測貸給某個(gè)顧客多少錢是安全的 ? 構(gòu)造一個(gè)預(yù)測器,預(yù)測一個(gè)連續(xù)值函數(shù)或有序值,常用方法是回歸分析 數(shù)據(jù)分類 ——一個(gè)兩步過程 (1) ? 第一步,也成為 學(xué)習(xí)步 ,目標(biāo)是建立描述預(yù)先定義的數(shù)據(jù)類或概念集的分類器 ? 分類算法通過分析或從訓(xùn)練集“學(xué)習(xí)”來構(gòu)造分類器。 ? 訓(xùn)練集由數(shù)據(jù)庫元組(用 n維屬性向量表示)和他們相對應(yīng)的類編號組成;假定每個(gè)元組屬于一個(gè)預(yù)定義的類 ? 訓(xùn)練元組 :訓(xùn)練數(shù)據(jù)集中的單個(gè)元組 ? 學(xué)習(xí)模型可以用分類規(guī)則、決策樹或數(shù)學(xué)公式的形式提供 數(shù)據(jù)分類 ——一個(gè)兩步過程 (2) ? 第二步,使用模型,對將來的或未知的對象進(jìn)行分類 ? 首先評估模型的預(yù)測準(zhǔn)確率 ? 對每個(gè)測試樣本,將已知的類標(biāo)號和該樣本的學(xué)習(xí)模型類預(yù)測比較 ? 模型在給定測試集上的準(zhǔn)確率是正確被模型分類的測試樣本的百分比 ? 測試集要獨(dú)立于訓(xùn)練樣本集,否則會(huì)出現(xiàn)“過分?jǐn)M合”的情況 第一步 ——建立模型 訓(xùn)練數(shù) 據(jù)集 N A M E RANK Y E A R S T E N U R E DM ik e A s s is t a n t P r o f 3 noM a r y A s s is t a n t P r o f 7 y e sB il l P r o f e s s o r 2 y e sJ im A s s o c ia t e P r o f 7 y e sD a v e A s s is t a n t P r o f 6 noA n n e A s s o c ia t e P r o f 3 no分類算法 IF rank = ‘professor’ OR years 6 THEN tenured = ‘yes’ 分類規(guī)則 第二步 ——用模型進(jìn)行分類 分類規(guī)則 測試集 N A M E RANK Y E A R S T E N U R E DT o m A s s i s t a n t P r o f 2 noM e r l i s a A s s o c i a t e P r o f 7 noG e o r g e P r o f e s s o r 5 y e sJ o s e p h A s s i s t a n t P r o f 7 y e s未知數(shù)據(jù) (Jeff, Professor, 4) Tenured? 監(jiān)督學(xué)習(xí) VS. 無監(jiān)督學(xué)習(xí) ? 監(jiān)督學(xué)習(xí)(用于分類) ? 模型的學(xué)習(xí)在被告知每個(gè)訓(xùn)練樣本屬于哪個(gè)類的“指導(dǎo)”下進(jìn)行 ? 新數(shù)據(jù)使用訓(xùn)練數(shù)據(jù)集中得到的規(guī)則進(jìn)行分類 ? 無監(jiān)督學(xué)習(xí)(用于聚類) ? 每個(gè)訓(xùn)練樣本的類編號是未知的,要學(xué)習(xí)的類集合或數(shù)量也可能是事先未知的 ? 通過一系列的度量、觀察來建立數(shù)據(jù)中的類編號或進(jìn)行聚類 數(shù)據(jù)預(yù)測的兩步過程 ? 數(shù)據(jù)預(yù)測也是一個(gè)兩步的過程,類似于前面描述的數(shù)據(jù)分
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1