freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

金融數(shù)據(jù)挖掘ppt課件-資料下載頁

2025-05-07 04:20本頁面
  

【正文】 P,或者就不會陷入財務(wù)困境。 預(yù)測準(zhǔn)確率: 訓(xùn)練樣本組 檢驗樣本組 St公司: 46/56= 46/55= 非 St公司 : 428/504= 419/504= )()|1( 1 . 8 1 1 0654321zxyPPxxxxxxz???????????? 決策樹方法 與前面討論的幾種分類預(yù)測方法相比,決策樹方法是一種近年來才出現(xiàn)的分類預(yù)測方法,其基本原理如下。 ①、 熵與信息增量的概念 熵為一個統(tǒng)計學(xué)概念,設(shè) y為一個狀態(tài)隨機(jī)變量,其熵的定義為: 在統(tǒng)計學(xué)中,熵是不確定性的度量,一個分類隨機(jī)變量的熵越小,其不確定性就越小,對其的預(yù)測就越準(zhǔn)確。從信息學(xué)的角度看,如果利用一個變量后,可以減少分類變量的熵,則該變量對分類預(yù)測就具有信息價值,熵的減少量越大,該指標(biāo)用于預(yù)測的信息價值也就越大。 ??????ii ppyIppppyIl o g)(l o gl o g)( 2211② 、 信息增量的概念 設(shè) x為某個指標(biāo),選取一個 ,按照條件 是否滿足,可以將樣本分為兩組,分別計算各組中 y的熵 ,指標(biāo)x的信息增量定義為: 其中, 分別表示兩組樣本所占的比重。顯然,這樣計算的信息增量與 的取法有關(guān),對每個指標(biāo),通過計算機(jī)搜索,可以找到一個最佳的 ,使其對應(yīng)的信息增量達(dá)到最大。 對每個指標(biāo),我們都可以計算其信息增量,這樣我們就知道哪個指標(biāo)對分類預(yù)測的信息含量最大。 0x 0xx?)(),( 21 yIyI)]()([)()( 2211 yIqyIqyIxga i n ???21,qq0x0x ③ 、 分類預(yù)測方法 —— 決策樹方法 利用信息增量的概念 , 數(shù)據(jù)挖掘中創(chuàng)造了一種分類預(yù)測的決策樹方法 , 其基本的思路是反復(fù)地利用信息增量方法進(jìn)行樣本分割 , 直到不能再分割 、 或者達(dá)到事先的約定為止 。 然后沿著決策樹的樹系結(jié)構(gòu) , 我們就可以寫出決策樹方法的預(yù)測規(guī)則 。 決策樹的預(yù)測規(guī)則由由一系列的預(yù)測結(jié)論組成 。 ④ 、 如何利用數(shù)據(jù)挖掘軟件建立決策數(shù)預(yù)測模型 * 建立發(fā)掘數(shù)據(jù)庫 將 SAS數(shù)據(jù)庫轉(zhuǎn)化為 Excel數(shù)據(jù)庫; 對 Excel數(shù)據(jù)庫的格式進(jìn)行變化(格式 /單元格 /數(shù)值),并 將 Excel數(shù)據(jù)庫文件另存為帶格式文本文件; 將其拷貝入數(shù)據(jù)挖掘子目錄 home下; 創(chuàng)建發(fā)掘數(shù)據(jù)庫; *建立決策樹模型 打開發(fā)掘數(shù)據(jù)庫; 建立決策樹模型,對模型的預(yù)測準(zhǔn)確性檢驗檢驗; 寫出預(yù)測規(guī)則。 ⑤ 、值得注意的問題 * 構(gòu)建決策樹是不能過分?jǐn)M合樣本數(shù)據(jù);同樣需要建立訓(xùn)練樣本組與檢驗樣本組; * 為避免出現(xiàn)挖掘過分追求總體預(yù)測準(zhǔn)確率的現(xiàn)象,可采用適當(dāng)接近兩類樣本比率的方法; * 可以利用決策樹方法發(fā)掘各指標(biāo)預(yù)測財務(wù)危機(jī)的信息含量排序; * 結(jié)合決策樹與信號噪音比方法可得到預(yù)測指標(biāo)信息含量的度量方法,構(gòu)造新的預(yù)測方法。
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1