freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于隨機森林的上市公司財務(wù)風(fēng)險預(yù)警分析(編輯修改稿)

2025-07-15 19:00 本頁面
 

【文章內(nèi)容簡介】 預(yù)測的精度。根據(jù)我們的實證分析,決策樹模型因訓(xùn)練集中數(shù)據(jù)類別不同,當(dāng)不同類別的數(shù)據(jù)數(shù)量差別過大時,分類的精度在數(shù)據(jù)較多的一類較好。因此如何選取訓(xùn)練集合數(shù)據(jù)需要考慮實際需求,以及錯誤分類在具體問題中的后果。本算法在此研究中的分類誤差根據(jù)分類對象來劃分主要有兩類:第一類分類誤差:將來被ST公司分類成正常運營的公司;第二類誤差:將未來正常運營的公司分類成被ST公司。而總誤差指錯誤的分類與預(yù)測集合樣本量之比。在實際中,兩種分類誤差的嚴(yán)重性可能是不同的。加權(quán)總誤差是兩類誤差的加權(quán)和。如何確定兩類誤差的權(quán)重是由實際情況決定的。為了選取合理的抽樣比率,本文在固定的訓(xùn)練集合樣本總量下,此研究兩類數(shù)據(jù)的數(shù)量比對兩類誤差的影響。由于未來被ST公司的數(shù)據(jù)較少,為實現(xiàn)樣本數(shù)量我們考慮復(fù)制少數(shù)類樣本。圖1為兩類誤差隨樣本比率的變化趨勢:圖 1 兩類分類誤差隨抽樣比的變化考慮到兩種分類錯誤后果的不平衡性(第一類誤差的嚴(yán)重性強于第二類),根據(jù)此實證結(jié)果,本次研究的抽樣方法是將未來被ST公司的樣本按簡單隨機抽樣方法抽取300個,再將每個樣本以7次的頻率出現(xiàn)于訓(xùn)練集合(將其復(fù)制7此行程2100個少數(shù)類數(shù)據(jù)),再隨機抽取300個持續(xù)營運正常的上市公司樣本,最終得到2400個訓(xùn)練集合樣本。這2400個訓(xùn)練集合樣本中,對兩類數(shù)據(jù)的樣本比為7:1。(二) 隨機森林建立利用R programming中的randomForest根據(jù)包含兩類數(shù)據(jù)共2400個樣本的訓(xùn)練集合建立5000株決策樹的隨機森林決策模型。通過調(diào)整每個隨機劃分樹選取的變量個數(shù),利用測試集合來檢驗?zāi)P皖A(yù)測的準(zhǔn)確性,得到預(yù)測總體誤差變化趨勢,如下圖2所示。圖 2總體誤差變化趨勢圖在深入的分析中,我們還考慮了兩類誤差,即將三年之后被ST的公司預(yù)測為連續(xù)正常經(jīng)營公司的誤差,以及將連續(xù)正常運營公司預(yù)測為三年后被ST的公司的誤差。圖3(1)和圖3(2)分別表示預(yù)測誤差隨每次隨機劃分時隨機變量選取個數(shù)的變化。圖 3 二類誤差趨勢圖在實際情況中,預(yù)測結(jié)果發(fā)生第一類情況的損失遠遠大于第二類。投資人等利益相關(guān)者更加關(guān)注自己投資錯誤造成的損失而不是失去投資盈利的機會。因此根據(jù)投資者、債權(quán)人等利益相關(guān)者的風(fēng)險厭惡程度,可以對兩類預(yù)測誤差賦予不同的權(quán)重,得到一個綜合的預(yù)測誤差。例如。加權(quán)后的誤差趨勢如圖4所示。圖 4 加權(quán)誤差趨勢根據(jù)上圖所示,當(dāng)每次每建立隨機劃分樹時,隨機選取的自變量個數(shù)為2時,隨機森林預(yù)測誤差最低。其結(jié)果如下表4所示。表4 誤差分析 實際 預(yù)測正常ST比率分類誤差正常49966第一類:ST110078第二類:比率加權(quán):(三) 指標(biāo)顯著性檢驗 本文在對各變量重要程度檢驗時,考慮了各個變量對上市公司財務(wù)狀況分類精度的貢獻。我們認(rèn)為,如果一個變量是非常重要的,那么這意味著這個變量蘊含了大量上市公司財務(wù)狀況的有價值信息;反之,如果沒有這個變量或者這個變量的樣本數(shù)據(jù)錯誤,則隨機森林的分類精度會下降。如果刪除某個變量或者人為地“攪亂”某個變量的數(shù)據(jù)(使數(shù)據(jù)與上市公司錯誤配對),隨機森林的分類誤差增加的幅度大,那么這個變量就是重要的;反之,這個變量就是不重要的。具體來說,我們通過對27個變量依次打亂,得到了預(yù)測精度的下降水平。打亂的方法是:對一個變量的樣本數(shù)據(jù)進行無放回簡單隨機抽樣,再以隨機次序的數(shù)據(jù)與公司配對。利用預(yù)測精度的下降水平來評價變量的重要性程度。下圖5表示不同變量的重要性水平。圖 5 變量重要性水平由此得知,相對重要的指標(biāo)有:應(yīng)收賬款周轉(zhuǎn)率(18)、beta系數(shù)(26)、凈營運資本/營業(yè)收入(11)、銷售利潤率(5)、營業(yè)利潤增長率(21)等;相對不重要的指標(biāo)有:市凈率(25)、營業(yè)收入/營業(yè)成本(4)、營業(yè)收入增長率(20)等。(四) 指標(biāo)選取的有效性反饋在其他學(xué)者的研究中,所選取的財務(wù)指標(biāo)基本上是反映公司整體運營狀況的指標(biāo),而這些指標(biāo)在某些程度上無法體現(xiàn)公司運營狀況的細(xì)節(jié),這一點在前文已有詳述。在這我們基于上文的隨機森林模型對第一級、第二級財務(wù)指標(biāo)的預(yù)測效果分別進行實證分析,得出的結(jié)論是:預(yù)測精度從高到低一次是:第一類指標(biāo)、第二類指標(biāo)同時選用;第二類指標(biāo);第一類指標(biāo)。這也印證了之前對我們對指標(biāo)選取原則的分析是正確的。表5 選取第一類指標(biāo)的隨機森林法 實際 預(yù)測正常ST比率分類誤差正常504611第一類:ST105073第二類:比率加權(quán):表6 選取第二類指標(biāo)的隨機森林法 實際 預(yù)測正常ST比率分類誤差正常530814第一類:ST78870第二類:比率加權(quán):表7 兩類指標(biāo)均選取的隨機森林法 實際 預(yù)測正常ST比率分類誤差正常49966第一類:ST110078第二類:比率加權(quán):(五) 靈敏度分析經(jīng)實證研究發(fā)現(xiàn),隨機森林預(yù)測效果受數(shù)據(jù)數(shù)量,不同類數(shù)據(jù)的隨機抽樣數(shù)量影響較大。而本文研究上市公司未來財務(wù)危機的可能性也遇到了嚴(yán)重的數(shù)據(jù)不平衡的困境,即:在營運正常上市公司的年度報表中,有完整數(shù)據(jù)的樣本數(shù)量遠遠多余將來被ST公司的年度財務(wù)數(shù)據(jù)。因此,抽樣方式、抽樣數(shù)量也會明顯影響分類,即對上市公司財務(wù)狀況進行預(yù)測的精度。本部分主要研究不同抽樣比對預(yù)測精度的影響,下圖6所示為兩類預(yù)測誤差隨抽樣比的變化,這些變化的趨勢很好的體現(xiàn)了兩類預(yù)測誤差雖抽樣比的變化,兩類誤差在一定程度上是可控的。圖 6 兩類誤差隨抽樣比的變化根據(jù)我們的研究,第一類預(yù)測誤差和第二類預(yù)測誤差存在此消彼長的趨勢,在總樣本數(shù)量不變的情況下,無法同時對兩種誤差進行盡可能的控制。但是,在投資分析或者財務(wù)實務(wù)中,利益相關(guān)者不同的風(fēng)險厭惡或風(fēng)險喜好程度使得他們對兩類預(yù)測誤差有著不同的重視程度和容忍度。在此我們給出一種簡單的定性分析。令RAR (Risk Aversion Ratio)為利益相關(guān)者主觀接受的第一類預(yù)測誤差與第二類預(yù)測誤差重要性之比,二者重要性程度之和為1:RAR=WIWII,WI+WII=1可以證明,對于不同的RAR(風(fēng)險厭惡比率),利益相關(guān)者根據(jù)他能接受的RAR,獲得一個與自己風(fēng)險厭惡水平匹配的預(yù)測精度,并且此預(yù)測誤差是介于第一類預(yù)測誤差與第二類誤差之間:TotalError=EIErrorI+EIIErrorIImin?(ErrorI, ErrorII)≤TotalError≤max?(ErrorI, ErrorII)例如當(dāng)RAR=4和RAR=,可以分別得到各自的總體預(yù)測誤差,如下圖7。圖 7總體抽樣比隨各類權(quán)重的變化類似地,不同類數(shù)據(jù)的抽樣比也可以隨著利益相關(guān)者所認(rèn)為的重要性程度來選擇。通過選擇抽樣比改變兩類分類誤差,根據(jù)權(quán)重確定分類的加權(quán)總誤差。在研究上市公司財務(wù)危機預(yù)測中,分類誤差除了以上按屬性分類以外,還可以按誤差來源
點擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1