freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

聚類分析在證券市場(chǎng)分析中的應(yīng)用-文庫(kù)吧

2025-06-11 13:31 本頁(yè)面


【正文】 地作出投資決策,進(jìn)行投資。在證券投資方面,聚類分析還有很大的發(fā)掘空間和研究?jī)r(jià)值。目前,國(guó)內(nèi)頗具有代表性的研究大多僅僅局限于板塊分析,選用的指標(biāo)也僅僅反映了上市公司的盈利水平,尚不能全面反映股票的總體特性。在現(xiàn)有的研究基礎(chǔ)上,本文深入探討了聚類分析在證券投資中的應(yīng)用價(jià)值,豐富和完善了在證券市場(chǎng)分析中應(yīng)用聚類分析時(shí)的指標(biāo)體系。 研究?jī)?nèi)容本文闡述了聚類分析的理論背景,主要研究了用系統(tǒng)聚類分析方法對(duì)樣本數(shù)據(jù)進(jìn)行分組,但是,我們并不知道樣本數(shù)據(jù)的分組是否合理,因此再利用方法對(duì)其進(jìn)行檢驗(yàn),從而使得聚類精度有所提高,進(jìn)而增加分析結(jié)果的可靠性和可信性。 內(nèi)容結(jié)構(gòu)本論文共分四章,具體的內(nèi)容結(jié)構(gòu)如下:第一章是緒論,介紹了論文研究的背景及意義。第二章詳細(xì)介紹了聚類分析的基礎(chǔ)理論,系統(tǒng)聚類法的基本思想、基本步驟、距離度量和類個(gè)數(shù)的確定問(wèn)題。第三章給出了聚類分析方法在證券投資市場(chǎng)中的具體應(yīng)用,并采用方法對(duì)分析結(jié)果進(jìn)行檢驗(yàn),證明其有效性。第四章是對(duì)聚類分析方法在證券投資市場(chǎng)中的應(yīng)用進(jìn)行總結(jié)和展望。2.聚類分析聚類分析是把數(shù)據(jù)集分解或劃分成多個(gè)類或組,使同一組中的數(shù)據(jù)比較相似,不同組的數(shù)據(jù)差別較大。通過(guò)聚類,可以識(shí)別數(shù)據(jù)之間的相似程度,從而發(fā)現(xiàn)數(shù)據(jù)集的分布模式和數(shù)據(jù)的屬性之間的相互關(guān)系。聚類分析的基本思想是認(rèn)為研究的數(shù)據(jù)集中的數(shù)據(jù)之間存在不同程度的相似性,根據(jù)數(shù)據(jù)的幾個(gè)屬性,找到能夠度量它們之間相似程度的量,把一些相似程度較大量的歸為一類,另一些相似程度較大的量歸為另一類,即同一組內(nèi)的數(shù)據(jù)對(duì)象之間具有較高的相似程度,而不同組中的數(shù)據(jù)對(duì)象之間是不相似的。而對(duì)這種數(shù)據(jù)對(duì)象之間的相似或不相似程度的描述又是由數(shù)據(jù)屬性的取值來(lái)確定的,通常就是利用各數(shù)據(jù)對(duì)象之間的距離來(lái)表示的。聚類分析的內(nèi)容非常豐富,從其聚類的方法來(lái)看,可分為以下幾類:(1) 譜系聚類法:譜系聚類法又稱系統(tǒng)聚類法,它是在給出樣品間的距離和類與類間的距離定義的基礎(chǔ)上,先將每個(gè)樣品各自當(dāng)作一類,計(jì)算出各類(即各樣品)之間的距離,再將最近的兩類合并聚為小類,將已聚合的小類按其相似程度(用類間距度量)再聚合,依此類推,每次減少一類,隨著相似程度的減弱,直到最后將全部樣品合成一類,并類的全部過(guò)程可以用聚類譜系圖來(lái)描述。(2) 快速聚類法:快速聚類法又稱動(dòng)態(tài)聚類法,它的基本思想是,先確定若干個(gè)中心,然后將樣本逐個(gè)輸入,看看樣品能否歸屬哪類,如果可以歸屬已有的某個(gè)類,則歸之,且對(duì)該中心稍作調(diào)整;否則可以建立新類,并調(diào)整原有的歸屬及重新計(jì)算新的各類的中心;如此繼續(xù)下去,直到每個(gè)樣品皆有歸屬為止。這種方法可以大大地提高計(jì)算速度,但由于初始中心的個(gè)數(shù)及位置的選取、樣品輸入的順序都可能對(duì)最后結(jié)果產(chǎn)生某些影響,所以在實(shí)際運(yùn)用時(shí)要慎重。(3) 最優(yōu)分割法:最優(yōu)分割法又稱有序樣品聚類法,它是先將全部樣品當(dāng)成一類,然后根據(jù)某種最優(yōu)準(zhǔn)則適當(dāng)?shù)貙⑵浞指顬閮深?,再分為三類,直到最后將樣品分割為所需的類為止。?) 模糊聚類法:模糊聚類法是利用模糊集理論來(lái)處理分類問(wèn)題,它對(duì)經(jīng)濟(jì)領(lǐng)域中具有模糊特征的兩態(tài)數(shù)據(jù)或多態(tài)數(shù)據(jù)具有明顯的分類效果。(5) 圖論聚類法:圖論聚類法是利用圖論中最小支撐樹(shù)的概念來(lái)處理分類問(wèn)題,由此也創(chuàng)造了頗具風(fēng)格的一種方法。(6) 聚類預(yù)報(bào)法:聚類預(yù)報(bào)法是利用聚類方法來(lái)處理預(yù)報(bào)問(wèn)題。我們知道,在多元統(tǒng)計(jì)分析中,如回歸分析和判別分析都可以用來(lái)作為預(yù)報(bào)的方法,但是對(duì)于那些存在異常數(shù)據(jù),例如在災(zāi)害性氣候的氣象預(yù)報(bào)中,此時(shí)若還利用回歸分析或判別分析的方法來(lái)處理,其效果都不好,而聚類預(yù)報(bào)彌補(bǔ)了這一不足缺陷。另外,聚類分析根據(jù)分類對(duì)象的不同,分為型和型兩大類:型聚類分析是對(duì)變量(或指標(biāo))進(jìn)行分類處理,其作用在于:可以了解變量間及變量組合間的親疏關(guān)系;可以根據(jù)變量的聚類結(jié)果及它們之間的關(guān)系,選擇主要變量進(jìn)行回歸分析或Q型聚類分析等。型聚類分析是對(duì)樣本進(jìn)行分類處理,其作用在于:能利用多個(gè)變量對(duì)樣本進(jìn)行分類;分類結(jié)果直觀,聚類譜系圖能明確、清楚地表達(dá)其分類結(jié)果;所得的結(jié)果比傳統(tǒng)的分類方法更細(xì)致、全面、合理。 當(dāng)使用不同的分類方法時(shí),往往會(huì)得到不同的分類結(jié)果,更何況對(duì)于任何觀測(cè)數(shù)據(jù)都不會(huì)存在唯一“正確”的分類方法。在實(shí)際工作中,仍以系統(tǒng)聚類法使用的最多,系統(tǒng)聚類法是目前在實(shí)際應(yīng)用中使用最多的一類方法。因此,在本論文中就使用系統(tǒng)聚類法,即譜系聚類法,并且是進(jìn)行型的聚類分析。設(shè)有個(gè)樣本,并且每個(gè)樣本都有個(gè)變量(或指標(biāo))。系統(tǒng)聚類法的基本思想是:首先定義樣品間的距離和類與類之間的距離,開(kāi)始時(shí)先將每個(gè)樣品各自當(dāng)作一類,此時(shí)樣本間距離與類間距離是等價(jià)的,再將最近的兩類合并聚為小類,將已聚合的小類按其相似程度(用類間距度量)再聚合,依此類推,每次減少一類,隨著相似程度的減弱,直到最后將全部樣品合成一類,并類的全部過(guò)程可以用聚類譜系圖形象地表達(dá)出來(lái)。由上述系統(tǒng)聚類法的基本思想,可以得出利用系統(tǒng)聚類法進(jìn)行聚類分析的基本步驟:①數(shù)據(jù)標(biāo)準(zhǔn)化:我們所考察的樣本數(shù)據(jù)有不同變量(或指標(biāo))時(shí),這些變量(或指標(biāo))一般都有不同的量綱、不同的數(shù)量級(jí)單位、不同的取值范圍。為了使不同量綱、不同取值范圍的數(shù)據(jù)能夠放在一起進(jìn)行比較,通常需要對(duì)數(shù)據(jù)進(jìn)行歸一化或標(biāo)準(zhǔn)化處理。并且,還要選擇樣本之間和類之間距離度量的方法;②計(jì)算個(gè)樣本兩兩之間的距離,得到樣本間的距離矩陣;③剛開(kāi)始第一步時(shí),將個(gè)樣本各自看成一類,此時(shí)類的個(gè)數(shù),樣本間的距離就是類間的距離,然后對(duì)步驟執(zhí)行聚類的步驟④和⑤;④每次合并類間距離最小的兩類為一新類,即此時(shí)類的總數(shù)減少了1,此時(shí)類的總數(shù)為;⑤繼續(xù)計(jì)算新類與其它類之間的距離,得到新的距離矩陣。如果合并后類的個(gè)數(shù)仍然大于1,則重復(fù)步驟④和⑤,直到類的總個(gè)數(shù)是1時(shí)為止;⑥畫出聚類譜系圖;⑦決定分類的個(gè)數(shù)以及各類的成員。聚類問(wèn)題中有個(gè)數(shù)據(jù),每個(gè)數(shù)據(jù)有個(gè)變量(即屬性),表示數(shù)據(jù)的第個(gè)屬性,則數(shù)據(jù)集的所有變量可用如下矩陣表示: ()由于變量的多樣性,其取值可能是連續(xù)值的區(qū)間變量、二元變量、序數(shù)變量、名義變量等,它們的處理方法是不同的,如工資水平、股票價(jià)格、利率、匯率等可以用連續(xù)值表示的稱為連續(xù)變量,由于使用的變量單位不同等諸多因素,它們的值可能相差比較懸殊,為使各變量在聚類分析中地位相同,就需要對(duì)數(shù)據(jù)進(jìn)行歸一化即標(biāo)準(zhǔn)化處理。兩個(gè)數(shù)據(jù)的接近程度用距離表示,樣品之間的距離,一般要求它滿足下列條件:(1)且當(dāng)且僅當(dāng); (2);(3)。在聚類分析中,有些“距離”不滿足(3),我們?cè)趶V義的角度上仍稱它為“距離”。常用的距離有:歐式距離、明科夫斯基距離、馬氏距離等。下面就簡(jiǎn)要介紹幾種聚類分析中的常用距離:設(shè)是我們所關(guān)心的個(gè)指標(biāo),對(duì)此指標(biāo)進(jìn)行次觀測(cè),從而得到組觀測(cè)值:,稱這組觀測(cè)數(shù)據(jù)為個(gè)樣品。這時(shí),每個(gè)樣品可看成維空間的一個(gè)點(diǎn),個(gè)樣品組成維空間的個(gè)點(diǎn),我們自然就可以用各個(gè)樣本點(diǎn)之間的距離來(lái)衡量各樣品之間的相似程度。(1)歐氏距離 ()(2)Minkowski距離(明科夫斯基距離) ()其中。Minkowski距離又稱距離,距離即歐氏距離。(3)馬氏距離 ()其中是由樣品算得的樣本協(xié)方差矩陣:,其中馬氏距離適用于作為隨機(jī)變量的樣本點(diǎn),并且馬氏距離用于已知類別的模式情況,而我們所選定的家公司股票的類別是未知的,因此該距離不能用;明科夫斯基距離是一種范式,也就是說(shuō)歐氏距離是明科夫斯基距離的一種特殊形式,即在式中時(shí),此時(shí)的明科夫斯基距離即歐氏距離。因此,在此處我們選擇歐氏距離來(lái)度量樣本間的距離,歐氏距離是聚類分析中用得最廣泛的距離。但是,鑒于本論文中選取的5項(xiàng)指標(biāo):每股收益、每股凈資產(chǎn)、主營(yíng)收入增長(zhǎng)率、主營(yíng)利潤(rùn)增長(zhǎng)率和凈資產(chǎn)收益率,正如在本節(jié)“”中提到的,它們皆為連續(xù)變量,而歐氏距離平方最適合對(duì)連續(xù)變量進(jìn)行數(shù)據(jù)處理,因此,在本論文中,對(duì)于樣本間距離的選擇問(wèn)題,我們選擇歐氏距離平方,軟件中對(duì)應(yīng)選擇,由式很容易得到歐氏距離平方: ()距離作為對(duì)樣品之間的相似程度的度量是聚類分析的基礎(chǔ)。為了研究問(wèn)題的方便,分別以表示樣品,簡(jiǎn)記是樣品之間的距離, 設(shè)和為兩個(gè)類,含樣品數(shù)和?!惖闹匦摹n惻c類之間的距離記為.類間距離的常用定義方法如下:最短距離,即兩類中樣品之間距離最短者作為類間距離;最短距離法的特點(diǎn)是樣品有鏈接聚合的趨勢(shì),這是其缺點(diǎn),不適合一般數(shù)據(jù)的分類處理,除去特殊數(shù)據(jù)外,不提倡用這種方法。最長(zhǎng)距離,即兩類中樣品之間距離最長(zhǎng)者作為類間距離;重心距離,即兩類的重心之間的距離作為類間距離;該距離隨聚類地進(jìn)行不斷縮小。該重心距離法的譜系聚類圖很難跟蹤,且符號(hào)改變頻繁,計(jì)算較煩。類平均距離,即兩類中所有兩兩樣品之間的平方距離的平均作為類間距離;類平均距離法是一種使用比較廣泛、聚類結(jié)果較好的方法,而類平均距離法又有兩種形式:組間聯(lián)結(jié)法和組內(nèi)聯(lián)結(jié)法。這兩種方法相對(duì)而言,組間聯(lián)結(jié)法更能充分的使用樣本數(shù)據(jù)材料,因此,本論文中采用類平均距離法中的組間聯(lián)結(jié)法來(lái)度量類間距離。離差平方和在實(shí)際應(yīng)用中,離
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1