freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

聚類分析在證券市場分析中的應(yīng)用-文庫吧

2025-06-11 13:31 本頁面


【正文】 地作出投資決策,進行投資。在證券投資方面,聚類分析還有很大的發(fā)掘空間和研究價值。目前,國內(nèi)頗具有代表性的研究大多僅僅局限于板塊分析,選用的指標也僅僅反映了上市公司的盈利水平,尚不能全面反映股票的總體特性。在現(xiàn)有的研究基礎(chǔ)上,本文深入探討了聚類分析在證券投資中的應(yīng)用價值,豐富和完善了在證券市場分析中應(yīng)用聚類分析時的指標體系。 研究內(nèi)容本文闡述了聚類分析的理論背景,主要研究了用系統(tǒng)聚類分析方法對樣本數(shù)據(jù)進行分組,但是,我們并不知道樣本數(shù)據(jù)的分組是否合理,因此再利用方法對其進行檢驗,從而使得聚類精度有所提高,進而增加分析結(jié)果的可靠性和可信性。 內(nèi)容結(jié)構(gòu)本論文共分四章,具體的內(nèi)容結(jié)構(gòu)如下:第一章是緒論,介紹了論文研究的背景及意義。第二章詳細介紹了聚類分析的基礎(chǔ)理論,系統(tǒng)聚類法的基本思想、基本步驟、距離度量和類個數(shù)的確定問題。第三章給出了聚類分析方法在證券投資市場中的具體應(yīng)用,并采用方法對分析結(jié)果進行檢驗,證明其有效性。第四章是對聚類分析方法在證券投資市場中的應(yīng)用進行總結(jié)和展望。2.聚類分析聚類分析是把數(shù)據(jù)集分解或劃分成多個類或組,使同一組中的數(shù)據(jù)比較相似,不同組的數(shù)據(jù)差別較大。通過聚類,可以識別數(shù)據(jù)之間的相似程度,從而發(fā)現(xiàn)數(shù)據(jù)集的分布模式和數(shù)據(jù)的屬性之間的相互關(guān)系。聚類分析的基本思想是認為研究的數(shù)據(jù)集中的數(shù)據(jù)之間存在不同程度的相似性,根據(jù)數(shù)據(jù)的幾個屬性,找到能夠度量它們之間相似程度的量,把一些相似程度較大量的歸為一類,另一些相似程度較大的量歸為另一類,即同一組內(nèi)的數(shù)據(jù)對象之間具有較高的相似程度,而不同組中的數(shù)據(jù)對象之間是不相似的。而對這種數(shù)據(jù)對象之間的相似或不相似程度的描述又是由數(shù)據(jù)屬性的取值來確定的,通常就是利用各數(shù)據(jù)對象之間的距離來表示的。聚類分析的內(nèi)容非常豐富,從其聚類的方法來看,可分為以下幾類:(1) 譜系聚類法:譜系聚類法又稱系統(tǒng)聚類法,它是在給出樣品間的距離和類與類間的距離定義的基礎(chǔ)上,先將每個樣品各自當作一類,計算出各類(即各樣品)之間的距離,再將最近的兩類合并聚為小類,將已聚合的小類按其相似程度(用類間距度量)再聚合,依此類推,每次減少一類,隨著相似程度的減弱,直到最后將全部樣品合成一類,并類的全部過程可以用聚類譜系圖來描述。(2) 快速聚類法:快速聚類法又稱動態(tài)聚類法,它的基本思想是,先確定若干個中心,然后將樣本逐個輸入,看看樣品能否歸屬哪類,如果可以歸屬已有的某個類,則歸之,且對該中心稍作調(diào)整;否則可以建立新類,并調(diào)整原有的歸屬及重新計算新的各類的中心;如此繼續(xù)下去,直到每個樣品皆有歸屬為止。這種方法可以大大地提高計算速度,但由于初始中心的個數(shù)及位置的選取、樣品輸入的順序都可能對最后結(jié)果產(chǎn)生某些影響,所以在實際運用時要慎重。(3) 最優(yōu)分割法:最優(yōu)分割法又稱有序樣品聚類法,它是先將全部樣品當成一類,然后根據(jù)某種最優(yōu)準則適當?shù)貙⑵浞指顬閮深?,再分為三類,直到最后將樣品分割為所需的類為止。?) 模糊聚類法:模糊聚類法是利用模糊集理論來處理分類問題,它對經(jīng)濟領(lǐng)域中具有模糊特征的兩態(tài)數(shù)據(jù)或多態(tài)數(shù)據(jù)具有明顯的分類效果。(5) 圖論聚類法:圖論聚類法是利用圖論中最小支撐樹的概念來處理分類問題,由此也創(chuàng)造了頗具風格的一種方法。(6) 聚類預(yù)報法:聚類預(yù)報法是利用聚類方法來處理預(yù)報問題。我們知道,在多元統(tǒng)計分析中,如回歸分析和判別分析都可以用來作為預(yù)報的方法,但是對于那些存在異常數(shù)據(jù),例如在災(zāi)害性氣候的氣象預(yù)報中,此時若還利用回歸分析或判別分析的方法來處理,其效果都不好,而聚類預(yù)報彌補了這一不足缺陷。另外,聚類分析根據(jù)分類對象的不同,分為型和型兩大類:型聚類分析是對變量(或指標)進行分類處理,其作用在于:可以了解變量間及變量組合間的親疏關(guān)系;可以根據(jù)變量的聚類結(jié)果及它們之間的關(guān)系,選擇主要變量進行回歸分析或Q型聚類分析等。型聚類分析是對樣本進行分類處理,其作用在于:能利用多個變量對樣本進行分類;分類結(jié)果直觀,聚類譜系圖能明確、清楚地表達其分類結(jié)果;所得的結(jié)果比傳統(tǒng)的分類方法更細致、全面、合理。 當使用不同的分類方法時,往往會得到不同的分類結(jié)果,更何況對于任何觀測數(shù)據(jù)都不會存在唯一“正確”的分類方法。在實際工作中,仍以系統(tǒng)聚類法使用的最多,系統(tǒng)聚類法是目前在實際應(yīng)用中使用最多的一類方法。因此,在本論文中就使用系統(tǒng)聚類法,即譜系聚類法,并且是進行型的聚類分析。設(shè)有個樣本,并且每個樣本都有個變量(或指標)。系統(tǒng)聚類法的基本思想是:首先定義樣品間的距離和類與類之間的距離,開始時先將每個樣品各自當作一類,此時樣本間距離與類間距離是等價的,再將最近的兩類合并聚為小類,將已聚合的小類按其相似程度(用類間距度量)再聚合,依此類推,每次減少一類,隨著相似程度的減弱,直到最后將全部樣品合成一類,并類的全部過程可以用聚類譜系圖形象地表達出來。由上述系統(tǒng)聚類法的基本思想,可以得出利用系統(tǒng)聚類法進行聚類分析的基本步驟:①數(shù)據(jù)標準化:我們所考察的樣本數(shù)據(jù)有不同變量(或指標)時,這些變量(或指標)一般都有不同的量綱、不同的數(shù)量級單位、不同的取值范圍。為了使不同量綱、不同取值范圍的數(shù)據(jù)能夠放在一起進行比較,通常需要對數(shù)據(jù)進行歸一化或標準化處理。并且,還要選擇樣本之間和類之間距離度量的方法;②計算個樣本兩兩之間的距離,得到樣本間的距離矩陣;③剛開始第一步時,將個樣本各自看成一類,此時類的個數(shù),樣本間的距離就是類間的距離,然后對步驟執(zhí)行聚類的步驟④和⑤;④每次合并類間距離最小的兩類為一新類,即此時類的總數(shù)減少了1,此時類的總數(shù)為;⑤繼續(xù)計算新類與其它類之間的距離,得到新的距離矩陣。如果合并后類的個數(shù)仍然大于1,則重復(fù)步驟④和⑤,直到類的總個數(shù)是1時為止;⑥畫出聚類譜系圖;⑦決定分類的個數(shù)以及各類的成員。聚類問題中有個數(shù)據(jù),每個數(shù)據(jù)有個變量(即屬性),表示數(shù)據(jù)的第個屬性,則數(shù)據(jù)集的所有變量可用如下矩陣表示: ()由于變量的多樣性,其取值可能是連續(xù)值的區(qū)間變量、二元變量、序數(shù)變量、名義變量等,它們的處理方法是不同的,如工資水平、股票價格、利率、匯率等可以用連續(xù)值表示的稱為連續(xù)變量,由于使用的變量單位不同等諸多因素,它們的值可能相差比較懸殊,為使各變量在聚類分析中地位相同,就需要對數(shù)據(jù)進行歸一化即標準化處理。兩個數(shù)據(jù)的接近程度用距離表示,樣品之間的距離,一般要求它滿足下列條件:(1)且當且僅當; (2);(3)。在聚類分析中,有些“距離”不滿足(3),我們在廣義的角度上仍稱它為“距離”。常用的距離有:歐式距離、明科夫斯基距離、馬氏距離等。下面就簡要介紹幾種聚類分析中的常用距離:設(shè)是我們所關(guān)心的個指標,對此指標進行次觀測,從而得到組觀測值:,稱這組觀測數(shù)據(jù)為個樣品。這時,每個樣品可看成維空間的一個點,個樣品組成維空間的個點,我們自然就可以用各個樣本點之間的距離來衡量各樣品之間的相似程度。(1)歐氏距離 ()(2)Minkowski距離(明科夫斯基距離) ()其中。Minkowski距離又稱距離,距離即歐氏距離。(3)馬氏距離 ()其中是由樣品算得的樣本協(xié)方差矩陣:,其中馬氏距離適用于作為隨機變量的樣本點,并且馬氏距離用于已知類別的模式情況,而我們所選定的家公司股票的類別是未知的,因此該距離不能用;明科夫斯基距離是一種范式,也就是說歐氏距離是明科夫斯基距離的一種特殊形式,即在式中時,此時的明科夫斯基距離即歐氏距離。因此,在此處我們選擇歐氏距離來度量樣本間的距離,歐氏距離是聚類分析中用得最廣泛的距離。但是,鑒于本論文中選取的5項指標:每股收益、每股凈資產(chǎn)、主營收入增長率、主營利潤增長率和凈資產(chǎn)收益率,正如在本節(jié)“”中提到的,它們皆為連續(xù)變量,而歐氏距離平方最適合對連續(xù)變量進行數(shù)據(jù)處理,因此,在本論文中,對于樣本間距離的選擇問題,我們選擇歐氏距離平方,軟件中對應(yīng)選擇,由式很容易得到歐氏距離平方: ()距離作為對樣品之間的相似程度的度量是聚類分析的基礎(chǔ)。為了研究問題的方便,分別以表示樣品,簡記是樣品之間的距離, 設(shè)和為兩個類,含樣品數(shù)和?!惖闹匦?。類與類之間的距離記為.類間距離的常用定義方法如下:最短距離,即兩類中樣品之間距離最短者作為類間距離;最短距離法的特點是樣品有鏈接聚合的趨勢,這是其缺點,不適合一般數(shù)據(jù)的分類處理,除去特殊數(shù)據(jù)外,不提倡用這種方法。最長距離,即兩類中樣品之間距離最長者作為類間距離;重心距離,即兩類的重心之間的距離作為類間距離;該距離隨聚類地進行不斷縮小。該重心距離法的譜系聚類圖很難跟蹤,且符號改變頻繁,計算較煩。類平均距離,即兩類中所有兩兩樣品之間的平方距離的平均作為類間距離;類平均距離法是一種使用比較廣泛、聚類結(jié)果較好的方法,而類平均距離法又有兩種形式:組間聯(lián)結(jié)法和組內(nèi)聯(lián)結(jié)法。這兩種方法相對而言,組間聯(lián)結(jié)法更能充分的使用樣本數(shù)據(jù)材料,因此,本論文中采用類平均距離法中的組間聯(lián)結(jié)法來度量類間距離。離差平方和在實際應(yīng)用中,離
點擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1