【正文】
湖南人文科技學(xué)院畢業(yè)論文 1 聚類分析在證券投資中的應(yīng)用 摘 要 : 首先,本文詳細(xì)的介紹了聚類分析模型的定義、定義距離、評(píng)價(jià)方法與步驟,分析了古典國際證券投資理論以及它存在的局限性,并對(duì)現(xiàn)代證券投資理論的主要內(nèi)容、主要貢獻(xiàn)、存在缺陷進(jìn)行了綜臺(tái)評(píng)述 .其次,研究探討了聚類分析在證券投資中的實(shí)用價(jià)值,引出聚類分析在證券投資方面的研究有很大的發(fā)掘空間 .再次,將聚類分析方法引入到證券投資分析中, 隨機(jī)地選取了 41家湖北省的上市公司 作為實(shí)例, 建立股票綜合評(píng)價(jià)指標(biāo)體系,選定聚類分析的范圍,收集股票樣本的指標(biāo)數(shù)據(jù),求取行業(yè)指 標(biāo)的均值,對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,用 SPSS軟件進(jìn)行聚類分析,得到聚類結(jié)果 .研究結(jié)果表明, 運(yùn)用這種理性的投資分析方法, 能幫助投資者準(zhǔn)確地了解和把握股票的總體特性, 可以降低投資風(fēng)險(xiǎn),規(guī)范投資行為 . 關(guān)鍵詞 : 證券投資 聚類分析 SPSS軟件 股票研究 The Application Cluster Analysis in Security Investment Abstract: Firstly, this paper introduces the definition, define distance, evaluation methods and steps of clustering analysis model, analyses the classical theory and its international securities investment, and analyses the main contents, main contribution, defects of modern securities investment theory .Secondly, the research discusses the practical value of cluster analysis in securities investment in order to make clustering analysis in securities investment research has great explore space. Again, clustering analysis method is introduced to the securities investment analysis, it randomly selects the 41 listed panies of hubei province as examples, establishes a prehensive evaluation index system of stock, the scope of clustering analysis, collect stock index data and samples of the average index of industry data processing with SPSS software, making the investment decision. The research result shows that the rational investment analysis method can help investors to accurately understand and grasp the general characteristics of the stock then reduce the risk of investment and investment behavior. Key Words: Security investment; Clusteranalysis; SPSS software; Stock research 湖 南人文科技學(xué)院畢業(yè)論文 2 前言 中國證券業(yè) [1]在自二十世紀(jì)九十年代至今的十幾個(gè)年頭中正在不斷迅速發(fā)展壯大,隨著我國市場經(jīng)濟(jì)建設(shè)的高速發(fā)展,人們的金融意識(shí)和投資意識(shí)日益增強(qiáng),越來越多的投資者把眼光投向了證券市場 . 證券市場作為資本市場的核心在我國的建立和發(fā)展始于改革開放初期 .1981 年 到1987 年國債年均發(fā)行規(guī)模僅為 億元,進(jìn)入 90 年代以來國債發(fā)行數(shù)額年均達(dá)到千億元 .而 1997 年已達(dá)到 2412 億元 .在股票市場上,迄今滬、深兩地上市公司已達(dá) 900余家,上市股票市價(jià)總值達(dá) 2 萬億元 . 我國資本市場在短短十幾年,達(dá)到了許多國家?guī)资晟踔辽习倌瓴艑?shí)現(xiàn)的規(guī)模,取得了不少成功經(jīng)驗(yàn) .但也存在如下一些問題,嚴(yán)重制約了證券市場自身功能的發(fā)揮,阻礙了證券市場的健康發(fā)展 .這些問題主要是:( 1)證券市場規(guī)模過??;( 2)資本市場主體缺位 .如美國,每 4 戶人家就有 1 戶向投資基金投資 .由于我國資本市場機(jī)構(gòu)性投資者 發(fā)展滯后,這使得僅靠若干家大機(jī)構(gòu)和數(shù)以萬計(jì)的小股民散戶所支撐的股市投機(jī)盛行,股價(jià)暴漲暴跌難以避免,阻礙了股市的健康發(fā)展;( 3)市場分割,整體性差;( 4)市場中介機(jī)構(gòu)不完善 .我國目前還沒有這樣的中介機(jī)構(gòu),這就嚴(yán)重制約了我國企業(yè)重組活動(dòng)的順利開展;( 5)流動(dòng)性不足,另外,由于國有股不能流通,這將對(duì)國有資產(chǎn)的結(jié)構(gòu)調(diào)整產(chǎn)生不利影響;( 6)資本市場交易工具品種單一、結(jié)構(gòu)殘缺;( 7)證券市場制度不健全 .我國證券市場的利益保障與實(shí)現(xiàn)制度很不健全,使投資者面臨的市場風(fēng)險(xiǎn)過大,嚴(yán)重挫傷了股民的投資積極性 . 不可否認(rèn)中國的證 券業(yè)在這短短的十幾年時(shí)間內(nèi)所取得的成就,是發(fā)達(dá)資本主義國家在經(jīng)歷了將近百年的時(shí)間后才得以實(shí)現(xiàn)的 [2].但是,在認(rèn)識(shí)到成就的同時(shí)也不能忽略了中國證券業(yè)所存在的不足 .最為嚴(yán)重的就是中國證券市場存在的濃重的投機(jī)氛圍,投資者只關(guān)注于股票的短線操作,而不關(guān)注于股票的長期投資, 而面對(duì)上千種股票如果沒有理性的投資態(tài)度,投資者將難以取得成功 .各大媒體對(duì)股票的技術(shù)分析進(jìn)行長篇累犢報(bào)道,而不是對(duì)投資者的長期投資理念做正確的引導(dǎo),也助長了中國證券市場的投機(jī)氣氛 .這使得中國的證券市場很大程度上并沒有起到投資、融資,實(shí)現(xiàn)資源配置的作 用 . 隨著中國股市逐步走向完善 , 走向規(guī)范化 , 價(jià)格向其內(nèi)在價(jià)值回歸是未來股市發(fā)展的重要方向 .股票的檔次將不斷拉開 , 成長率高的績優(yōu)股會(huì)越來越受到投資者的追捧 . [3]過去那種高投機(jī)高市盈率價(jià)格嚴(yán)重偏離其價(jià)值的現(xiàn)象將逐步糾正 .理智的股票投資者 , 將會(huì)更加重視上市公司的經(jīng)營業(yè)績 , 重視股票自身的品質(zhì) , 即重視投資對(duì)象的選擇 .但是 ,隨著股市發(fā)展投資手法和證券監(jiān)管方法的成熟 ,以及上市公司數(shù)量的不斷增多 , 如何科學(xué)合理地進(jìn)行股票的分析和選擇是每一個(gè)投資者所要解決的首要問題 . 聚類分析是一種行之有效的指導(dǎo)證券投資的方法 .[4]聚類 分析首先是基于各類股票的行業(yè)因素、公司因素、收益性、成長性等基本層面的考察 ,然后利用綜合評(píng)價(jià)指標(biāo)體系來衡量樣本股票的“相似程度” .運(yùn)用聚類分析模型能幫助投資者準(zhǔn)確地了解和把握股票的總體特征 ,確定投資范圍 ,并通過類的總體價(jià)格水平來預(yù)測股票價(jià)格的變動(dòng)趨勢 ,選擇有利的投資時(shí)機(jī) . 雖然聚類分析方法在各個(gè)領(lǐng)域的應(yīng)用已非常廣泛 ,但在證券投資方面的研究還有很大的發(fā)掘空間 .國內(nèi)具有代表性的研究僅局限于板塊分析,選用的指標(biāo)也只反映了上市公司的盈利水平,尚不能全面反映股票特征 .在現(xiàn)有的研究基礎(chǔ)上,深入探討聚類分 湖南人文科技學(xué)院畢業(yè)論文 3 析在證 券投資中的應(yīng)用價(jià)值 .豐富和完善聚類的指標(biāo)體系,使該方法對(duì)廣大證券投資者更具指導(dǎo)意義是十分重要 . 1 聚類分析模型簡介 聚類分析 的定義 聚類分析 [5]是一種新興的多元統(tǒng)計(jì)方法(見附錄 1),是當(dāng)代分類學(xué)與多元分析的結(jié)合 .聚類分析是將 物理或抽象對(duì)象的集合 分類對(duì)象置于一個(gè)多維空間中,按照它們空間關(guān)系的親疏程度 ,分組成為由類似的對(duì)象組成的多個(gè)類的分析過程 .通俗的講,聚類分析就是根據(jù)事物彼此不同的屬性進(jìn)行辨認(rèn),將具有相似屬性的事物聚為一類,使得同一類的事物具有高度的相似性 .它是一種重要的人類行為 .聚 類分析的目標(biāo)就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類 .聚類源于很多領(lǐng)域,包括數(shù)學(xué),計(jì)算機(jī)科學(xué),統(tǒng)計(jì)學(xué),生物學(xué)和經(jīng)濟(jì)學(xué) .在不同的應(yīng)用領(lǐng)域,很多聚類技術(shù)都得到了發(fā)展,這些技術(shù)方法被用作描述數(shù)據(jù),衡量不同數(shù)據(jù)源間的相似性,以及把數(shù)據(jù)源分類到不同的簇中 . 在實(shí)際研究中,既可以對(duì)樣本個(gè)體進(jìn)行聚類,也可以對(duì)研究變量進(jìn)行聚類,對(duì)樣本個(gè)體進(jìn)行聚類通常稱為 Q型聚類,對(duì)研究變量進(jìn)行的聚類稱為 R型聚類 .在市場研究中, Q型聚類常用于市場細(xì)分研究,尋找不同目標(biāo)市場及其構(gòu)成者特征, R型聚類可以用于確定產(chǎn)品各屬性的同質(zhì)性 . 聚類分析的方法很多, 常用的有系統(tǒng)聚類、動(dòng)態(tài)聚類 .動(dòng)態(tài)聚類的原理是先對(duì)分類事物作一個(gè)初始的粗糙的分類,然后在根據(jù)某種原則對(duì)初始分類進(jìn)行修改,直至分類被認(rèn)為比較合理為止 . 系統(tǒng)聚類除了要定義事物之間的親疏程度指標(biāo),還要定義類與類之間親疏程度指標(biāo) ,并且要導(dǎo)出求取類間親疏指標(biāo)值的遞推公式 .系統(tǒng)聚類初始,先把所有待分類事物各自看成獨(dú)立的一類,求出兩兩之間的親疏指標(biāo)值,把關(guān)系最為親密的兩類合并成一個(gè)新類,然后計(jì)算新類與原有各類之間的親疏指標(biāo)值,再把其中關(guān)系最為密切的兩類合并 ,如此反復(fù)進(jìn)行,直到最終所有待分類事物合并成一個(gè)大類為止 .最終繪成 一幅系統(tǒng)聚類的譜系圖,再根據(jù)一定的原則確定最終分類結(jié)果 . 從統(tǒng)計(jì)學(xué)的觀點(diǎn)看,聚類分析是通過數(shù)據(jù)建模簡化數(shù)據(jù)的一種方法 .傳統(tǒng)的統(tǒng)計(jì)聚類分析方法包括系統(tǒng)聚類法、分解法、加入法、動(dòng)態(tài)聚類法、有序樣品聚類、有重疊聚類和模糊聚類等 .采用 ?k 值、 ?k 中心點(diǎn)等算法的聚類分析工具已被加入到許多著名的統(tǒng)計(jì)分析軟件包中,如 SPSS、 SAS 等 . 從機(jī)器學(xué)習(xí)的角度講,簇相當(dāng)于隱藏模式 .聚類是搜索簇的無監(jiān)督學(xué)習(xí)過程 .與分類不同,無監(jiān)督學(xué)習(xí) 不依賴預(yù)先定義的類或帶類標(biāo)記的訓(xùn)練實(shí)例,需要由聚類學(xué)習(xí)算法自動(dòng)確定標(biāo)記,而分類學(xué)習(xí)的實(shí)例或數(shù)據(jù)對(duì)象有類別標(biāo)記 .聚類是觀察式學(xué)習(xí),而不是示例式的學(xué)習(xí) . 從實(shí)際應(yīng)用的角度看,聚類分析是數(shù)據(jù)挖掘的主要任務(wù)之一 .而且聚類能夠作為一個(gè)獨(dú)立的工具獲得數(shù)據(jù)的分布狀況,觀察每一簇?cái)?shù)據(jù)的特征,集中對(duì)特定的聚簇集合作進(jìn)一步地分析 .聚類分析還可以作為其他算法(如分類和定性歸納算法)的預(yù)處理步驟 . 湖 南人文科技學(xué)院畢業(yè)論文 4 定義距離 設(shè)有 n 個(gè)樣品, p 個(gè)指標(biāo),每個(gè)樣 品都有這 p 個(gè)指標(biāo)的觀察值,設(shè)第 i 個(gè)樣品的第j 個(gè)指標(biāo)的觀察值為 ijx ,把 n 樣品看成 P 維空間中的 n