【正文】
4 1 多維業(yè)務(wù) 空間 度量(指標(biāo)維) 類別維 多維數(shù)據(jù)立方體 方法庫 2 分析方法 多維數(shù)據(jù)立方體 分析引擎 前端用戶 分析 結(jié)果 需求 用戶 請求 數(shù)據(jù)源 數(shù)據(jù)倉庫 多維聯(lián)機(jī)分析系統(tǒng) 圖 13 MOLDA 設(shè)計(jì)開發(fā)的多維聯(lián)機(jī)數(shù)據(jù)分析系統(tǒng)的構(gòu)成 13 基于 MOLDA 模型的多維聯(lián)機(jī)分析系統(tǒng)分為“多維聯(lián)機(jī)分析系統(tǒng)”和“多維聯(lián)機(jī)分析定義庫”兩大部分。將原始的 12 數(shù)據(jù)庫轉(zhuǎn)換為多維數(shù)據(jù)庫后,即使是對大型數(shù)據(jù)庫,也可以實(shí)現(xiàn)快速、多維查詢。如果剩余的維只有兩個(gè),則是切片;如果有二個(gè)以上,則是切塊。當(dāng)進(jìn)行多次維切片,直到剩下兩個(gè)維時(shí),即得到一個(gè)二維的“平面”。當(dāng)多維數(shù)組中的各個(gè)維都選定一個(gè)值,就可確定度量的值,即數(shù)據(jù)單元(單元格)?!傲⒎襟w實(shí)例”就是所謂的“物化(賦值)的立方體”。 約束條件如下: ? Φ??MD ,即維名集合與度量名集合是不相交 的,這要求度量名應(yīng)該具有高度的抽象性,對度量的約束條件在維上進(jìn)行反映; ? ? ? ? ? Φ, ???? ji dfdfjiji ,即任意兩個(gè)維的屬性集是沒有交集的,這要求各個(gè)維對度量的約束是不重復(fù)的; 下面給出例子來說明這個(gè)定義。當(dāng)數(shù)據(jù)庫不算太大時(shí),這種綜合效果較好,但當(dāng)數(shù)據(jù)庫太大時(shí),預(yù)先計(jì)算這些總和就要花費(fèi)很長時(shí)間。 如果查詢“華東地區(qū)的所有行業(yè)總資產(chǎn)額是多少?”這類問題,它是涉及多個(gè)數(shù)據(jù)項(xiàng)求和的查詢。需要指出的是維成員不一定每個(gè)維層次都必須取值。它作為識別數(shù)據(jù)的索引,不同的維組合構(gòu)成了訪問數(shù)據(jù)的約束條件。 OLAP 突破了物理的三維概念,它采用旋轉(zhuǎn)、切片、鉆取和高維可視化技術(shù),將多數(shù)據(jù)在屏幕上展示。 “財(cái)務(wù)分析方法的設(shè)計(jì)”部分主要設(shè)計(jì)了財(cái)務(wù)分析中需要采用的分析方法。 將 MOLDA 技術(shù)應(yīng)用于上市公司財(cái)務(wù)數(shù)據(jù)分析,其“多維性”體現(xiàn)在:能夠?qū)ι鲜泄矩?cái)務(wù)數(shù)據(jù)進(jìn)行時(shí)間、地區(qū)、行業(yè)、市場等多個(gè)角度的分析;“聯(lián)機(jī)”性體現(xiàn)在:能夠?qū)?shù)千家上市公司的財(cái)務(wù)報(bào)表數(shù)據(jù)、報(bào)表附注有機(jī)的聯(lián)機(jī)組織存儲,能夠按不同的綜合程度查詢財(cái)務(wù)數(shù)據(jù);“數(shù)據(jù)分析能力強(qiáng)”體現(xiàn)在: MOLDA 中加載財(cái)務(wù)分析所需要的分析方法,從而可以實(shí)現(xiàn)對上市公司財(cái)務(wù)數(shù)據(jù)進(jìn)行不同層次的進(jìn)一步加工,諸如計(jì)算財(cái)務(wù)報(bào)表中 各項(xiàng)目的年增長率、結(jié)構(gòu)百分比、財(cái)務(wù)比率等相對數(shù),甚至是最高層次的財(cái)務(wù)分析 —— 綜合財(cái)務(wù)評價(jià)分析,同樣, MOLDA 技術(shù)可以將用統(tǒng)計(jì)分析方法分析得出的信息進(jìn)行“聯(lián)機(jī)性”的存儲,方便不同層次用戶不同的查詢需求。投資者常常需要對企業(yè)的財(cái)務(wù)狀況做出綜合評價(jià),以此作為投資決策的依據(jù)。通常是把毗連的幾個(gè)會計(jì)年度的報(bào)表數(shù)據(jù)并列,編制“比較財(cái)務(wù)報(bào)表”,對各年報(bào)表中項(xiàng)目逐一進(jìn)行比較,查明變化原因及可能帶來的影響。即資產(chǎn)負(fù)債表、損益表和現(xiàn)金流量表等財(cái)務(wù)報(bào)表中的會計(jì)報(bào)表項(xiàng)目及其數(shù)值、以及對應(yīng)的報(bào)表附注信息。 2 ? 缺少匯總型的財(cái)務(wù)數(shù)據(jù)。而諸如國家國民收入總值、通貨膨脹問題、失業(yè)率、國際收支等宏觀經(jīng)濟(jì)層面因素對具體的投資影響甚小,所以行業(yè)分析和公司分析越來越受到理性證券投資者的青睞。本人完全意識到本聲明的法律后果由本人承擔(dān)。 they are the mains of the whole paper. In the preface part, based on the realistic requirements and the status quo of the study. It fingers out the financial data analysis of the listed panies is the realistic requirement of the stock investors. But the information concerning this aspect is little, deficient and not online at present. The MOLDA technology is able 上海海運(yùn)學(xué)院碩士論文 上市公司財(cái)務(wù)數(shù)據(jù)多維聯(lián)機(jī)分析設(shè)計(jì) 2 to improve these problems. Chapter one, the multidimensional online data analysis technology. Mainly introduces the concept, the characteristics and its construction. Point out the design of the multidimensional online data analysis is important. It includes the design of the “business space” and the design of the “analysis methods”. Chapter tow, the design of the “business space” of the MOLFDA. At first introduces the theory and the concepts, then it projects the “business space” of the MOLFDA, projects the measures and the dimensions。 第四章: MOLFDA 方法庫設(shè)計(jì)(二)。 “引言”部分,在現(xiàn)實(shí)需求和研究現(xiàn)狀分析的基礎(chǔ)上,指出上市公司財(cái)務(wù)數(shù)據(jù)分析是理性證券投資者的現(xiàn)實(shí)需求,而目前提供的相關(guān)信息存在量少、分析方法不夠完善、大量的數(shù)據(jù)缺乏合理的聯(lián)機(jī)組織等問題,最后 提出多維聯(lián)機(jī)數(shù)據(jù)分析( Multidimensional OnLine Data Analysis, MOLDA)技術(shù)是實(shí)現(xiàn)上市公司財(cái)務(wù)數(shù)據(jù)多維聯(lián)機(jī)分析的理想技術(shù)。凡是有大量數(shù)據(jù)出現(xiàn)的地方,都用到了統(tǒng)計(jì)學(xué)。行業(yè)分析和公司分析的數(shù)據(jù)源都是上市公司的財(cái)務(wù)數(shù)據(jù),包括財(cái)務(wù)報(bào)表和報(bào)表附注。 第三章: MOLFDA 方法庫的設(shè)計(jì)(一)。 關(guān)鍵字: 多維聯(lián)機(jī)數(shù)據(jù)分析( MOLDA)、上市公司財(cái)務(wù)分析、 業(yè)務(wù)空間設(shè)計(jì)、分析方法設(shè)計(jì)、集成多指標(biāo)綜合評價(jià)上海海運(yùn)學(xué)院碩士論文 上市公司財(cái)務(wù)數(shù)據(jù)多維聯(lián)機(jī)分析設(shè)計(jì) 1 ABSTACT Statistics is a practical subject. It concerns the collecting, processing and analyzing of the related data, gives presumptions and predictions to it’s objects, and provides suggestions to decisionmakers. Actually, where there is a great deal of data, there esists a chance for the utilized the field of statistics. In addition, as we all known it’s feasible to process the data by puter. Therefore, statistics can be unexceptionally utilized in the field of stock investmen. However, statistics is more often used in technical analysis than in elementary analysis. Technical analysis deals with shortrun transaction of stocks while elementary analysis concerns the evaluation of certain stocks。 作者簽名: 日 期: 學(xué) 位論文原創(chuàng)性聲明 本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研究成果。證券投資分析通常有“基本面分析和技術(shù)分析”。雖然,有些證券類網(wǎng)站(如證券之星等)開始作了些相關(guān)的研究,但總的說還存在如下一些缺陷和不足之處: ? 財(cái)務(wù)報(bào)表數(shù)據(jù)缺乏緊密的連接。 MOLFDA 以上市公司財(cái)務(wù)報(bào)表、以及報(bào)表附注為數(shù)據(jù)源,用多維聯(lián)機(jī)數(shù)據(jù)分析( Multidimensional OnLine Data Analysis, MOLDA)作為技術(shù)支持,實(shí)現(xiàn)對數(shù)據(jù)源多角度(時(shí)間角度、行業(yè)角度、地區(qū)角度、市場 深、滬 角度)、多種分析深度(原始數(shù)據(jù)、簡單匯總、綜合分析)的聯(lián)機(jī)財(cái)務(wù)分析,以滿足投資者多角度、不同層次的查詢和觀察上市公司信息的現(xiàn)實(shí)需求,倡導(dǎo)理性投資,減少他們投資決策的不確定性,以期對中國的證券市場良性發(fā)展有所促進(jìn)。其方法是比較分析法,它是通過將兩個(gè)或幾個(gè)相關(guān)的可比數(shù)據(jù)進(jìn)行簡單的除法運(yùn)算得出比值,實(shí)現(xiàn)初步的數(shù)據(jù)分析,通常以年增長率和結(jié)構(gòu)百分比、財(cái)務(wù)比率表示。 ? “財(cái)務(wù)比率分析”是將若干個(gè)財(cái)務(wù)報(bào)表數(shù)據(jù)聯(lián)系在一起,避免了孤立看問題的缺陷;此外,比率分析不僅局限于對某一張報(bào)表的內(nèi)部分析,還是一種“跨表”的分析,將資產(chǎn)負(fù)債表、損益表、現(xiàn)金流量表有機(jī)地聯(lián)系起來,計(jì)算各種財(cái)務(wù)比率指標(biāo),更深層面的反映了企業(yè)的經(jīng)營管理和財(cái)務(wù)狀況。 MOLDA 技術(shù)能夠?qū)⒏鞣N數(shù)據(jù)聯(lián)機(jī)組織,實(shí)現(xiàn)數(shù)據(jù)共享;除了具有 4 匯總、合并和聚集等總量數(shù)據(jù)查詢的簡單功能以外,還能使用各種適當(dāng)?shù)慕y(tǒng)計(jì)分析方法解決各種復(fù)雜的數(shù)據(jù)分析問題。于是,“業(yè)務(wù)空間的設(shè)計(jì)”和“財(cái)務(wù)分析方法的設(shè)計(jì)”是文章的研究內(nèi)容。這些信息是對原始的數(shù)據(jù)進(jìn)行了清洗、轉(zhuǎn)換、匯總的、反映用戶所能理解的、與研究目標(biāo)有關(guān)的、多個(gè)角度的信息。例如, “銷售量”、“銷售金額”等都是度量。如一個(gè)典型的層次:國家→地區(qū)→?。ㄊ校? 可以看出,關(guān)系數(shù)據(jù)庫采用關(guān)系表來表達(dá)某地區(qū)在各行業(yè)的資產(chǎn)分布情況,而多維數(shù)據(jù)庫中的數(shù)據(jù)組織形式采用了二維矩陣的形式。在這張關(guān)系表中,由于已經(jīng)預(yù)先對各地區(qū)在各行業(yè)的資產(chǎn)金額進(jìn)行了求和(綜合),查詢時(shí)就不用再進(jìn)行計(jì)算了。多維數(shù)據(jù)立方體通常作為主要的邏輯層結(jié)構(gòu)用來描述多維數(shù)據(jù)庫,它是實(shí)現(xiàn) OLAP 分析的數(shù)據(jù)對象。于是, A={20xx 年, 20xx 年, 20xx 年, 1 年以下, 13 年, 3 年以上,上港集箱、天津港、招商局 }。 不難看出,多維數(shù)據(jù)立方體通過各種映射表定義了關(guān)系模式,是一種邏輯模型。 ? 切片 在多維數(shù)據(jù)立方體的某一維上選定一具體維成員的動作稱之為切片。例如,選定多維數(shù)據(jù)立方體中的三個(gè)維:維 i,維 j,維 k。 roll up 是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù);而 drill down 則相反,它從匯總數(shù)據(jù)深入到細(xì)節(jié)數(shù)據(jù)進(jìn)行觀察。通過從所分析的問題的“多維業(yè)務(wù)空間”中提取和構(gòu)建 “多維數(shù)據(jù)立方體”,經(jīng)過“切片”、“上卷”、“下鉆”或“旋轉(zhuǎn)”等操作,可以為用戶提供各種“粒度”的統(tǒng)計(jì)分析結(jié)果,并用二維表格和圖形表示出來。同時(shí)它指令數(shù)據(jù)連接子系統(tǒng)尋找適當(dāng)?shù)臄?shù)據(jù)源,并按分析的要求,連接數(shù)據(jù)源和分析方法,以獲得必要的分析結(jié)果。一個(gè)業(yè)務(wù)主題又可以根據(jù)需要,按不同的標(biāo)準(zhǔn)劃分為若干“子主題”。在諸多業(yè)務(wù)要素中,那些不可再細(xì)分的業(yè)務(wù)要素,稱為“基本業(yè)務(wù)要素”,它們是多維業(yè)務(wù) 空間的“基”,并形成該業(yè)務(wù)空間的“維”。業(yè)務(wù)空間設(shè)計(jì)的好壞在于其能否全面的反映數(shù)據(jù)源中的所有數(shù)據(jù)。根據(jù)財(cái)務(wù)分析理論和財(cái)務(wù)分析方法,我們得出用戶有以下需求: ? 從時(shí)間、行業(yè)、地區(qū)、市場等多個(gè)角度來查詢上市公司財(cái)務(wù)報(bào)告中的原始總量數(shù)據(jù),簡稱“財(cái)務(wù)數(shù)據(jù)”,它包括財(cái)務(wù)報(bào)表數(shù)據(jù)和報(bào)表附注數(shù)據(jù)(下同)。會計(jì)報(bào)表包括資產(chǎn)負(fù)債表、損益表和現(xiàn)金流量表等三表,會計(jì)報(bào)表附注是對會計(jì)報(bào)表項(xiàng)目的詳細(xì)注釋。表格 21 到表 23 中的項(xiàng)目名稱取所有上市公司財(cái)務(wù)報(bào)表項(xiàng)目的并集;“表24 上市公司財(cái)務(wù)報(bào)告附注表”是上市公司財(cái)務(wù)報(bào)告附注信息的展示,表 24 中的內(nèi)容是根據(jù)后文分析的需要而設(shè)置的,由于 MOLDA 模型 本身具有可擴(kuò)充性,所以表24 的內(nèi)容是可以根據(jù)分析的需要進(jìn)行擴(kuò)充的;為了簡單明了,表格中的代碼( ID)采取了簡單的編制方法,沒有和財(cái)務(wù)會計(jì)中會計(jì)科目代碼相對應(yīng),這主要是為了方便開發(fā)實(shí)現(xiàn)整個(gè)研究系統(tǒng)的計(jì)算機(jī)人員,避免他們花過多的去理解財(cái)務(wù)知識;表格表頭中的基本信息來自中國證券監(jiān)督委員會公布的有關(guān)上市公司的基本信息資料。 合并會計(jì)表作為對整個(gè)集團(tuán)的總結(jié),更有分析的價(jià)值,所以每份報(bào)告中的合并會計(jì)報(bào)表(包括合并資產(chǎn)負(fù)債表、合并損益表和合并現(xiàn) 金流量表,簡稱財(cái)務(wù)報(bào)表,下同)和相關(guān)的報(bào)表附注是我們分析的數(shù)據(jù)源。 ? 各具體上市公司,各行業(yè)、各地區(qū)和各市場的上市公司,以及行業(yè)、地區(qū)、市場角度組合限定的上市公司的財(cái)務(wù)數(shù)據(jù)增減變動(年增長率)情況、分布變動(結(jié)構(gòu)百分比)情況; ? 各具體上市公司,各行業(yè)、各地區(qū)和各市場的上市公司,以及行業(yè)、地區(qū)、市場角度組合限定的上市公司的財(cái)務(wù)狀況(盈利能力、償債能力、運(yùn)營能力、成長能力以及綜合能力)的好壞和變動情況。 ? 所