freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

現(xiàn)代統(tǒng)計(jì)學(xué)分析方法與應(yīng)用多變量的圖表示法(存儲(chǔ)版)

  

【正文】 0D= 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 81 167。 聚類方法 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 最短距離法的主要缺點(diǎn)是它有鏈接聚合的趨勢(shì),因?yàn)轭惻c類之間的距離為所有距離中的最短者,兩類合并以后,它與其他類的距離縮小了,這樣容易形成一個(gè)比較大的類,大部分樣品都被聚在一類中,在樹狀聚類圖中,會(huì)看到一個(gè)延伸的鏈狀結(jié)構(gòu),所以最短距離法的聚類效果并不好,實(shí)際中不提倡使用。類平均法是聚類效果較好、應(yīng)用比較廣泛的一種聚類方法。 聚類方法 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 94 167。 確定分類數(shù)的問(wèn)題是聚類分析中迄今為止尚未完全解決的問(wèn)題之一,主要的障礙是對(duì)類的結(jié)構(gòu)和內(nèi)容很難給出一個(gè)統(tǒng)一的定義,這樣就給不出從理論上和實(shí)踐中都可行的虛無(wú)假設(shè)。在系統(tǒng)聚類過(guò)程中,首先把離得近的類合并,所以在并類過(guò)程中聚合系數(shù) (Agglomeration Coeffi cients)呈增加趨勢(shì),聚合系數(shù)小,表示合并的兩類的相似程度較大,兩個(gè)差異很大的類合到一起,會(huì)使該系數(shù)很大。 由于上述的聚類方法得到的結(jié)果是不完全相同的。類平均法比較適中,相比其他方法,類平均法不太濃縮也不太擴(kuò)張,故許多書推薦這個(gè)方法。 非譜系聚類法或者一開始就對(duì)元素分組,或者從一個(gè)構(gòu)成各類核心的“種子”集合開始。重新計(jì)算接受新樣品的類和失去樣品的類的形心(均值); 2步,直到各類無(wú)元素進(jìn)出。 許多聚類算法都要求給定 K,而選擇幾種算法進(jìn)行反復(fù)檢驗(yàn),對(duì)于結(jié)果的分析也許是有好處的。 實(shí)際例子 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 109 167。 實(shí)際例子 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 113 167。 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 116 167。那么究竟采用哪一種分類為好呢?一種方法是根據(jù)分類問(wèn)題本身的知識(shí)來(lái)決定取舍。另外,點(diǎn)擊 Iterate按鈕可以在其中輸入最大迭代次數(shù)( Maximum iterations)和收斂標(biāo)準(zhǔn)( Convergence criterion);在 Save按鈕中可以選擇保存樣本的聚類結(jié)果( Cluster membership)和各樣本距各自中心點(diǎn)的距離( Distance from cluster center);在 Options按鈕中可以選擇輸出初始類中心點(diǎn)、方差分析表等結(jié)果,讀者可以根據(jù)實(shí)際情況來(lái)選擇。第三個(gè)表展示了 3個(gè)類的最終類中心情況,總體來(lái)看,第一類各指標(biāo)值仍是最優(yōu)的。 實(shí)際例子 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 其中第一個(gè)表顯示了 3個(gè)類的初始類中心情況,可以看出,第一類的各指標(biāo)值總體上是最優(yōu)的,往下依次為第二類和第三類。 實(shí)際例子 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 例 10. 5 我們?nèi)砸?2020年 31個(gè)省、市、自治區(qū)的城鎮(zhèn)居民月平均消費(fèi)支出數(shù)據(jù)為例,在 SPSS中利用 K均值法對(duì) 31個(gè)省、市、自治區(qū)的城鎮(zhèn)居民消費(fèi)水平進(jìn)行聚類分析。 實(shí)際例子 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 直觀看出,類平均法分為三類:{ 1, 9, 11, 19}為第一類,{ 13, 2, 22, 10}為第二類,其他為第三類;最短距離法分為兩類,{ 1, 9, 11, 19}為一類,其余的省市歸為一大類;最長(zhǎng)距離法也分為三類:{ 1, 9, 11, 19}為第一類,{ 10, 22, 2,13, 26}為第二類,其余的省市為第三類。圖 101圖 101圖 1014分別顯示了三種方法的分類結(jié)果。其實(shí)可以把這幾種方法統(tǒng)一起來(lái),有利于在計(jì)算機(jī)上靈活地選擇更有意義的譜系圖。 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 107 167。 關(guān)于 K均值法的幾點(diǎn)評(píng)注 對(duì)于預(yù)先不固定類數(shù) K這一點(diǎn)有很大的爭(zhēng)論,其中包括下面幾點(diǎn): 1. 如果有兩個(gè)或多個(gè)“種子點(diǎn)”無(wú)意中跑到一個(gè)類內(nèi),則其聚類結(jié)果將很難區(qū)分; 2. 局外干擾的存在將至少產(chǎn)生一個(gè)樣品非常分散的類; 3. 即使已知總體由 K個(gè)類組成,抽樣方法也可造成屬于最稀疏類數(shù)據(jù)不出現(xiàn)在樣本中。這種聚類方法的思想是把每個(gè)樣品聚集到其最近形心(均值)類中去。類的個(gè)數(shù) K可以預(yù)先給定,或者在聚類過(guò)程中確定。歸納起來(lái)說(shuō),和類平均法相比,最短距離法、重心法使空間濃縮;最長(zhǎng)距離法、離差平方和法使空間擴(kuò)張。 現(xiàn)在的許多統(tǒng)計(jì)軟件都包含有系統(tǒng)聚類法的程序,只要將數(shù)據(jù)輸入,可很方便地將上述八種方法全部算出,并畫出聚類圖。 準(zhǔn)則 4:若采用幾種不同的聚類方法處理,則在各自的聚類圖上應(yīng)發(fā)現(xiàn)相同的類。 聚類方法 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 (4)分類數(shù)的確定 到目前為止,我們還沒(méi)有討論過(guò)如何確定分類數(shù),聚類分析的目的是要對(duì)研究對(duì)象進(jìn)行分類,因此如何選擇分類數(shù)成為各種聚類方法中的主要問(wèn)題之一。 重心法和類平均法的聚類圖見圖 10圖 109。 聚類方法 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 91 167。 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 86 167。 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 79 167。 類和類的特征 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 77 167。 相似性度量 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 69 167。 相似性度量 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 61 167。在相似性度量的選擇中,常常包含許多主觀上的考慮,但是最重要的考慮是指標(biāo)(包括離散的、連續(xù)的和二態(tài)的)性質(zhì)或觀測(cè)的尺度(名義的、次序的、間隔的和比率的)以及有關(guān)的知識(shí)。第一位重要的問(wèn)題是“什么是類”?粗糙地講,相似樣品(或指標(biāo))的集合稱作類。 ( 2)有序尺度。 例 若我們需要將下列 11戶城鎮(zhèn)居民按戶主個(gè)人的收入進(jìn)行分類,對(duì)每戶作了如下的統(tǒng)計(jì),結(jié)果列于表101。過(guò)去人們主要靠經(jīng)驗(yàn)和專業(yè)知識(shí),作定性分類處理,致使許多分類帶有主觀性和任意性,不能很好的提示客觀事物內(nèi)在的本質(zhì)差別和聯(lián)系,特別是對(duì)于多因素、多指標(biāo)的分類問(wèn)題,定性分類更難以實(shí)現(xiàn)準(zhǔn)確分類。 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 46 167。 實(shí)際例子 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 45 第十章 多變量的圖表示法 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 人們往往會(huì)碰到通過(guò)劃分同種屬性的對(duì)象很好地解決問(wèn)題的情形,而不論這些對(duì)象是個(gè)體、公司、產(chǎn)品甚至行為。 星座圖 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 除本章介紹的幾種方法外,多變量的圖表示法還有塑像圖、輪廓圖、樹形圖等,這幾種方法也是對(duì)每一個(gè)觀測(cè)生成一張圖,圖形的不同部分則表示觀測(cè)不同指標(biāo)的取值,有興趣的讀者可以參閱文獻(xiàn) [11]。這里不再詳細(xì)說(shuō)明。 星座圖的基本畫圖方法為: 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 36 167。Radius=T指畫出每一變量取值的半徑,取 F時(shí)將不畫出, type=“1”指的對(duì)每一星圖僅畫出線(半徑)而不畫出各點(diǎn),若要僅畫出點(diǎn)或線與點(diǎn)都畫出則應(yīng)分別將 type設(shè)為“ p”和“ b”, labels與 head分別指定圖的標(biāo)題及各公司星圖的標(biāo)簽, ncol指定輸出時(shí)每一列輸出的星圖個(gè)數(shù)。 雷達(dá)圖與星圖 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 29 167。 雷達(dá)圖與星圖 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 用鼠標(biāo)選中該部分資料,依次點(diǎn)選插入 →圖表,進(jìn)入圖表向?qū)?duì)話框,在標(biāo)準(zhǔn)類型中選擇雷達(dá)圖,在子圖表類型中先擇第二項(xiàng)資料點(diǎn)雷達(dá)圖,點(diǎn)下一步按鈕,可以看到產(chǎn)生雷達(dá)圖的示意圖,系列產(chǎn)生默認(rèn)是行,對(duì)本例資料,若不是行,則應(yīng)改為行。 臉譜圖 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 21 167。此處不再詳述。 S—Plus畫臉譜圖的方法非常簡(jiǎn)單,只要調(diào)用 faces函數(shù)就可以實(shí)現(xiàn)了。此處我們不對(duì)臉譜的各個(gè)部位與原始變量的數(shù)學(xué)關(guān)系作過(guò)多探討,而只說(shuō)明其作圖的思想及軟件實(shí)現(xiàn)方法。另外, SPSS軟件還有一些選項(xiàng)可以幫助我們由散點(diǎn)圖矩陣得到更多信息,資料集 religion的含義是主要的宗教信仰,在 Scatterplot Matrix對(duì)話框中將 religion變量選作標(biāo)記變量(選入 set markers by)框中,則在輸出的散點(diǎn)圖矩陣中,不同宗教信仰的國(guó)家以不同的顏色畫出,借此可以作更詳細(xì)的分析,此處不再詳述。由此也可以看出,散點(diǎn)圖矩陣方法還不是真正意義上的多變量作圖方法,它研究的仍是兩兩變量之間的相關(guān)關(guān)系,而不能直接反映多個(gè)變量之間的關(guān)系,借助它來(lái)對(duì)資料分類也是比較困難的;然而,因其直觀,簡(jiǎn)單,容易理解,散點(diǎn)圖矩陣還是越來(lái)越受到了廣大實(shí)際工作者的喜愛(ài),很多統(tǒng)計(jì)軟件也加入了作散點(diǎn)圖矩陣的功能。而當(dāng)變量個(gè)數(shù)為 3時(shí),雖然仍可以做三維的散點(diǎn)圖,但這樣做已經(jīng)不是很方便,當(dāng)變量個(gè)數(shù)大于 3時(shí),就不能用通常的方法作圖了。 散點(diǎn)圖矩陣 ?167。 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 3 第九章 多變量的圖表示法 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 因?yàn)閷?duì)資料的圖表示法只是以一種直觀的方式再現(xiàn)資料,不同的研究者習(xí)慣的資料顯示方式可能會(huì)有很大不同,因此,不同于其它統(tǒng)計(jì)方法,大部分圖表示法都沒(méi)有非常嚴(yán)格的畫圖方法,研究者可以根據(jù)自己的習(xí)慣設(shè)定某些規(guī)則以更方便地揭示資料之間的聯(lián)系。 散點(diǎn)圖矩陣 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束 例 以 SPSS軟件自帶的 ,該資料共有 26個(gè)變量 109條觀測(cè),是 1995年世界 109個(gè)國(guó)家和地區(qū)的基本發(fā)展情況的資料。對(duì)于 Statistica軟件的用法這里不做過(guò)多說(shuō)明,對(duì)于上面的資料,用 Statistica軟件作散點(diǎn)圖矩陣得到結(jié)果如下: 2020/10/5 中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心 9 167。這樣,按照各變量的取值,根據(jù)一定的數(shù)學(xué)函數(shù)關(guān)系,就可以確定臉的輪廓、形狀及五官的部位、形狀,每一個(gè)樣本點(diǎn)都用一張臉譜來(lái)表示。 臉譜圖 目錄 上頁(yè) 下頁(yè) 返回 結(jié)束
點(diǎn)擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1