freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘課程論文正稿(編輯修改稿)

2025-07-25 14:23 本頁面
 

【文章內(nèi)容簡介】 術(shù)都得到了發(fā)展,這些技術(shù)方法被用作描述數(shù)據(jù),衡量不同數(shù)據(jù)源間的相似性,以及把數(shù)據(jù)源分類到不同的簇中。聚類分析的主要應(yīng)用,在商業(yè)方面,最常見的就是客戶群的細(xì)分問題,可以從客戶人口特征、消費(fèi)行為和喜好方面的數(shù)據(jù),對(duì)客戶進(jìn)行特征分析,充分利用數(shù)據(jù)進(jìn)行客戶的客觀分組,使諸多特征有相似性的客戶能被分在同一組內(nèi),而不相似的客戶能被區(qū)分到另一些組中。在生物方面,聚類分析可以用來對(duì)動(dòng)植物進(jìn)行分類,對(duì)基因進(jìn)行分類等,從而獲取對(duì)動(dòng)植物種群固有結(jié)構(gòu)的認(rèn)識(shí),對(duì)物種進(jìn)行很好的分類。在電子商務(wù)方面,聚類分析在電子商務(wù)中網(wǎng)站建設(shè)數(shù)據(jù)挖掘中也是很重要的一個(gè)方面,通過對(duì)客戶的瀏覽行為、瀏覽網(wǎng)站、客戶的年齡等,對(duì)客戶進(jìn)行分析,找出不同客戶的共同特征,通過共同特征對(duì)客戶進(jìn)行分類,可以幫助電子商戶更好的了解他們的客戶,并向客戶提供更合適的服務(wù)。在保險(xiǎn)行業(yè)上,根據(jù)產(chǎn)、壽險(xiǎn)進(jìn)行分類,不同類別的公司進(jìn)行分類,對(duì)保險(xiǎn)投資比例進(jìn)行分類管理,從而提高保險(xiǎn)投資的效率。三、聚類分析的方法與原理聚類分析是研究“物以類聚”的一種科學(xué)有效的方法。做聚類分析時(shí),出于不同的目的和要求,可以選擇不同的統(tǒng)計(jì)量和聚類方法。聚類分析方法中最常用的一種是系統(tǒng)聚類法,其基本思想是:先將待聚類的n個(gè)樣品(或者變量)各自看成一類,共有n類;然后按照選定的方法計(jì)算每兩類之間的聚類統(tǒng)計(jì)量,即某種距離(或者相似系數(shù)),將關(guān)系最為密切的兩類合為一類,其余不變,即得到n1類;再按照前面的計(jì)算方法計(jì)算新類與其他類之間的距離(或相似系數(shù)),再將關(guān)系最為密切的兩類并為一類,其余不變,即得到n2類;如此下去,每次重復(fù)都減少一類,直到最后所有的樣品(或者變量)都?xì)w為一類為止。系統(tǒng)聚類分析有兩種類型:Q型樣本聚類和R型變量聚類。這里我們運(yùn)用的是Q型聚類。Q型聚類是對(duì)樣本進(jìn)行聚類,它使具有相似特征的樣本聚集在一起,使差異性大的樣本分離開來。系統(tǒng)分析法包括最短距離法、最長距離法、類平均法、重心法、中間距離法和離差平方和法,本文運(yùn)用離差平方和法(Ward法)對(duì)樣本進(jìn)行分類。離差平方和法是Ward(1936)提出的,也稱為Ward法。它基于方差分析思想,如果類分得正確,則同類樣品之間的離差平方和應(yīng)當(dāng)較小,不同類樣品之間的離差平方和應(yīng)當(dāng)較大。假定已將n個(gè)樣品分為k類,記為,…,,表示類的樣品個(gè)數(shù),表示的重心,表示中第i個(gè)樣品(i=1,…,),則中樣品的離差平方和為,其中,為m維向量,為一數(shù)值(t=1,2,…,k)。k個(gè)類的總離差平方和為.當(dāng)k固定時(shí),要選擇使達(dá)到極小的分類。Ward法的基本思想是,先將n個(gè)樣品各自成一類,此時(shí)=0;然后每次將其中某兩類合并為一類,因每縮小一類離差平方和就要增加,每次選擇使增加最小的兩類進(jìn)行合并,直至所有樣品合并為一類為止。Ward法把某兩類合并后增加的離差平方和看成為類間的平方距離,即令表示類和的
點(diǎn)擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1