freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第9章rapidminer-k-means聚類(lèi)辨別分析v1(編輯修改稿)

2025-07-27 12:02 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 這是基于上述RI方法衍生出的一個(gè)方法,F(xiàn)評(píng)價(jià)公式如下: (911)其中。實(shí)際上RI方法就是把準(zhǔn)確率p和召回率r看得同等重要,事實(shí)上有時(shí)候我們可能需要某一特性更多一點(diǎn),這時(shí)候就適合使用F值方法?!肒Means 聚類(lèi)確定患冠心病的高風(fēng)險(xiǎn)人群 背景和概要說(shuō)明Sonia 在一家主要健康保險(xiǎn)公司擔(dān)任項(xiàng)目總監(jiān)。 最近她一直在閱讀醫(yī)學(xué)刊物和其他文章,并發(fā)現(xiàn)好多文章都在強(qiáng)調(diào)體重、性別和膽固醇對(duì)患冠心病的影響。 她閱讀的研究文件一次又一次地確認(rèn)這三個(gè)變量之間存在關(guān)聯(lián)。盡管人們無(wú)法在自己的性別方面下功夫,但無(wú)疑可以通過(guò)選擇合理的生活方式來(lái)改變膽固醇水平和體重。 于是她開(kāi)始提議公司為健康保險(xiǎn)客戶(hù)提供體重和膽固醇管理項(xiàng)目。 在考慮她的工作在哪里開(kāi)展可能最為有效時(shí),她希望了解是否存在發(fā)生高體重和高膽固醇風(fēng)險(xiǎn)最高的自然群體,如果存在,這些群體之間的自然分界線(xiàn)在哪里。Sonia 的目標(biāo)是確定由公司提供保險(xiǎn)服務(wù)且因體重和/或高膽固醇患冠心病的風(fēng)險(xiǎn)非常高的人員,并試圖聯(lián)絡(luò)這些人員。 她了解患冠心病風(fēng)險(xiǎn)較低的人員,即體重和膽固醇水平較低的人員不太可能會(huì)參加她提供的項(xiàng)目。 她還了解可能存在高體重和低膽固醇、高體重 和 高膽固醇,以及低體重和高膽固醇的保單持有人。 她還認(rèn)識(shí)到可能會(huì)有許多人介于它們之間。 為了實(shí)現(xiàn)目標(biāo),她需要在數(shù)以千計(jì)的保單持有人中搜索具有類(lèi)似特征的群體,并制定相關(guān)且對(duì)這些不同的群體有吸引力的項(xiàng)目和溝通方式。使用該保險(xiǎn)公司的索賠數(shù)據(jù)庫(kù),Sonia 提取了 547 個(gè)隨機(jī)挑選的人員的三個(gè)屬性,即受保人最近的體檢表上記錄的體重(單位:磅)、最近一次驗(yàn)血時(shí)測(cè)得的膽固醇水平,以及性別。 和在許多數(shù)據(jù)集中的典型做法一樣,性別屬性使用 0 來(lái)表示女性,并使用 1 來(lái)表示男性。 我們將使用從 Sonia 公司的數(shù)據(jù)庫(kù)中提取的這些樣本數(shù)據(jù)構(gòu)建聚類(lèi)模型,以便幫助 Sonia 了解公司的客戶(hù)(即健康保險(xiǎn)保單持有人)根據(jù)體重、性別和膽固醇水平進(jìn)行分組的情況。 我們應(yīng)切記在構(gòu)建模型時(shí),均值尤其容易受到極端離群點(diǎn)的不當(dāng)影響,因此在使用 K 均值聚類(lèi)數(shù)據(jù)挖掘方法時(shí)查看是否存在不一致的數(shù)據(jù)至關(guān)重要。將 “.”數(shù)據(jù)集導(dǎo)入到 RapidMiner 數(shù)據(jù)存儲(chǔ)庫(kù)中,保存為//Local Repository/data/KMeans聚類(lèi)。我們可以看到先前定義的三個(gè)屬性有 547 個(gè)觀(guān)察項(xiàng)。 我們可以看到三個(gè)屬性中的每個(gè)屬性的平均值,以及對(duì)應(yīng)的標(biāo)準(zhǔn)差和范圍。 其中沒(méi)有看起來(lái)不一致的值(切記前面關(guān)于使用標(biāo)準(zhǔn)差查找統(tǒng)計(jì)離群點(diǎn)的備注)。 由于沒(méi)有缺失的值要處理,因此數(shù)據(jù)看起來(lái)非常干凈,并可直接進(jìn)行挖掘。 數(shù)據(jù)基本信息第一步:對(duì)數(shù)據(jù)進(jìn)行聚類(lèi)將數(shù)據(jù)拖拽到操作視圖界面,檢索“kMeans”操作符并將其與數(shù)據(jù)進(jìn)行連接,然后與輸出端口連接,點(diǎn)擊運(yùn)行,我們可以看到如圖 運(yùn)行結(jié)果, 中,我們可以設(shè)計(jì)聚成的k的類(lèi)數(shù),以及“max runs”最大循環(huán)迭代的次數(shù)。 kMeans聚類(lèi)參數(shù)設(shè)置第二步:結(jié)果集過(guò)濾將“Filter Examples”結(jié)果集過(guò)濾操作符拖進(jìn)操作界面,在參數(shù)設(shè)置中,選擇類(lèi)別等于類(lèi)別0。 操作符流程視圖 結(jié)果集過(guò)濾參數(shù)設(shè)置第三步:輸出結(jié)果點(diǎn)擊運(yùn)行, 篩選類(lèi)別后的輸出結(jié)果 這樣我們的主人公,就可以根據(jù)顯示輸出的結(jié)果,來(lái)重點(diǎn)關(guān)注疾病的高發(fā)人群,從而有針對(duì)性的進(jìn)行服務(wù)?!门袆e分析技術(shù)分類(lèi)運(yùn)動(dòng)員專(zhuān)攻項(xiàng)目Gill 運(yùn)營(yíng)著一個(gè)體育學(xué)院,旨在幫助高中年紀(jì)的運(yùn)動(dòng)員最大限度地發(fā)揮其在體育方面的潛力。 對(duì)于學(xué)院的男生,他側(cè)重于四個(gè)主要體育項(xiàng)目,即 橄欖球、籃球、棒球和曲棍球。 他發(fā)現(xiàn)雖然許多高中運(yùn)動(dòng)員在念高中時(shí)都喜歡參加多種體育項(xiàng)目,但隨著他們開(kāi)始考慮在大學(xué)時(shí)從事的體育項(xiàng)目,他們將傾向于專(zhuān)攻某一項(xiàng)。 通過(guò)多年來(lái)與運(yùn)動(dòng)員之間的合作,Gill 整理了一個(gè)內(nèi)容非常廣泛的數(shù)據(jù)集?,F(xiàn)在他想知道他是否可以使用先前部分客戶(hù)的以往成績(jī),為即將到來(lái)的高中運(yùn)動(dòng)員預(yù)測(cè)主攻的體育項(xiàng)目。最終,他希望可以就每個(gè)運(yùn)動(dòng)員可能最應(yīng)選擇專(zhuān)攻哪個(gè)體育項(xiàng)目,向他們
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1