freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘數(shù)據(jù)挖掘模型評估(存儲(chǔ)版)

2024-10-10 09:02上一頁面

下一頁面
  

【正文】 但是這個(gè)奇怪的舉措?yún)s使尿布和啤酒的銷量雙雙增加了。 ?這里要用到兩張表,一張表是該書店的會(huì)員,用會(huì)員 ID號(hào)來代替;另一張表是會(huì)員買了什么書。 ? 網(wǎng)上銷售點(diǎn):購物車交叉銷售、網(wǎng)上商品布局。 ? 商品布局管理即商品擺放位置對銷售起著至關(guān)重要的作用。 2020/10/5 66 利用數(shù)據(jù)挖掘技術(shù)幫助企業(yè)準(zhǔn)確制定營銷策略,主要表現(xiàn)在: ? ( 1)通過對市場同類產(chǎn)品和銷售情況、顧客情況的資料收集和分類分析,明確細(xì)分市場,確定本企業(yè)差別化的產(chǎn)品和服務(wù)定位、目標(biāo)顧客和市場營銷策略。 2020/10/5 70 ( 7)交叉銷售 2020/10/5 71 關(guān)聯(lián)規(guī)則 A1:地理位置無關(guān)型客戶= ≥ 重視物業(yè)管理 支持率 =%;可信度 =%;興趣度 =; 關(guān)聯(lián)規(guī)則 B1:重視物業(yè)管理= ≥ 地理位置無關(guān)型客戶 支持率 =%;可信度 =%;興趣度 =; 對比發(fā)現(xiàn):“重視物業(yè)管理的人不關(guān)心地理位置”的可能性( %)高于“不關(guān)心地理位置的人重視物業(yè)管理”的可能性( %)。 78 2020/10/5 Knowledge Discovery in Databases 79 ? 數(shù)據(jù)挖掘是知識(shí)發(fā)現(xiàn)的核心步驟 Data Cleaning Data Integration Databases Data Warehouse Taskrelevant Data Selection Data Mining Pattern Evaluation 2020/10/5 2020/10/5 80 Increasing potential to support business decisions End User Business Analyst Data Analyst DBA Decision Making Data Presentation Visualization Techniques Data Mining Information Discovery Data Exploration Statistical Summary, Querying, and Reporting Data Preprocessing/Integration, Data Warehouses Data Sources Paper, Files, Web documents, Scientific experiments, Database Systems 數(shù)據(jù)庫管理員 OLAP ?商務(wù)智能通常被理解為將企業(yè)中現(xiàn)有的數(shù)據(jù)轉(zhuǎn)化為知識(shí),幫助企業(yè)做出明智的業(yè)務(wù)經(jīng)營決策的工具。 77 ? 數(shù)據(jù)挖掘(從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)) ?數(shù)據(jù)挖掘就是從大量的、不完全的、 有噪聲的 、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。 2020/10/5 69 ? 例如,擁有汽車的新婚夫妻很可能購買兒童專用汽車椅,這個(gè)現(xiàn)象很容易被理解,并不需要應(yīng)用到數(shù)據(jù)挖掘中。 ? 根據(jù)研究得出:美國婦女的視線高度是 150公分左右,男性是 163公分左右,而最舒適的視線角度是視線高度以下 15度左右,所以最好的貨品陳列位置是在 130135公分之間。 優(yōu)化商品組合布局,正確安排商品進(jìn)貨與庫存 ? 從眾多的商品中發(fā)現(xiàn)創(chuàng)造價(jià)值最大的商品??蛻舴诸?、客戶價(jià)值分析與預(yù)測、客戶偏好分析、客戶信用分析以及欺詐檢測等。 ? 例如:購買了 《 月光寶盒( 2VCD) 》的顧客,對什么樣的 VCD還比較感興趣,購買的比較多呢?。您在 2020年四月一日用臟話侮辱警察 ,被判了十日拘役?!? () 51 2020/10/5 ? 顧客 :“哎呀 !好 ……, 我要一個(gè)家庭號(hào)特大披薩 ,要多少錢 ?” ? 客服 :“嗯,這個(gè)足夠您一家十口吃,六百九十九元。 6 ? 二四六八 ? 0000 ? 1 1 = 1 ? 10002 =100 100 100 ? 7/8 47 ? 不三不四 ? 接二連三 ? 陸續(xù)不斷 ? 無獨(dú)有偶 ? 掛萬漏一 ? 一成不變 ? 千方百計(jì) ? 七上八下 2020/10/5 ? 客服 :“東東披薩店您好 !請問有什么需要我為您服務(wù)?” ? 顧客 :“你 好 , 我想要 …… ” ? 客服 :“先生,請把您的 AIC會(huì)員卡號(hào)碼告我。 ? 大多數(shù)情況下,通常建議大家使用 SQL2020提供的置信度、支持度以及重要性這三個(gè)指標(biāo)作為關(guān)聯(lián)規(guī)則成效的綜合評判。 橫軸表示模型會(huì)根據(jù)行銷成功概率由高至低將客戶排序 縱軸表示行銷收益 ? 下面來看信用評級(jí)的預(yù)測模型,預(yù)測的目標(biāo)是違約客戶,假設(shè)每個(gè)客戶第一年帶來的信用卡刷卡手續(xù)費(fèi)以及利息收入為 6000元,每個(gè)信用卡違約客戶違約時(shí)金額為20200元。 ? AUC越接近于 1,表示模型的預(yù)測能力越高。 ? 分類矩陣是根據(jù)一個(gè)概率閥值將顧客分作兩種情況,過度簡化了實(shí)際的結(jié)果。 2020/10/5 22 ? Recall =預(yù)測會(huì)違約且實(shí)際違約 /所有實(shí)際會(huì)違約 =66/(66+185)=% ? 它的意義在于:預(yù)測出來會(huì)違約的人占了總體會(huì)違約的客戶多少百分比。 2020/10/5 18 預(yù)測值 1(實(shí)際“會(huì)違約”) 0(實(shí)際“不會(huì)違約”) 1 66 28 0 185 721 2020/10/5 19 ? 表中,預(yù)測為會(huì)違約且實(shí)際也會(huì)違約的有 66人,預(yù)測不會(huì)違約且實(shí)際沒有違約的有 721人,這些是分類正確者。 ? DM的價(jià)值就在于能夠利用歷史資料找出“小概率事件”。即有 32%的非違約戶被誤判為違約戶,因此準(zhǔn)確率只有 68%。 ? 但事實(shí)上,這樣評估出來的模型并不是最好的。 ? 假定你已經(jīng)訓(xùn)練了一個(gè)分類法,將醫(yī)療數(shù)據(jù)分類為“ cancer”或“ non_cancer”。 由 每 個(gè) 訓(xùn) 練 集 學(xué) 習(xí) , 得 到 一 個(gè) 分類 法 。總體準(zhǔn)確率估計(jì)取每次迭代準(zhǔn)確率的平均值。 ?另外,還有兩種提供分類法準(zhǔn)確率的策略:裝袋( bagging)和推進(jìn)( boosting)。在第 i次迭代,第 i折用作測試集,其余的子集都用于訓(xùn)練分類法。 通 過 取 得 票 的 平 均 值 , 或 者 多 數(shù) , 裝 袋 也可 以 是 連 續(xù) 值 的 預(yù) 測 。 2020/10/5 7 ? 為此,除用準(zhǔn)確率評價(jià)分類模型外,還需要使用靈敏性( sensitivity)和特效性( specificity)度量。 ? 根據(jù)此標(biāo)準(zhǔn), A公司所建模型的準(zhǔn)確度 92%,B公司的準(zhǔn)確度是 68%。 ? 如果把一個(gè)“會(huì)違約的人判斷成不會(huì)違約”
點(diǎn)擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1