freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘數(shù)據(jù)挖掘模型評估(留存版)

2024-10-30 09:02上一頁面

下一頁面
  

【正文】 400000 300000 202000 0 100000 — 15萬 535萬 假設(shè)行銷活動針對全體客戶進行,獲利為15萬 從圖上看,在概率最高的前 34%39%之間名單進行行銷,可以獲利的最高點是 535萬元。 2 ? 2≦ x≦ 3 ? 40 247。” ( ) 54 2020/10/5 ? 顧客 : ? 客服 :“陳先生 ,請您說話小心一點。 2020/10/5 數(shù)據(jù)挖掘所能解決的典型商業(yè)問題包括: ? 銀行:反欺詐行為、關(guān)聯(lián)銷售、市場競爭分析。因此,該公司重新安排貨架的擺設(shè),使橘子汁的銷量能夠增加到最大 ? 例如,一個超市營銷的例子,經(jīng)由記錄客戶的消費記錄與采購路線,超級市場的廚房用品是按照女性的視線高度來擺放的。第一個簇由前四篇文章組成,對應(yīng)于經(jīng)濟新聞,而第二個簇包含后四篇文章,對應(yīng)于衛(wèi)生保健新聞。說明關(guān)聯(lián)規(guī)則 B1是一條更有意義的關(guān)聯(lián)規(guī)則。 2020/10/5 65 考慮購買者在商店里所穿行的路線、購買時間和地點、貨架的使用效率、暢銷商品的類別、不同商品一起購買的概率,進行挖掘。然后,應(yīng)用 Data Mining技術(shù),建立數(shù)據(jù)挖掘模型?!? ? 客服 :“陳先生 ,根據(jù)您的記錄 , 您已經(jīng)超過今日提款機提款限額。在 SQL2020中,當規(guī)則為正值時,重要性圖示會是藍色,如果負值時,重要性規(guī)則會是紅色;規(guī)則重要性排序是根據(jù)重要性指標絕對值進行的。 ? 損失模型:預測的小概率事件為企業(yè)帶來大量損失。 ? 完美的預測模型反查率是 100%,但是反查率與回應(yīng)率是互相矛盾的。 2020/10/5 16 H0 為真 H0 為假 真實情況 所作判斷 接受 H0 拒絕 H0 正確 正確 棄真錯誤 ? 取偽錯誤 ? 兩類錯誤 犯第一類錯誤是棄真錯誤; 犯第二類錯誤是取偽錯誤 。 ? 根據(jù)此標準, A公司所建模型的準確度 92%,B公司的準確度是 68%。 通 過 取 得 票 的 平 均 值 , 或 者 多 數(shù) , 裝 袋 也可 以 是 連 續(xù) 值 的 預 測 。 ?另外,還有兩種提供分類法準確率的策略:裝袋( bagging)和推進( boosting)。 由 每 個 訓 練 集 學 習 , 得 到 一 個 分類 法 。 ? 但事實上,這樣評估出來的模型并不是最好的。 ? DM的價值就在于能夠利用歷史資料找出“小概率事件”。 2020/10/5 22 ? Recall =預測會違約且實際違約 /所有實際會違約 =66/(66+185)=% ? 它的意義在于:預測出來會違約的人占了總體會違約的客戶多少百分比。 ? AUC越接近于 1,表示模型的預測能力越高。 ? 大多數(shù)情況下,通常建議大家使用 SQL2020提供的置信度、支持度以及重要性這三個指標作為關(guān)聯(lián)規(guī)則成效的綜合評判?!? () 51 2020/10/5 ? 顧客 :“哎呀 !好 ……, 我要一個家庭號特大披薩 ,要多少錢 ?” ? 客服 :“嗯,這個足夠您一家十口吃,六百九十九元。 ? 例如:購買了 《 月光寶盒( 2VCD) 》的顧客,對什么樣的 VCD還比較感興趣,購買的比較多呢?。 優(yōu)化商品組合布局,正確安排商品進貨與庫存 ? 從眾多的商品中發(fā)現(xiàn)創(chuàng)造價值最大的商品。 2020/10/5 69 ? 例如,擁有汽車的新婚夫妻很可能購買兒童專用汽車椅,這個現(xiàn)象很容易被理解,并不需要應(yīng)用到數(shù)據(jù)挖掘中。 78 2020/10/5 Knowledge Discovery in Databases 79 ? 數(shù)據(jù)挖掘是知識發(fā)現(xiàn)的核心步驟 Data Cleaning Data Integration Databases Data Warehouse Taskrelevant Data Selection Data Mining Pattern Evaluation 2020/10/5 2020/10/5 80 Increasing potential to support business decisions End User Business Analyst Data Analyst DBA Decision Making Data Presentation Visualization Techniques Data Mining Information Discovery Data Exploration Statistical Summary, Querying, and Reporting Data Preprocessing/Integration, Data Warehouses Data Sources Paper, Files, Web documents, Scientific experiments, Database Systems 數(shù)據(jù)庫管理員 OLAP ?商務(wù)智能通常被理解為將企業(yè)中現(xiàn)有的數(shù)據(jù)轉(zhuǎn)化為知識,幫助企業(yè)做出明智的業(yè)務(wù)經(jīng)營決策的工具。 2020/10/5 66 利用數(shù)據(jù)挖掘技術(shù)幫助企業(yè)準確制定營銷策略,主要表現(xiàn)在: ? ( 1)通過對市場同類產(chǎn)品和銷售情況、顧客情況的資料收集和分類分析,明確細分市場,確定本企業(yè)差別化的產(chǎn)品和服務(wù)定位、目標顧客和市場營銷策略。 ? 網(wǎng)上銷售點:購物車交叉銷售、網(wǎng)上商品布局。 ? 但是這個奇怪的舉措?yún)s使尿布和啤酒的銷量雙雙增加了?!? 48 2020/10/5 ( ) ? 顧客 : “我家,為什么你知道我所有的電話號碼?” ? 客服 : “陳先生,因為我們有連線“ AIC CRM 系統(tǒng) ” 。 ?如果預測的變量是連續(xù)型變量時,前面的分類矩陣、增益圖和收益圖都無法使用。 2020/10/5 27 2020/10/5 28 橫軸百分比代表根據(jù) DM模型根據(jù)概率由高到低排序后的名單占總體百分比。 其中,后者還會造成比較嚴重的損失,是值得關(guān)注的部分。 2020/10/5 13 原因在于兩類錯誤,忽略了“ 錯誤不等價 ”。但我們希望評估該分類能夠識別“ cancer”(稱作正樣本)的情況。訓練和測試 k次。 ? 在 k— 折交叉確認( k— fold cross—validation)中,初試數(shù)據(jù)被劃分成 k個互不相交的子集或“折”,每個折的大小大致相等。90%的準確率使得該分類法看上去相當準確,但是如果實際只有 3— 4%的訓練樣本是“ cancer”會怎么樣? ? 顯然, 90%的準確率是不能接受的 —— 該分類法只能正確的標記“ non_can
點擊復制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1