freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘數(shù)據(jù)挖掘模型評估-文庫吧在線文庫

2025-10-16 09:02上一頁面

下一頁面
  

【正文】 ,這家銀行損失 20~ 30萬元的現(xiàn)金卡卡金,但是如果將一個“不會違約的人錯判成違約”,只是劃分了一些審查成本以及可能因為保守給予額度而造成的機會成本損失。 2020/10/5 16 H0 為真 H0 為假 真實情況 所作判斷 接受 H0 拒絕 H0 正確 正確 棄真錯誤 ? 取偽錯誤 ? 兩類錯誤 犯第一類錯誤是棄真錯誤; 犯第二類錯誤是取偽錯誤 。 2020/10/5 20 主要看三個指標(biāo),即回應(yīng)率、反查率以及間距縮減。 ? 完美的預(yù)測模型反查率是 100%,但是反查率與回應(yīng)率是互相矛盾的。 縱軸則是在這批名單中小概率事件的人數(shù)占總體小概率事件人數(shù)的百分比。 ? 損失模型:預(yù)測的小概率事件為企業(yè)帶來大量損失。此時,在 SQL中 “增益圖”會自動切換到“散布圖”。在 SQL2020中,當(dāng)規(guī)則為正值時,重要性圖示會是藍色,如果負值時,重要性規(guī)則會是紅色;規(guī)則重要性排序是根據(jù)重要性指標(biāo)絕對值進行的。” 49 ?客服 : “陳先生您好,您是住在泉州街一號二樓 ,您家的電話是 23939889,您的公司電話是 23113731, 您的移動電話是 939956956?!? ? 客服 :“陳先生 ,根據(jù)您的記錄 , 您已經(jīng)超過今日提款機提款限額。 ? 原因何在? 58 2020/10/5 ? 原來,美國的婦女們經(jīng)常會囑咐她們的丈夫下班以后要為孩子買尿布。然后,應(yīng)用 Data Mining技術(shù),建立數(shù)據(jù)挖掘模型。 2020/10/5 63 ? 應(yīng)用之一是通過評價交易數(shù)目、交易金額、賬戶信息如姓名變化和地址變遷、換卡申請等非金融信息的組合來實現(xiàn)。 2020/10/5 65 考慮購買者在商店里所穿行的路線、購買時間和地點、貨架的使用效率、暢銷商品的類別、不同商品一起購買的概率,進行挖掘。(業(yè)績分析) ? ( 2)正確安排商品進貨與庫存,降低庫存成本。說明關(guān)聯(lián)規(guī)則 B1是一條更有意義的關(guān)聯(lián)規(guī)則。 ?一般由數(shù)據(jù)倉庫、聯(lián)機分析處理、數(shù)據(jù)挖掘、數(shù)據(jù)備份和恢復(fù)等部分組成。第一個簇由前四篇文章組成,對應(yīng)于經(jīng)濟新聞,而第二個簇包含后四篇文章,對應(yīng)于衛(wèi)生保健新聞。再將這些資料與主數(shù)據(jù)庫的人口統(tǒng)計資料結(jié)合在一起, Safeway的營銷部門就可以根據(jù)每個家庭的特性,也就是哪些季節(jié)會購買哪些產(chǎn)品的趨勢,發(fā)出郵件。因此,該公司重新安排貨架的擺設(shè),使橘子汁的銷量能夠增加到最大 ? 例如,一個超市營銷的例子,經(jīng)由記錄客戶的消費記錄與采購路線,超級市場的廚房用品是按照女性的視線高度來擺放的。如果有一天發(fā)現(xiàn)當(dāng)日其信用卡賬戶有 15筆交易,例外報告將要求發(fā)卡行聯(lián)系持卡人進行確認。 2020/10/5 數(shù)據(jù)挖掘所能解決的典型商業(yè)問題包括: ? 銀行:反欺詐行為、關(guān)聯(lián)銷售、市場競爭分析。 ? 這種方法是給客戶提供其他的相關(guān)書籍,也就是在客戶購買了一種書籍之后,推薦給客戶應(yīng)該感興趣的其他相關(guān)書籍?!? ( ) 54 2020/10/5 ? 顧客 : ? 客服 :“陳先生 ,請您說話小心一點。” ? 顧客 :“你怎么知道我會喜歡吃這種的 ?” ? 客服 :“喔 ! 您上星期一在中央圖書館借了一本 《 低脂健康食譜 》 。 2 ? 2≦ x≦ 3 ? 40 247。 2020/10/5 39 ? 至于關(guān)聯(lián)規(guī)則,通常來說關(guān)聯(lián)規(guī)則也是無監(jiān)督學(xué)習(xí),因為它的項目(例如,產(chǎn)品組合)過多,因此,每個選項本身就是小概率事件,所以不適合使用分類矩陣、增益圖和收益圖等工具來評估。 ? 所以每打出去一通電話: ?銷售成功: 1000— 250=收益 750(即正確預(yù)測稀有事件) ?銷售失?。簱p失 250元 2020/10/5 33 ? 直效行銷設(shè)定: 總體: 50000;固定成本: 202000;單位成本:250;每個收益: 1000 2020/10/5 34 600000 500000 400000 300000 202000 0 100000 — 15萬 535萬 假設(shè)行銷活動針對全體客戶進行,獲利為15萬 從圖上看,在概率最高的前 34%39%之間名單進行行銷,可以獲利的最高點是 535萬元。 ? AUC(area under curve):模型曲線下面的陰影面積與完美模型曲線下面陰影面積的比值。 2020/10/5 26 ? 很少有模型同時能夠滿足上述三個指標(biāo)的要求,當(dāng)回應(yīng)率很高時,一定是篩選高概率族群,因此名單間距縮減一定會變低,但是會遺漏掉低概率族群必定會造成反查降低,所以若只看分類矩陣,找不出最好的模型。 ? 回應(yīng)率高并不代表一定是好模型,因為如果利用數(shù)據(jù)挖掘模型從一萬人中挑出 10個最有可能會買產(chǎn)品的顧客,結(jié)果回應(yīng)率是 100%,但是卻漏掉了大多數(shù)會買產(chǎn)品的顧客,因此,還得參考“反查率”這個指標(biāo)。 ? 例,把一個好賬的人當(dāng)作呆賬是第一類錯誤,把一個呆賬的人當(dāng)作好賬是第二類錯誤。那么,只針對預(yù)測的小概率事件采取行動就會避免浪費。 ? B:在根據(jù)評分由高至低篩選出來前 40%的名單中,可以將所有的違約戶都找出來。準(zhǔn)確度越高模型就越好。?推進 即使用相同的分類器,各個分類器不是獨立的;使用同一個算法對樣本迭代訓(xùn)練,后建立的分類器關(guān)注于先前建立的分類器不能更好處理的部分數(shù)據(jù);最終的輸出為各個分類器的加權(quán)投票。 由 于 使 用 放 回 選 樣 , 的 某 些 樣 本 可 能 不 在 中 , 而其 他 的 可 能 出 現(xiàn) 多 次 。 ?隨機子選樣是“保持”方法的一種變形,它將“保持”方法重復(fù) k次。 ?保持和 k折交叉 ① 在保持方法中,給定數(shù)據(jù)隨機劃分成兩個獨立的集合:訓(xùn)練集和測試集。 ? 準(zhǔn)確率估計是 k次迭代正確分類數(shù)除以初始數(shù)據(jù)中的樣本總數(shù)。?裝袋 2020/10/5 6 tC 在 推 進 中 , 每 個 訓(xùn) 練 樣 本 賦 予 一 個 權(quán) 。 ? 還可以使用精度( precision)來度量,即評估標(biāo)記為“ cancer”,實際是“ cancer”的樣本百分比。 ? 銀行和 A公司簽約。 ? 因此兩種誤判所造成的效益影響是不等價的。 2020/10/5 17 ? 對于 DM來說,通常第二類錯誤的損失或收益要比第一類高。 ? Response rate =預(yù)測會違約且實際會違約 /所有預(yù)測會違約 =66/(66+28)=% ?預(yù)測模型回應(yīng)率的高低須和總體回應(yīng)率比較: ? 總體 response rate =總體實際會違約 /總體=(66+185)/(66+185+28
點擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1