freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘及其應(yīng)用(留存版)

2025-08-08 21:30上一頁面

下一頁面
  

【正文】 是為了解決傳統(tǒng)分析方法的不足,并針對大規(guī)模數(shù)據(jù)的分析處理而出現(xiàn)的。下面對若干分類問題進(jìn)行簡要分析。決策樹很擅長處理非數(shù)值型數(shù)據(jù),從決策樹中可以方便地提取分類規(guī)則。因此類c的后驗(yàn)概率P(x|c(diǎn))的確定取決于對類條件概率P(x|c(diǎn))的估計。一般的,權(quán)將最終收斂,學(xué)習(xí)過程停止。若規(guī)則滿足預(yù)先指定的最小支持度,則該規(guī)則是頻繁;若給定數(shù)據(jù)集中包含conset的樣本c%屬于類y,則規(guī)則的置信度為c;若滿足最小置信度,則該規(guī)則是精確的。根據(jù)適者生存的原則,形成由當(dāng)前群體中最適合的規(guī)則組成的新群體,以及這些規(guī)則的后代。而這些會員中有的人會響應(yīng)廣告宣傳,有的人就算得到廣告冊不會購買。4.3.2在圖中,可以找出幾個有用的節(jié)點(diǎn):1.年齡小于32歲,居住在太平洋地區(qū)的會員有72.75%的概率購買自行車;2.年齡在32和39歲之間的會員有68.42%的概率購買自行車;3.年齡在39和67歲之間,上班距離不大于10公里,只有1輛汽車的會員有66.08%的概率購買自行車;4.年齡小于32歲,不住在太平洋地區(qū),上班距離在1公里范圍內(nèi)的會員有51.92%的概率購買自行車;數(shù)據(jù)倉庫和數(shù)據(jù)挖掘[M].2006;[2].譚建豪。當(dāng)然,數(shù)據(jù)挖掘技術(shù)同樣應(yīng)該包括對于所抽取規(guī)則的準(zhǔn)確性及數(shù)據(jù)的安全性、私密性的保護(hù)等領(lǐng)域的研究。節(jié)點(diǎn)中的條包含兩種顏色,紅色和藍(lán)色,分別表示此節(jié)點(diǎn)中的事例購買和不購買自行車的比例。4.?dāng)?shù)據(jù)挖掘應(yīng)用實(shí)例4.1提出問題。如果找不到同樣的案例,則基于案例的推理將搜索具有類似于新案例成分的訓(xùn)練案例,這些訓(xùn)練案例可視為新案例的鄰接者。算法掃描柵格,搜索規(guī)則的矩形聚類。這種神經(jīng)網(wǎng)絡(luò)具有一個輸入層和一個輸出層,在兩者之間可能包含多個中間層,這些中間層叫做隱藏層。 準(zhǔn)確估計類標(biāo)號和屬性值的每一種可能組合的后驗(yàn)概率非常困難,因?yàn)榧幢銓傩詳?shù)目不是很大,仍然需要很大的訓(xùn)練集。最為典型的決策樹學(xué)習(xí)算法是ID3,它采用自頂向下不回溯策略,能保證找到一個簡單的樹。分類技術(shù)是數(shù)據(jù)挖掘中應(yīng)用領(lǐng)域極其廣泛的重要技術(shù)之一。在過去,我們常用的知識獲取方法是由知識工程師把專家經(jīng)驗(yàn)知識經(jīng)過分析、篩選、比較、綜合、再提取出知識和規(guī)則。分類技術(shù)是數(shù)據(jù)挖掘中應(yīng)用領(lǐng)域極其廣泛的重要技術(shù)之一。數(shù)據(jù)挖掘通過在大量數(shù)據(jù)的基礎(chǔ)上對各種學(xué)習(xí)算法的訓(xùn)練,得到數(shù)據(jù)對象間的關(guān)系模式,這些模式反映了數(shù)據(jù)的內(nèi)在特性,是對數(shù)據(jù)包含信息的更高層次的抽象。2.1基于決策樹的分類 基于決策樹的分類算法是數(shù)據(jù)挖掘中最為典型的分類算法。其主要優(yōu)點(diǎn)是描述簡單,分類速度快,特別適合大規(guī)模的數(shù)據(jù)處理。對類條件概率P(x|c(diǎn))的估計,常使用兩種貝葉斯分類方法來實(shí)現(xiàn):樸素貝葉斯分類和貝葉斯信念網(wǎng)絡(luò)。算法的每一次迭代包括兩個階段:前向階段和后向階段。如果一個規(guī)則項(xiàng)集具有相同的condset,則選擇具有最高置信度的規(guī)則作為可能規(guī)則,代表該集合。后代通過使用諸如交叉和變異等遺傳操作來創(chuàng)建。所以最好是將廣告投遞給那些對廣告冊感興趣從而購買自行車的會員。4.4模型訓(xùn)練后,還無法確定模型的分類方法是否準(zhǔn)確。數(shù)據(jù)挖掘技術(shù)[M].2009;[3].david hand,heikiki manrlla等著。應(yīng)用數(shù)據(jù)挖掘技術(shù),基于動態(tài)數(shù)據(jù)庫、面向?qū)ο蠹夹g(shù)、多媒體數(shù)據(jù)庫及從國際互連網(wǎng)上抽取新的、有用的規(guī)則。所以第一次拆分后,年齡在39和67歲的節(jié)點(diǎn)顏色最深,年齡大于67歲的節(jié)點(diǎn)顏色最淺。數(shù)據(jù)從各種應(yīng)用系統(tǒng)中采集,經(jīng)按不同條件分類,存放到數(shù)據(jù)倉庫,允許管理人員、分析人員、采購人員、市場人員和客戶訪問,利用數(shù)據(jù)挖掘工具對這些數(shù)據(jù)進(jìn)行分析,為管理者提供高效的科學(xué)決策工具。如果找到一個,則返回附在該案例上的解。關(guān)聯(lián)規(guī)則畫在2D柵格上。后向傳播算法是在多層前饋神經(jīng)網(wǎng)絡(luò)上進(jìn)行學(xué)習(xí)的。P(xvc)是假定c成立的情況下,樣本x的支持度,
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1