freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘現(xiàn)階段最常用的算法-文庫(kù)吧資料

2025-06-29 20:43本頁(yè)面
  

【正文】 用。然后利用該網(wǎng)絡(luò)就可以得到輸出的分類(lèi)。該方法的思路是一種generaltospecific的方法,該方法從一個(gè)空規(guī)則開(kāi)始,然后向規(guī)則中依次逐漸增加屬性測(cè)試條件,選擇該屬性測(cè)試值(也就是測(cè)試分界點(diǎn),attr val)的依據(jù)就是是否能夠最大限度得改進(jìn)規(guī)則的分類(lèi)質(zhì)量。因?yàn)闆Q策樹(shù)天然的就是規(guī)則。基于規(guī)則的分類(lèi)器這種分類(lèi)器利用IF THEN的規(guī)則來(lái)進(jìn)行分類(lèi)。樸素貝葉斯分類(lèi)器的升級(jí)版本就是貝葉斯網(wǎng)絡(luò),因?yàn)闃闼刎惾~斯網(wǎng)絡(luò)假設(shè)樣本的特征向量的各個(gè)特征屬性是獨(dú)立的,但對(duì)于現(xiàn)實(shí)世界,這樣的建模未必合理,因此有人就提出了貝葉斯網(wǎng)絡(luò),貝葉斯網(wǎng)絡(luò)假設(shè)各個(gè)屬性之間是存在條件概率的。貝葉斯分類(lèi)器分為兩種,一種是樸素貝葉斯分類(lèi)器,它基于貝葉斯理論:其中X代表特征向量, .:該算法是數(shù)據(jù)挖掘中常用的一類(lèi)方法。分類(lèi)和預(yù)測(cè)分類(lèi)樹(shù)分類(lèi)樹(shù)是一種很常用的分類(lèi)方法,它該算法的框架表述還是比較清晰的,從根節(jié)點(diǎn)開(kāi)始不斷得分治,遞歸,生長(zhǎng),直至得到最后的結(jié)果。但是還有更好的方法,就是在挖掘的過(guò)程中利用這些條件,從而縮小整個(gè)挖掘過(guò)程中的search space,從而提高效率。對(duì)于上述所提到的關(guān)系挖掘,有一種稱(chēng)之為constraintbased association mining,這是一種特殊的關(guān)系挖掘,它對(duì)于所挖掘出的條件加了一些限制條件,這些限制條件可能是由用戶(hù)提出的,其主要目的是排除一些不感興趣的關(guān)系。所謂quantitative association rules是這樣一種關(guān)系模式:該關(guān)系模式的挖掘,首先是確定我們所感興趣的屬性:quan1,quan2,cat,然后根據(jù)事先確定的間隔,將quan1,quan2按照一定的間隔劃分成一定的catorgory,然后進(jìn)行頻繁模式挖掘,得出一些關(guān)系,然后將這些關(guān)系按照grid進(jìn)行聚合,生成最后的關(guān)系模式。關(guān)系挖掘的基礎(chǔ)是頻繁模式挖掘,通過(guò)頻繁模式挖掘,很容易得出關(guān)系,舉例就很容易明白,比如我們得到一個(gè)頻繁集合:那么通過(guò)排列組合可以得到l的子集集合:那么很容易得到下面的推理集合,也就是挖掘出的關(guān)系:所有的關(guān)系挖掘本質(zhì)上都是基于頻繁模式推導(dǎo)出來(lái)的。為了解決這個(gè)問(wèn)題,一個(gè)直接的思路是將數(shù)據(jù)庫(kù)水平分表到各臺(tái)機(jī)器上,在各臺(tái)機(jī)器上執(zhí)行本地的FP Growth,然后再將各臺(tái)機(jī)器上的結(jié)果匯總起來(lái),得到最終的FP Growth的結(jié)果。頻繁模式挖掘還有一種更加高效的方式,就是FP Growth,該方法通過(guò)掃描一遍數(shù)據(jù)庫(kù),在內(nèi)存中構(gòu)造一顆FP tree,基于這棵樹(shù)就可以產(chǎn)生所有的頻繁模式。然后再由二維表產(chǎn)生三維表,直至到n維表。頻繁模式的思路很簡(jiǎn)單,首先統(tǒng)計(jì)出每個(gè)單個(gè)商品出現(xiàn)的次數(shù),這就構(gòu)成了一個(gè)一維表。它將自變量與因變量的關(guān)系假定是S行的形狀,當(dāng)自變量很小時(shí),機(jī)率值接近為零;當(dāng)自變量值慢慢增加時(shí),機(jī)率值沿著曲線增加,增加到一定程度時(shí),曲線協(xié) 率開(kāi)始減小,故機(jī)率值介于0與1之間。羅吉斯回歸分析(Logistic Analysis)當(dāng)判別分析中群體不符合正態(tài)分布假設(shè)時(shí),羅吉斯回歸分析是一個(gè)很好的替代方法。(3) 找出哪些預(yù)測(cè)變量具有最大的區(qū)別能力。(1) 找出預(yù)測(cè)變量的線性組合,使組間變異相對(duì)于組內(nèi)變異的比值為最大,而每一個(gè)線性組合與先前已經(jīng)獲得的線性組合均不相關(guān)。判別分析(Discriminant Analysis)當(dāng)所遭遇問(wèn)題它的因變量為定性(categorical),而自變量(預(yù)測(cè)變量)為定量(metric)時(shí),判別分析為一非常適當(dāng)之技術(shù),通常應(yīng)用在解決 分類(lèi)的問(wèn)題上面。若面對(duì)新的例證,神經(jīng)網(wǎng)絡(luò)即可根據(jù)其過(guò)去學(xué)習(xí)的成果歸納后,推導(dǎo)出新的結(jié)果,乃屬于機(jī)器學(xué)習(xí)的一種。這樣的工具亦能輔
點(diǎn)擊復(fù)制文檔內(nèi)容
職業(yè)教育相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1