freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第十講-機(jī)器學(xué)習(xí)-資料下載頁

2025-08-15 20:32本頁面
  

【正文】 是新穎的,這可以通過兩個(gè)途徑來衡量: ① 通過對當(dāng)前得到的數(shù)據(jù)和以前的數(shù)據(jù)或期望得到的數(shù)據(jù)的比較來判斷該模式的新穎程度 ② 二是通過其內(nèi)部所包含的知識,對比發(fā)現(xiàn)的模式與已有的模式的關(guān)系來判斷提取出的模式應(yīng)該是有意義的,這可以通過某些函數(shù)的值來衡量知識發(fā)現(xiàn)的目的就是將數(shù)據(jù)庫中隱含的模式以容易被人理解的形式表現(xiàn)出來,從而使人們更好地了解數(shù)據(jù)庫中所包含的信息。 如果一個(gè)表達(dá)式比列舉數(shù)據(jù)集中的元素的描述方法更為簡單時(shí),才可稱為模式。如 “如果成績在 81—90之問,則成績優(yōu)良 ”可稱為個(gè)模式,而 “如果成績?yōu)?8l, 82. 83, 84, 85, 86. 87, 88, 89或 9D,則成績優(yōu)良 ”就不能稱為個(gè)模式。知識發(fā)現(xiàn)處理過程 下面我們介紹兩類較具代表性的處理過程模型l 多處理階段過程模型( 1) 多處理階段模型將數(shù)據(jù)庫中的知識發(fā)現(xiàn)看做是一個(gè)多階段的處理過程,圖 1是費(fèi)亞得Usama 。 圖 1 費(fèi)亞得的知識處理模型l 在圖 1處理模型中, KDD處理過程共分為九個(gè)處理階段,這九個(gè)處理階段分別是數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)選擇、數(shù)據(jù)預(yù)處理、數(shù)據(jù)縮減、 KDD目標(biāo)確定、挖掘算法確定、數(shù)據(jù)挖掘、模式解釋及知識評價(jià)。每個(gè)處理階段 KDD系統(tǒng)會提供處理工具完成相應(yīng)的工作。在對挖掘的知識進(jìn)行評測后,根據(jù)結(jié)果可以決定是否重新進(jìn)行某些處理過程,在處理的任意階段都可以返回以前的階段進(jìn)行再處理。 l 多處理階段過程模型( 2)l 下面我們介紹的數(shù)據(jù)挖掘處理過程模型是Gee 在他的博士論文中提出的,雖然在某些地方與費(fèi)亞得給出的處理模型有一些區(qū)別,但這種區(qū)別主要表現(xiàn)在對整個(gè)處理過程的組織和表達(dá)方式上,在內(nèi)容上兩者并沒有非常本質(zhì)的區(qū)別。AnalyseResultsEngineeringCleanExtractData algorithm Run MiningData DataEngineering algorithmDefine the problem圖 2 John的知識處理模型l 以用戶為中心的處理模型 Brachman amp。 Anand從用戶的角度對 KDD處理過程進(jìn)行了分析。他們認(rèn)為數(shù)據(jù)庫中的知識發(fā)現(xiàn)應(yīng)該更著重于對用戶進(jìn)行知識發(fā)現(xiàn)的整個(gè)過程的支持,而不是僅僅限于在數(shù)據(jù)挖掘的一個(gè)階段上。通過對很多 KDD用戶在實(shí)際工作中遇到的問題的了解,他們發(fā)現(xiàn)用戶的很大一部分工作量是與數(shù)據(jù)庫的交互上。所以他們在開發(fā)數(shù)據(jù)挖掘系統(tǒng) IMACS (Interactive Marketing Analysis and Classification System) 時(shí)特別強(qiáng)調(diào)對用戶與數(shù)據(jù)庫交互的支持。圖 3給出了該模型的 框圖。圖 3 以用戶為中心的處理模型知識發(fā)現(xiàn)的方法( 1)傳統(tǒng)方法 :主要研究漸近理論,即當(dāng)樣本趨于無窮多時(shí)的統(tǒng)計(jì)性質(zhì)。統(tǒng)計(jì)方法處理過程分三個(gè)階段 :搜索數(shù)據(jù)、分析數(shù)據(jù)、進(jìn)行推理( 2)模糊集 :表示和處理不確定性數(shù)據(jù)的方法。不但可以處理不完全數(shù)據(jù)、噪聲或不精確數(shù)據(jù),還可以提供比傳統(tǒng)方法更靈巧、更平滑的性能。( 3)支撐向量機(jī) SVM (support vector machine) 建立在計(jì)算學(xué)習(xí)理論的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則之上,其主要思想是針對兩類分類問題,在高維空間中尋找一個(gè)超平面作為兩類的分割,以保證最小的分類錯(cuò)誤率。 (4)粗糙集( rough set) 由波拉克 ( Pawlak) 在 1982年提出。它是一種新的數(shù)學(xué)工具,用來處理含糊性和不確定性。粗糙集是由集合的下近似、上近似來定義的。邊界區(qū)的成員可能是該集合的成員,但不是確定的成員。它常與規(guī)則歸納、分類和聚類方法結(jié)合起來使用,很少單獨(dú)使用。2. 機(jī)器學(xué)習(xí)方法( 1)規(guī)則歸納 規(guī)則反映數(shù)據(jù)項(xiàng)中某些屬性或數(shù)據(jù)集中某些數(shù)據(jù)項(xiàng)之間的統(tǒng)計(jì)相關(guān)性。( 2)決策樹 應(yīng)用于分類和預(yù)測,提供了一種展示在什么條件下會得到什么值這類規(guī)則的方法,一個(gè)決策樹表示一系列的問題,每個(gè)問題決定了繼續(xù)下去的問題會是什么。 適合于處理非數(shù)值型數(shù)據(jù),需要在生成決策樹后 再對決策樹進(jìn)行剪枝處理,最后將決策樹轉(zhuǎn)化為規(guī)則,用于對新事例進(jìn)行分類。( 3)范例推理 直接使用過去的經(jīng)驗(yàn)或解法來求解給定的問題。當(dāng)給定一個(gè)特定問題時(shí),范例推理就檢索范例庫,尋找相似的范例。如果存在相似的范例,它們的解法就可以用來求解新的問題。該新問題被加到范例庫,以便將來參考。( 4)貝葉斯信念網(wǎng)絡(luò) 是概率分布的圖的表示,是一種直接的、非循環(huán)的圖。節(jié)點(diǎn)表示屬性變量,邊表示屬性變量之間的依賴關(guān)系。 ( 5)科學(xué)發(fā)現(xiàn) 在試驗(yàn)環(huán)境下發(fā)現(xiàn)科學(xué)定理。( 6)遺傳算法 模仿人工選擇培育良種的思路,從一個(gè)初始規(guī)則集合開始,迭代的通過交換對象成員產(chǎn)生群體(繁殖),評估并擇優(yōu)復(fù)制逐代積累計(jì)算,最終得到最有價(jià)值的知識集。 人工神經(jīng)網(wǎng)絡(luò)方法:前饋式網(wǎng)絡(luò)、反饋式網(wǎng)絡(luò)和自組織網(wǎng)絡(luò)。主要用于分類、聚類、特征挖掘、預(yù)測等方面。通過向一個(gè)訓(xùn)練數(shù)據(jù)集學(xué)習(xí)和應(yīng)用所學(xué)知識生成分類和預(yù)測的模式。 可視化就是把數(shù)據(jù)、信息和知識轉(zhuǎn)化為可視的表示形式的過程。信息的可視化就是要處理這些數(shù)據(jù)種類以及它們在商業(yè)和信息技術(shù)領(lǐng)域的相關(guān)的分析任務(wù),以發(fā)現(xiàn)信息中的模式、聚類、區(qū)別、聯(lián)系和趨勢等。知識發(fā)現(xiàn)的應(yīng)用l 應(yīng)用領(lǐng)域l l l l l l 典型案例 市場分析和管理l 數(shù)據(jù)從那里來 ?l 信用卡交易 , 會員卡 , 商家的優(yōu)惠卷 , 消費(fèi)者投訴電話 , 公眾生活方式研究l 目標(biāo)市場l 構(gòu)建一系列的 “ 客戶群模型 ” ,這些顧客具有相同特征 : 興趣愛好 , 收入水平 , 消費(fèi)習(xí)慣 ,等等l 確定顧客的購買模式l 應(yīng)用 1:交叉市場分析l 貨物銷售之間的相互聯(lián)系和相關(guān)性,以及基于這種聯(lián)系上的預(yù)測 l 應(yīng)用 2:顧客分析l 哪類顧客購買那種商品 (聚類分析或分類預(yù)測 )l 應(yīng)用 3:客戶需求分析l 確定適合不同顧客的最佳商品l 預(yù)測何種因素能夠吸引新顧客l 應(yīng)用 4:提供概要信息l 多維度的綜合報(bào)告l 統(tǒng)計(jì)概要信息 (數(shù)據(jù)的集中趨勢和變化 )公司分析和風(fēng)險(xiǎn)管理l 財(cái)務(wù)計(jì)劃l 現(xiàn)金流轉(zhuǎn)分析和預(yù)測l 交叉區(qū)域分析和時(shí)間序列分析(財(cái)務(wù)資金比率,趨勢分析等等)l 資源計(jì)劃l 總結(jié)和比較資源和花費(fèi)l 競爭l 對競爭者和市場趨勢的監(jiān)控 l 將顧客按等級分組和基于等級的定價(jià)過程l 將定價(jià)策略應(yīng)用于競爭更激烈的市場中欺詐行為檢測和異常模式的發(fā)現(xiàn)l 方法 : 對欺騙行為進(jìn)行聚類和建模,并進(jìn)行孤立點(diǎn)分析l 應(yīng)用 : 保險(xiǎn)、衛(wèi)生保健、零售業(yè)、信用卡服務(wù)、電信等l 汽車保險(xiǎn) : 對相撞事件的分析 ,發(fā)掘索賠是否是欺詐行為l 洗錢 : 發(fā)現(xiàn)可疑的貨幣交易行為 l 醫(yī)療保險(xiǎn)l 職業(yè)病人 , 醫(yī)生以及相關(guān)數(shù)據(jù)分析l 不必要的或相關(guān)的測試l 電信 : 電話呼叫欺騙行為l 電話呼叫模型 : 呼叫目的地,持續(xù)時(shí)間,日或周呼叫次數(shù) . 分析該模型發(fā)現(xiàn)與期待標(biāo)準(zhǔn)的偏差l 零售產(chǎn)業(yè)l 分析師估計(jì)有 38%的零售額下降是由于雇員的不誠實(shí)行為造成的機(jī)器學(xué)習(xí)和模式識別的區(qū)別l 機(jī)器學(xué)習(xí) l 要使計(jì)算機(jī)具有知識一般有兩種方法;一種是由知識工程師將有關(guān)的知識歸納、整理,并且表示為計(jì)算機(jī)可以接受、處理的方式輸入計(jì)算機(jī)。另一種是使計(jì)算機(jī)本身有獲得知識的能力,它可以學(xué)習(xí)人類已有的知識,并且在實(shí)踐過程中不總結(jié)、完善,這種方式稱為機(jī)器學(xué)習(xí)。 l 機(jī)器學(xué)習(xí)的研究,主要在以下三個(gè)方面進(jìn)行:一是研究人類學(xué)習(xí)的機(jī)理、人腦思維的過程;和機(jī)器學(xué)習(xí)的方法;以及建立針對具體任務(wù)的學(xué)習(xí)系統(tǒng)。 l 機(jī)器學(xué)習(xí)的研究是在信息科學(xué)、腦科學(xué)、神經(jīng)心理學(xué)、邏輯學(xué)、模糊數(shù)學(xué)等多種學(xué)科基礎(chǔ)上的。依賴于這些學(xué)科而共同發(fā)展。目前已經(jīng)取得很大的進(jìn)展,但還沒有能完全解決問題。 l 模式識別 l 模式識別是研究如何使機(jī)器具有感知能力,主要研究視覺模式和聽覺模式的識別。如識別物體、地形、圖象、字體(如簽字)等。在日常生活各方面以及軍事 上都有廣大的用途。近年來迅速發(fā)展起來應(yīng)用模糊數(shù)學(xué)模式、人工神經(jīng)網(wǎng)絡(luò)模式的方法逐漸取代傳統(tǒng)的用統(tǒng)計(jì)模式和結(jié)構(gòu)模式的識別方法。 特別神經(jīng)網(wǎng)絡(luò)方法在模式識別中取得較大進(jìn)展。
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1