freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)-文庫(kù)吧

2025-06-07 14:40 本頁(yè)面


【正文】 涵數(shù)據(jù)庫(kù)),而不是通常概念上的用于存放大量信息的數(shù)據(jù)庫(kù)(也稱外延數(shù)據(jù)庫(kù))。(3)推理機(jī)推理機(jī)是一組用來(lái)控制、協(xié)調(diào)整個(gè)專家系統(tǒng)的程序。它根據(jù)全局?jǐn)?shù)據(jù)庫(kù)的當(dāng)前內(nèi)容,從知識(shí)庫(kù)中選擇可匹配的規(guī)則,并通過(guò)執(zhí)行規(guī)則來(lái)修改數(shù)據(jù)庫(kù)中的內(nèi)容,再通過(guò)不斷地推理導(dǎo)出問(wèn)題的結(jié)論。推理機(jī)中包含如何從知識(shí)庫(kù)中選擇規(guī)則的策略和當(dāng)有多個(gè)可用規(guī)則時(shí)如何消解規(guī)則沖突的策略。(4)解釋機(jī)構(gòu)用于向用戶解釋專家系統(tǒng)的行為,包括解釋“系統(tǒng)是怎樣得出這一結(jié)論的”、“系統(tǒng)為什么要提出這樣的問(wèn)題來(lái)詢問(wèn)用戶”等用戶需要解釋的問(wèn)題。(5)知識(shí)獲取機(jī)構(gòu)知識(shí)獲取是專家系統(tǒng)的一種輔助功能,它可為修改知識(shí)庫(kù)中的原有知識(shí)和擴(kuò)充新知識(shí)提供相應(yīng)手段。知識(shí)獲取機(jī)構(gòu)的基本任務(wù)是把知識(shí)加入到知識(shí)庫(kù)中,并負(fù)責(zé)維持知識(shí)的一致性及完整性,建立起性能良好的知識(shí)庫(kù)。通常,不同的專家系統(tǒng),知識(shí)獲取功能和實(shí)現(xiàn)方法差別較大。如,① 有的系統(tǒng)首先由知識(shí)工程師向領(lǐng)域?qū)<耀@取知識(shí),然后通過(guò)相應(yīng)的知識(shí)編輯軟件把知識(shí)送到知識(shí)庫(kù)中;② 有的系統(tǒng)自身就具有部分學(xué)習(xí)功能,由系統(tǒng)直接與領(lǐng)域?qū)<覍?duì)話獲取知識(shí);③ 有的系統(tǒng)具有較強(qiáng)的學(xué)習(xí)功能,可在系統(tǒng)運(yùn)行過(guò)程中通過(guò)歸納、總結(jié),得出新的知識(shí)。總之,不管采用方式,知識(shí)獲取都是目前專家系統(tǒng)研究中的一個(gè)重要問(wèn)題。所以,知識(shí)工程的概念從1977年提出至今,現(xiàn)已成為一門新興的邊緣學(xué)科。它是人工智能,數(shù)據(jù)庫(kù)技術(shù),數(shù)理邏輯,認(rèn)知科學(xué),心理學(xué)等學(xué)科交叉發(fā)展的結(jié)果。KDD(Knowledge Discovery in Database)一詞是于1989年8月在美國(guó)底特律市召開(kāi)的第一屆KDD國(guó)際學(xué)術(shù)會(huì)議上正式形成的。研究的問(wèn)題主要有:① 定性知識(shí)和定量知識(shí)的發(fā)現(xiàn);② 知識(shí)發(fā)現(xiàn)方法;③ 知識(shí)發(fā)現(xiàn)的應(yīng)用等。KDD的含義,由Fayyad定義為:從數(shù)據(jù)集中識(shí)別出有效的、新穎的、潛在有用的,以及最終可理解的模式的非平凡過(guò)程。涉及幾個(gè)概念:“數(shù)據(jù)集”、“模式”、“過(guò)程”、“有效性”、“新穎性”、“潛在有用性”和“最終可理解性”。數(shù)據(jù)集:數(shù)據(jù)庫(kù)記錄的集合F;模式:即知識(shí),它給出了數(shù)據(jù)特性或數(shù)據(jù)之間的關(guān)系,是對(duì)數(shù)據(jù)所包含的信息更抽象的描述。按功能可以分為預(yù)測(cè)型模式和描述型模式。在實(shí)際應(yīng)用中,可以細(xì)分為關(guān)聯(lián)模式、分類模式、聚類模式和序列模式等。過(guò)程:通常在KDD中指多階段的處理,涉及數(shù)據(jù)準(zhǔn)備、模式搜索、知識(shí)評(píng)價(jià)以及反復(fù)的修改求精;該過(guò)程要求是非平凡的,意思是要有一定程度的智能性、自動(dòng)性;有效性:是指發(fā)現(xiàn)的模式對(duì)于新的數(shù)據(jù)仍保持一定的可信度;新穎性:要求發(fā)現(xiàn)的模式應(yīng)該是新的;潛在有用性:是指發(fā)現(xiàn)的知識(shí)將來(lái)有實(shí)際效用,如,用于決策支持系統(tǒng)里可提高經(jīng)濟(jì)效益;最終可理解性:要求發(fā)現(xiàn)的模式能被用戶理解,目前它主要體現(xiàn)在簡(jiǎn)潔性上。其中,“有效性”、“新穎性”、“潛在有用性”和“最終可理解性”綜合在一起稱為興趣性。KDD的研究?jī)?nèi)容是:如何自動(dòng)地去處理數(shù)據(jù)庫(kù)中大量的原始數(shù)據(jù),從中挖掘搜索出具有規(guī)則、富有意義的模式。它的發(fā)現(xiàn)過(guò)程主要有三個(gè)步驟:① 數(shù)據(jù)準(zhǔn)備,又包括數(shù)據(jù)選?。―ata selection)、數(shù)據(jù)預(yù)處理(Data preprocessing)和數(shù)據(jù)變換(Data transformation)三個(gè)子步驟;② 數(shù)據(jù)挖掘(Data Mining)階段;③ 結(jié)果解釋和評(píng)價(jià)。即:KDD=數(shù)據(jù)準(zhǔn)備+DM+解釋評(píng)價(jià)。圖1 KDD過(guò)程由上圖知,知識(shí)發(fā)現(xiàn)的過(guò)程可粗略的理解為三部曲:數(shù)據(jù)準(zhǔn)備(Data preparation)、數(shù)據(jù)挖掘(Data mining)以及結(jié)果的解釋評(píng)估(interpreparation and evaluation)。① 數(shù)據(jù)準(zhǔn)備又可分為:數(shù)據(jù)選取、數(shù)據(jù)預(yù)處理和數(shù)據(jù)變換三個(gè)子步驟。l 數(shù)據(jù)選取的目的是確定發(fā)現(xiàn)任務(wù)的操作對(duì)象,即目標(biāo)數(shù)據(jù)。它是根據(jù)用戶的需求從原始數(shù)據(jù)庫(kù)中抽取的一組數(shù)據(jù)。l 數(shù)據(jù)預(yù)處理一般包括消除噪聲、推導(dǎo)計(jì)算缺值數(shù)據(jù)、消除重復(fù)記錄、完成數(shù)據(jù)類型轉(zhuǎn)換(如,把連續(xù)值數(shù)據(jù)轉(zhuǎn)換為離散型數(shù)據(jù),以便符號(hào)歸納;或把離散型數(shù)據(jù)轉(zhuǎn)換為連續(xù)值型數(shù)據(jù),以便神經(jīng)網(wǎng)絡(luò)歸納)等;l 數(shù)據(jù)變換的主要目的是消減數(shù)據(jù)的維數(shù)或降維,即從初始特征中找出真正有用的特征,以減少數(shù)據(jù)開(kāi)采時(shí)要考慮的特征或變量個(gè)數(shù)。② 數(shù)據(jù)挖掘階段:ⅰ)確定開(kāi)采的任務(wù)或目的,如數(shù)據(jù)總結(jié)、分類、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)或序列模式發(fā)現(xiàn)等;ⅱ)確定使用的開(kāi)采算法。選擇實(shí)現(xiàn)算法有兩個(gè)考慮因素:(1) 不同的數(shù)據(jù)有不同的特點(diǎn),因此需要用與之相關(guān)的算法來(lái)挖掘;(2) 用戶或?qū)嶋H運(yùn)行系統(tǒng)的要求,有的用戶可能希望獲取描述型的、容易理解的知識(shí)(如,采用規(guī)則表示的挖掘方法顯然好于神經(jīng)網(wǎng)絡(luò)之類的方法),而有的用戶只希望獲取預(yù)測(cè)準(zhǔn)確度盡可能高的預(yù)測(cè)型知識(shí)。選擇了挖掘算法后,就可以實(shí)施數(shù)據(jù)挖掘操作,獲取有用的模式。③ 結(jié)果解釋和評(píng)價(jià),對(duì)數(shù)據(jù)挖掘發(fā)現(xiàn)出來(lái)的模式,應(yīng)經(jīng)用戶或機(jī)器評(píng)價(jià)后才能成為知識(shí)。因?yàn)? ⅰ)挖掘出來(lái)的模式可能存在冗余或無(wú)關(guān)的模式,此時(shí)需將其剔除; ⅱ)挖掘出來(lái)的模式可能不滿足用戶要求,這時(shí)應(yīng)退回到發(fā)現(xiàn)階段之前,如重選數(shù)據(jù)、采取新的變換方法和新的開(kāi)采算法等 ⅲ)KDD最終是要面向人類用戶,因此,應(yīng)對(duì)挖掘發(fā)現(xiàn)的模式進(jìn)行可視化(如散點(diǎn)圖、直方圖等),或把結(jié)果轉(zhuǎn)換為用戶易懂的另一種表示,如把分類決策樹(shù)轉(zhuǎn)換為“if…then…”規(guī)則。由此過(guò)程可得:數(shù)據(jù)挖掘僅僅是整個(gè)知識(shí)發(fā)現(xiàn)過(guò)程中的一個(gè)步驟。挖掘質(zhì)量的好壞有兩個(gè)影響要素:(1) 是所采用的數(shù)據(jù)挖掘技術(shù)的有效性;(2) 是采用的數(shù)據(jù)質(zhì)量和數(shù)量(數(shù)據(jù)量的大?。?。如果選擇了錯(cuò)誤的數(shù)據(jù)或不適當(dāng)?shù)膶傩?,或?qū)?shù)據(jù)進(jìn)行了不適當(dāng)?shù)霓D(zhuǎn)換,則挖掘的結(jié)果不會(huì)成功。整個(gè)挖掘過(guò)程是一個(gè)不斷反饋的過(guò)程。比如,用戶在挖掘途中發(fā)現(xiàn)選擇的數(shù)據(jù)不太滿意,或使用的挖掘技術(shù)產(chǎn)生不了期望的結(jié)果。這時(shí),用戶需要重復(fù)先前的過(guò)程,甚至從頭重新開(kāi)始。可視化技術(shù)在數(shù)據(jù)挖掘的各個(gè)階段都起著重要的作用。特別是在數(shù)據(jù)準(zhǔn)備階段,用戶可能要使用散點(diǎn)圖、直方圖等統(tǒng)計(jì)可視化技術(shù)來(lái)顯示有關(guān)數(shù)據(jù),以期對(duì)數(shù)據(jù)有一個(gè)初步的了解,從而為更好地選取數(shù)據(jù)打下基礎(chǔ);在挖掘階段,用戶則要使用與領(lǐng)域問(wèn)題有關(guān)的可視化工具;在表示結(jié)果階段,則可能要用到可視化技術(shù)以使得發(fā)現(xiàn)的知識(shí)更易于理解。問(wèn)題:數(shù)據(jù)挖掘的可視化主要包括哪些研究?jī)?nèi)容? 目前流行的可視化技術(shù)主要有哪幾種? 答: 數(shù)據(jù)挖掘的可視化主要研究包括(1) 數(shù)據(jù)的可視化: 。(2) 數(shù)據(jù)結(jié)果的可視化: 、解釋和評(píng)價(jià)的可視化有助于理解所獲得的知識(shí)并檢驗(yàn)知識(shí)的真?zhèn)魏蛯?shí)用性;(3) 數(shù)據(jù)挖掘過(guò)程的可視化:用可視化形式描述各種挖掘過(guò)程,用戶通過(guò)可視化方式可以了解挖掘數(shù)據(jù)的來(lái)源、數(shù)據(jù)的抽取過(guò)程、具體的挖掘計(jì)算和推理過(guò)程等。 目前流行的可視化技術(shù)主要有:(1) 面向像素技術(shù):其基本思想是將每個(gè)數(shù)據(jù)值映射到一個(gè)有色的像素上并將屬于某個(gè)屬性的數(shù)據(jù)值表示在一個(gè)獨(dú)立的窗口中;(2) 幾何投影技術(shù):其目標(biāo)是在多維數(shù)據(jù)集中找到“有意義”的投影,是一種平行坐標(biāo)軸可視化技術(shù)。該技術(shù)通過(guò)使用相互平行而且等距的坐標(biāo)軸將多維空間映射成兩維顯示。(3) 基于圖標(biāo)技術(shù):是將一個(gè)多級(jí)數(shù)據(jù)項(xiàng)映射成一個(gè)圖標(biāo),是一種條狀圖技術(shù)。在該技術(shù)中,用兩維來(lái)進(jìn)行坐標(biāo)顯示,而剩下的維則被映射成條狀圖標(biāo)的角度或條狀圖標(biāo)的長(zhǎng)度;(4) 層次技術(shù):是對(duì)多維空間進(jìn)行細(xì)分,然后以一種層次的形式表示這些子空間。由于KDD是一門受到來(lái)自各種不同領(lǐng)域的研究者關(guān)注的交叉學(xué)科(如涉及:統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)技術(shù)、模式識(shí)別、人工智能和可視化等),因此導(dǎo)致了很多不同的術(shù)語(yǔ)名稱。除KDD外,主要還有:“數(shù)據(jù)挖掘”、知識(shí)抽取(knowledge extraction)、信息發(fā)現(xiàn)、智能數(shù)據(jù)分析、探索式數(shù)據(jù)分析、信息收獲、數(shù)據(jù)考古學(xué)(data archaeology)、
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1