freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)-wenkub

2023-07-07 14:40:36 本頁(yè)面
 

【正文】 on)、數(shù)據(jù)挖掘(Data mining)以及結(jié)果的解釋評(píng)估(interpreparation and evaluation)。其中,“有效性”、“新穎性”、“潛在有用性”和“最終可理解性”綜合在一起稱為興趣性。數(shù)據(jù)集:數(shù)據(jù)庫(kù)記錄的集合F;模式:即知識(shí),它給出了數(shù)據(jù)特性或數(shù)據(jù)之間的關(guān)系,是對(duì)數(shù)據(jù)所包含的信息更抽象的描述。KDD(Knowledge Discovery in Database)一詞是于1989年8月在美國(guó)底特律市召開的第一屆KDD國(guó)際學(xué)術(shù)會(huì)議上正式形成的。如,① 有的系統(tǒng)首先由知識(shí)工程師向領(lǐng)域?qū)<耀@取知識(shí),然后通過(guò)相應(yīng)的知識(shí)編輯軟件把知識(shí)送到知識(shí)庫(kù)中;② 有的系統(tǒng)自身就具有部分學(xué)習(xí)功能,由系統(tǒng)直接與領(lǐng)域?qū)<覍?duì)話獲取知識(shí);③ 有的系統(tǒng)具有較強(qiáng)的學(xué)習(xí)功能,可在系統(tǒng)運(yùn)行過(guò)程中通過(guò)歸納、總結(jié),得出新的知識(shí)。(4)解釋機(jī)構(gòu)用于向用戶解釋專家系統(tǒng)的行為,包括解釋“系統(tǒng)是怎樣得出這一結(jié)論的”、“系統(tǒng)為什么要提出這樣的問(wèn)題來(lái)詢問(wèn)用戶”等用戶需要解釋的問(wèn)題。由此看出,專家系統(tǒng)數(shù)據(jù)庫(kù)只是一個(gè)存儲(chǔ)很少的用于暫存中間信息的工作存儲(chǔ)器(也稱內(nèi)涵數(shù)據(jù)庫(kù)),而不是通常概念上的用于存放大量信息的數(shù)據(jù)庫(kù)(也稱外延數(shù)據(jù)庫(kù))。通常,知識(shí)庫(kù)中的知識(shí)分為兩大類型:一類是領(lǐng)域中的事實(shí),稱為事實(shí)性知識(shí),這是一種廣泛公用的知識(shí),也即寫在書本上的知識(shí)及常識(shí);另一類是啟發(fā)性知識(shí),它是領(lǐng)域?qū)<以陂L(zhǎng)期工作實(shí)踐中積累起來(lái)的經(jīng)驗(yàn)總結(jié)。為了建立專家?guī)?,需?duì)領(lǐng)域問(wèn)題的專家知識(shí),用相應(yīng)的知識(shí)表示方法將其表示出來(lái),然后再進(jìn)行形式化,并經(jīng)編碼放入知識(shí)庫(kù)中。專家系統(tǒng)的開發(fā)有三個(gè)基本的要素:領(lǐng)域?qū)<?、知識(shí)工程師、大量實(shí)例。知識(shí)工程的研究使人工智能的研究從理論轉(zhuǎn)向了應(yīng)用,從基于推理的模型轉(zhuǎn)向基于知識(shí)的模型,是新一代計(jì)算機(jī)的重要理論基礎(chǔ)。其中,基礎(chǔ)理論研究包括:知識(shí)的本質(zhì)、知識(shí)的表示、推理、獲取和學(xué)習(xí)方法等;實(shí)用技術(shù)主要研究解決建立知識(shí)系統(tǒng)過(guò)程中遇到的問(wèn)題,包括:實(shí)用知識(shí)表示方法、實(shí)用知識(shí)獲取技術(shù)、實(shí)用知識(shí)推理方法、知識(shí)庫(kù)結(jié)構(gòu)系統(tǒng)、知識(shí)系統(tǒng)體系結(jié)構(gòu)、知識(shí)庫(kù)管理技術(shù)、知識(shí)型系統(tǒng)的調(diào)試與評(píng)估技術(shù)、實(shí)用解釋技術(shù)、實(shí)用接口技術(shù)等;知識(shí)型系統(tǒng)工具研究,主要是為了給系統(tǒng)的開發(fā)提供良好的環(huán)境工具,以提高系統(tǒng)研制的質(zhì)量和縮短系統(tǒng)研制周期等。知識(shí)工程的目的是在研究知識(shí)的基礎(chǔ)上,開發(fā)智能系統(tǒng)。因此,也可把有關(guān)信息關(guān)聯(lián)在一起所形成的信息結(jié)構(gòu)稱為知識(shí)。l 信息僅是對(duì)客觀事物的一般性描述,它還不是知識(shí)。如“建國(guó)80歲”,就是一條信息。狹義地說(shuō),知識(shí)是一種有組織的經(jīng)驗(yàn)、價(jià)值觀、相關(guān)信息和洞察力的組合。它的出現(xiàn)為自動(dòng)和智能地把海量數(shù)據(jù)轉(zhuǎn)化成有用的信息和知識(shí)提供了手段。數(shù)據(jù)庫(kù)中存在著大量數(shù)據(jù),卻缺乏從這些數(shù)據(jù)中自動(dòng)、高效地獲取知識(shí)的手段,出現(xiàn)了“數(shù)據(jù)豐富,知識(shí)貧乏”的現(xiàn)象。難怪有人把人工智能同原子能技術(shù)、空間技術(shù)一起稱為20世紀(jì)的三大尖端科技成就。面對(duì)浩如煙海的信息資源,人類的自然智能越來(lái)越顯得難于駕馭。如何用人造的智能去模仿和擴(kuò)展人類的自然智能,實(shí)現(xiàn)信息的智能化處理,是信息社會(huì)和知識(shí)經(jīng)濟(jì)所面臨的一個(gè)重大課題。但人工智能系統(tǒng)較率低,不能應(yīng)用于實(shí)際。此外,在數(shù)據(jù)操縱方面:信息的提取及其相關(guān)處理技術(shù)卻遠(yuǎn)遠(yuǎn)落后。 知識(shí)知識(shí)不僅是人工智能領(lǐng)域中研究的重要對(duì)象,而且也是知識(shí)工程與知識(shí)發(fā)現(xiàn)處理的重要對(duì)象?!钆c知識(shí)相關(guān)聯(lián)的兩個(gè)概念是數(shù)據(jù)和信息所謂數(shù)據(jù)是指人們?yōu)榱嗣枋隹陀^世界中的具體事物而引入的一些數(shù)字、字符、文字等符號(hào)或符號(hào)的組合?!顢?shù)據(jù)、信息和知識(shí)間的關(guān)系是:l 數(shù)據(jù)是信息的載體和表示;l 信息是數(shù)據(jù)在特定場(chǎng)合下的含義,或者說(shuō)信息是數(shù)據(jù)的語(yǔ)義。只有經(jīng)過(guò)對(duì)其進(jìn)行加工、整理、解釋、挑選和改造,形成對(duì)客觀世界規(guī)律性認(rèn)識(shí)后才能稱為知識(shí)。從這種意義上講,“信息”與“關(guān)聯(lián)”是構(gòu)成知識(shí)的兩個(gè)要素。所以,知識(shí)工程的核心則是專家系統(tǒng)?!?知識(shí)工程系統(tǒng)的特點(diǎn)n 知識(shí)工程系統(tǒng)能解決專家水平的問(wèn)題;n 系統(tǒng)能快速的進(jìn)行假設(shè)和搜索解答;n 系統(tǒng)能做出具有專家水平的解答;n 系統(tǒng)具有大量的基礎(chǔ)知識(shí)和通用的問(wèn)題求解能力;n 系統(tǒng)應(yīng)能選擇問(wèn)題的恰當(dāng)表示方式,其中的知識(shí)型系統(tǒng)是一個(gè)符號(hào)系統(tǒng);n 系統(tǒng)具有自動(dòng)推理的能力,能從結(jié)構(gòu)步驟分析、解決、推理問(wèn)題等,這些都表現(xiàn)出具有人工智能及其系統(tǒng)的特點(diǎn)。它的根本目的是在研究知識(shí)的基礎(chǔ)上,開發(fā)人工智能系統(tǒng),補(bǔ)充和擴(kuò)大大腦的功能,開創(chuàng)人機(jī)共同思考的時(shí)代。在建立專家系統(tǒng)時(shí),首先由知識(shí)工程師把領(lǐng)域?qū)<业膶iT知識(shí)總結(jié)出來(lái),以適當(dāng)?shù)男问酱嫒胗?jì)算機(jī),建立起知識(shí)庫(kù)(KB),根據(jù)這些專門知識(shí),系統(tǒng)可以進(jìn)行推理,做出判斷和決策,能夠解決一些只有人類專家才能解決的困難問(wèn)題,專家系統(tǒng)主要是指軟件系統(tǒng)。所以,專家?guī)斓慕?,首先要解決知識(shí)獲取與知識(shí)表示的問(wèn)題。(2)數(shù)據(jù)庫(kù)也稱全局?jǐn)?shù)據(jù)庫(kù)或綜合數(shù)據(jù)庫(kù)。(3)推理機(jī)推理機(jī)是一組用來(lái)控制、協(xié)調(diào)整個(gè)專家系統(tǒng)的程序。(5)知識(shí)獲取機(jī)構(gòu)知識(shí)獲取是專家系統(tǒng)的一種輔助功能,它可為修改知識(shí)庫(kù)中的原有知識(shí)和擴(kuò)充新知識(shí)提供相應(yīng)手段??傊还懿捎梅绞?,知識(shí)獲取都是目前專家系統(tǒng)研究中的一個(gè)重要問(wèn)題。研究的問(wèn)題主要有:① 定性知識(shí)和定量知識(shí)的發(fā)現(xiàn);② 知識(shí)發(fā)現(xiàn)方法;③ 知識(shí)發(fā)現(xiàn)的應(yīng)用等。按功能可以分為預(yù)測(cè)型模式和描述型模式。KDD的研究?jī)?nèi)容是:如何自動(dòng)地去處理數(shù)據(jù)庫(kù)中大量的原始數(shù)據(jù),從中挖掘搜索出具有規(guī)則、富有意義的模式。① 數(shù)據(jù)準(zhǔn)備又可分為:數(shù)據(jù)選取、數(shù)據(jù)預(yù)處理和數(shù)據(jù)變換三個(gè)子步驟。② 數(shù)據(jù)挖掘階段:ⅰ)確定開采的任務(wù)或目的,如數(shù)據(jù)總結(jié)、分類、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)或序列模式發(fā)現(xiàn)等;ⅱ)確定使用的開采算法。因?yàn)? ⅰ)挖掘出來(lái)的模式可能存在冗余或無(wú)關(guān)的模式,此時(shí)需將其剔除; ⅱ)挖掘出來(lái)的模式可能不滿足用戶要求,這時(shí)應(yīng)退回到發(fā)現(xiàn)階段之前,如重選數(shù)據(jù)、采取新的變換方法和新的開采算法等 ⅲ)KDD最終是要面向人類用戶,因此,應(yīng)對(duì)挖掘發(fā)現(xiàn)的模式進(jìn)行可視化(如散點(diǎn)圖、直方圖等),或把結(jié)果轉(zhuǎn)換為用戶易懂的另一種表示,如把分類決策樹轉(zhuǎn)換為“if…then…”規(guī)則。整個(gè)挖掘過(guò)程是一個(gè)不斷反饋的過(guò)程。特別是在數(shù)據(jù)準(zhǔn)備階段,用戶可能要使用散點(diǎn)圖、直方圖等統(tǒng)計(jì)可視化技術(shù)來(lái)顯示有關(guān)數(shù)據(jù),以期對(duì)數(shù)據(jù)有一個(gè)初步的了解,從而為更好地選取數(shù)據(jù)打下基礎(chǔ);在挖掘階段,用戶則要使用與領(lǐng)域問(wèn)題有關(guān)的可視化工具;在表示結(jié)果階段,則可能要用到可視化技術(shù)以使得發(fā)現(xiàn)的知識(shí)更易于理解。該技術(shù)通過(guò)使用相互平行而且等距的坐標(biāo)軸將多維空間映射成兩維顯示。除KDD外,主要還有:“數(shù)據(jù)挖掘”、知識(shí)抽?。╧nowledge extraction)、信息發(fā)現(xiàn)、智能數(shù)據(jù)分析、探索式數(shù)據(jù)分析、信息收獲、數(shù)據(jù)考古學(xué)(data archaeology)、數(shù)據(jù)捕撈(data dredging)等等。從此“數(shù)據(jù)挖掘”一詞很快流傳開來(lái)。數(shù)據(jù)集類型有:關(guān)系數(shù)據(jù)庫(kù)、面向?qū)ο髷?shù)據(jù)庫(kù)、空間數(shù)據(jù)庫(kù)、時(shí)態(tài)數(shù)據(jù)庫(kù)、文本數(shù)據(jù)庫(kù)源、多媒體數(shù)據(jù)庫(kù)、異質(zhì)數(shù)據(jù)庫(kù)以及萬(wàn)維網(wǎng)(Web)數(shù)據(jù)庫(kù)等。由于關(guān)系數(shù)據(jù)庫(kù)的特點(diǎn),促使了數(shù)據(jù)挖掘方法的改善。② 數(shù)據(jù)不完整性數(shù)據(jù)不完整性主要反映在數(shù)據(jù)庫(kù)中記錄的域值丟失或不存在(空值)。含噪聲的數(shù)據(jù)挖掘會(huì)影響抽取模式的準(zhǔn)確性,并增加了數(shù)據(jù)挖掘的困難度。為了避免這種情況發(fā)生,數(shù)據(jù)挖掘時(shí),需要知道數(shù)據(jù)庫(kù)中有哪些固有的依賴關(guān)系。文本數(shù)據(jù)庫(kù)文本是以文字串形式表示的數(shù)據(jù)文件。標(biāo)題中的關(guān)鍵詞是標(biāo)題的核心內(nèi)容。如,“專家系統(tǒng)”與“人工智能”兩個(gè)關(guān)鍵詞是有一定聯(lián)系的,研究專家系統(tǒng)的文本,一定屬于人工智能的研究領(lǐng)域。圖像與視頻數(shù)據(jù)庫(kù)圖像與視頻數(shù)據(jù)庫(kù)是典型的多媒體數(shù)據(jù)庫(kù)。這些特征提取是用基于內(nèi)容的相似檢索。③ 視頻鏡頭的編輯與組織鏡頭代表一段連續(xù)動(dòng)作(視頻數(shù)據(jù)流)。Web數(shù)據(jù)庫(kù)隨著Internet的發(fā)展和普及,網(wǎng)站數(shù)目的迅速增長(zhǎng)及上網(wǎng)人數(shù)的劇烈增多,使網(wǎng)絡(luò)數(shù)據(jù)
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1