freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)(存儲(chǔ)版)

  

【正文】 掘知識(shí)。 知識(shí)發(fā)現(xiàn)的方法可粗分為:統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法、數(shù)據(jù)庫(kù)方法和可視化方法。在關(guān)聯(lián)規(guī)則挖掘算法中,通常給出了置信度和支持度兩個(gè)概念,對(duì)于置信度和支持度均大于給定閾值的規(guī)則稱(chēng)為強(qiáng)規(guī)則,而關(guān)聯(lián)分析主要就是對(duì)強(qiáng)規(guī)則的挖掘。這樣就可以利用該模型來(lái)分析已有數(shù)據(jù),并預(yù)測(cè)新數(shù)據(jù)將屬于哪一個(gè)組。每一個(gè)分組中的數(shù)據(jù)相近,不同分組之間的數(shù)據(jù)相差較大。⑥偏差檢測(cè)(Deviation Detection):用于檢測(cè)并解釋數(shù)據(jù)分類(lèi)的偏差,它有助于濾掉知識(shí)發(fā)現(xiàn)引擎所抽取的無(wú)關(guān)信息,也可濾掉那些不合適的數(shù)據(jù),同時(shí)可產(chǎn)生新的關(guān)注性事實(shí)。Web數(shù)據(jù)挖掘包括Web使用模式挖掘、Web結(jié)構(gòu)挖掘和Web內(nèi)容挖掘等。前提條件由字段項(xiàng)(屬性)取值的合取和析取組合而成,結(jié)論為決策字段項(xiàng)(屬性)的取值或者類(lèi)別組成。一般表示為矩陣和向量??梢?jiàn),案例是解決新問(wèn)題的一種知識(shí)。[4] 在過(guò)程控制/質(zhì)量監(jiān)督保證方面:DM協(xié)助管理大數(shù)量變量之間的相互作用,DM能自動(dòng)發(fā)現(xiàn)出某些不正常的數(shù)據(jù)分布,暴露制造和裝配操作過(guò)程中變化情況和各種因素,從而協(xié)助質(zhì)量工程師很快地注意到問(wèn)題發(fā)生范圍和采取改正措施。 知識(shí)發(fā)現(xiàn)與創(chuàng)新自90年代以來(lái),基于數(shù)據(jù)庫(kù)/數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的知識(shí)發(fā)現(xiàn)研究,一直是人們關(guān)注和研究的熱點(diǎn)。OLAP可以幫助人們提出假設(shè),也可以驗(yàn)證數(shù)據(jù)挖掘預(yù)測(cè)的結(jié)果;數(shù)據(jù)挖掘能夠挖掘出一個(gè)結(jié)論,但這結(jié)論是否正確,可用OLAP去驗(yàn)證。因?yàn)橹挥袑⑦@些站點(diǎn)上的數(shù)據(jù)都集成起來(lái),提供給用戶(hù)一個(gè)統(tǒng)一的視圖或視角,才有可能從巨大的數(shù)據(jù)資源中獲取所需的東西。我們綜合性大學(xué)里的所有學(xué)科,實(shí)際上可以成四大類(lèi)(自然科學(xué)、社會(huì)科學(xué)、人文科學(xué)、其它),第一就是大家熟悉的自然科學(xué),對(duì)于自然科學(xué)來(lái)說(shuō),最高水平的創(chuàng)新一定是創(chuàng)新知識(shí)。擴(kuò)充知識(shí)空間的過(guò)程叫學(xué)習(xí)。數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)將信息變?yōu)橹R(shí),從數(shù)據(jù)礦山中找到蘊(yùn)藏的知識(shí)金塊,將為知識(shí)創(chuàng)新和知識(shí)經(jīng)濟(jì)的發(fā)展作出貢獻(xiàn)。這樣的突破,擴(kuò)充了研究生個(gè)人的知識(shí)空間,同時(shí)也就擴(kuò)充了人類(lèi)的知識(shí)大空間。這個(gè)空間邊界就是與未知世界的接觸面。面對(duì)浩如煙海的信息資源(商業(yè)上的條形碼,科學(xué)上先進(jìn)儀器觀(guān)察的數(shù)據(jù),Internet網(wǎng)上的資源信息等)的迅速增長(zhǎng),人們迫切需要新的技術(shù)和工具,以便能從大量的數(shù)據(jù)中智能地、自動(dòng)地抽取有價(jià)值的知識(shí)。Web上的每一個(gè)站點(diǎn)就是一個(gè)數(shù)據(jù)源,且是異構(gòu)數(shù)據(jù)源,一個(gè)站點(diǎn)和另一個(gè)站的信息和組織形式不同,這就構(gòu)成了一個(gè)更大的、復(fù)雜性更高的數(shù)據(jù)庫(kù)。所謂多維存取,是從不同的角度根據(jù)數(shù)據(jù)倉(cāng)庫(kù)中的不同主題來(lái)得出不同的結(jié)論。總之,DM可廣泛應(yīng)用于銀行金融、零售與批發(fā)、制造、保險(xiǎn)、公共設(shè)施、政府、教育、遠(yuǎn)程通訊、軟件開(kāi)發(fā)、運(yùn)輸?shù)雀鱾€(gè)企事業(yè)單位及國(guó)防科研上。[3] 在零售業(yè)/市場(chǎng)營(yíng)銷(xiāo)方面:是數(shù)據(jù)挖掘技術(shù)應(yīng)用最早也是最重要的領(lǐng)域,DM用于顧客購(gòu)貨籃的分析可以協(xié)助貨架布置,促銷(xiāo)活動(dòng)時(shí)間,促銷(xiāo)商品組合以及了解滯銷(xiāo)和暢銷(xiāo)商品狀況等商業(yè)活動(dòng)。CBR的基礎(chǔ)是案例庫(kù),在案例庫(kù)中存放著大量成功或失敗的案例。如,上例的人群數(shù)據(jù)庫(kù),通過(guò)計(jì)算可以得出身高是不重要的字段,刪除該項(xiàng)后,再合并相同數(shù)據(jù)元組,得到如下的濃縮數(shù)據(jù)表。 數(shù)據(jù)挖掘的知識(shí)表示數(shù)據(jù)挖掘各種方法獲得的知識(shí)的表示形式主要有6種:規(guī)則、決策樹(shù)、知識(shí)基(濃縮數(shù)據(jù))、網(wǎng)絡(luò)權(quán)值、公式和案例。模式相似性挖掘的方法有相似度測(cè)量法、遺傳算法等。T股票連續(xù)上漲兩天且DEC股票不下跌,則第三天IBM股票上漲的可能性為75%”的數(shù)據(jù)關(guān)系。相似的程度可以通過(guò)距離函數(shù)來(lái)表示,由用戶(hù)或?qū)<抑付?。③分?lèi)(Classification)分析:所謂分類(lèi)是根據(jù)數(shù)據(jù)的特征為每個(gè)類(lèi)別建立一個(gè)模型,根據(jù)數(shù)據(jù)的屬性將數(shù)據(jù)分配到不同的組中。建立預(yù)測(cè)模型的常用方法:? 回歸分析? 線(xiàn)性模型? 關(guān)聯(lián)規(guī)則? 決策樹(shù)預(yù)測(cè)? 遺傳算法? 神經(jīng)網(wǎng)絡(luò)②關(guān)聯(lián)(Association)分析:關(guān)聯(lián)規(guī)則描述了一組數(shù)據(jù)項(xiàng)之間的密切度或關(guān)系。故按知識(shí)發(fā)現(xiàn)的任務(wù)分類(lèi)有:關(guān)聯(lián)規(guī)則知識(shí)發(fā)現(xiàn)、序列知識(shí)發(fā)現(xiàn)、聚類(lèi)知識(shí)發(fā)現(xiàn)、分類(lèi)知識(shí)發(fā)現(xiàn)、偏差分析知識(shí)發(fā)現(xiàn)以及預(yù)測(cè)知識(shí)發(fā)現(xiàn)等類(lèi)型。機(jī)器學(xué)習(xí)的大部分方法和技術(shù)已演變?yōu)閿?shù)據(jù)挖掘方法和技術(shù)。 知識(shí)發(fā)現(xiàn)的分類(lèi)知識(shí)發(fā)現(xiàn)涉及多個(gè)學(xué)科,主要包括數(shù)據(jù)庫(kù)、統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)等三大主要技術(shù)。Web數(shù)據(jù)庫(kù)隨著Internet的發(fā)展和普及,網(wǎng)站數(shù)目的迅速增長(zhǎng)及上網(wǎng)人數(shù)的劇烈增多,使網(wǎng)絡(luò)數(shù)據(jù)量呈指數(shù)增長(zhǎng),Web數(shù)據(jù)挖掘已成為新課題。這些特征提取是用基于內(nèi)容的相似檢索。如,“專(zhuān)家系統(tǒng)”與“人工智能”兩個(gè)關(guān)鍵詞是有一定聯(lián)系的,研究專(zhuān)家系統(tǒng)的文本,一定屬于人工智能的研究領(lǐng)域。文本數(shù)據(jù)庫(kù)文本是以文字串形式表示的數(shù)據(jù)文件。含噪聲的數(shù)據(jù)挖掘會(huì)影響抽取模式的準(zhǔn)確性,并增加了數(shù)據(jù)挖掘的困難度。由于關(guān)系數(shù)據(jù)庫(kù)的特點(diǎn),促使了數(shù)據(jù)挖掘方法的改善。從此“數(shù)據(jù)挖掘”一詞很快流傳開(kāi)來(lái)。該技術(shù)通過(guò)使用相互平行而且等距的坐標(biāo)軸將多維空間映射成兩維顯示。整個(gè)挖掘過(guò)程是一個(gè)不斷反饋的過(guò)程。② 數(shù)據(jù)挖掘階段:?。┐_定開(kāi)采的任務(wù)或目的,如數(shù)據(jù)總結(jié)、分類(lèi)、聚類(lèi)、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)或序列模式發(fā)現(xiàn)等;ⅱ)確定使用的開(kāi)采算法。KDD的研究?jī)?nèi)容是:如何自動(dòng)地去處理數(shù)據(jù)庫(kù)中大量的原始數(shù)據(jù),從中挖掘搜索出具有規(guī)則、富有意義的模式。研究的問(wèn)題主要有:① 定性知識(shí)和定量知識(shí)的發(fā)現(xiàn);② 知識(shí)發(fā)現(xiàn)方法;③ 知識(shí)發(fā)現(xiàn)的應(yīng)用等。(5)知識(shí)獲取機(jī)構(gòu)知識(shí)獲取是專(zhuān)家系統(tǒng)的一種輔助功能,它可為修改知識(shí)庫(kù)中的原有知識(shí)和擴(kuò)充新知識(shí)提供相應(yīng)手段。(2)數(shù)據(jù)庫(kù)也稱(chēng)全局?jǐn)?shù)據(jù)庫(kù)或綜合數(shù)據(jù)庫(kù)。在建立專(zhuān)家系統(tǒng)時(shí),首先由知識(shí)工程師把領(lǐng)域?qū)<业膶?zhuān)門(mén)知識(shí)總結(jié)出來(lái),以適當(dāng)?shù)男问酱嫒胗?jì)算機(jī),建立起知識(shí)庫(kù)(KB),根據(jù)這些專(zhuān)門(mén)知識(shí),系統(tǒng)可以進(jìn)行推理,做出判斷和決策,能夠解決一些只有人類(lèi)專(zhuān)家才能解決的困難問(wèn)題,專(zhuān)家系統(tǒng)主要是指軟件系統(tǒng)?!?知識(shí)工程系統(tǒng)的特點(diǎn)n 知識(shí)工程系統(tǒng)能解決專(zhuān)家水平的問(wèn)題;n 系統(tǒng)能快速的進(jìn)行假設(shè)和搜索解答;n 系統(tǒng)能做出具有專(zhuān)家水平的解答;n 系統(tǒng)具有大量的基礎(chǔ)知識(shí)和通用的問(wèn)題求解能力;n 系統(tǒng)應(yīng)能選擇問(wèn)題的恰當(dāng)表示方式,其中的知識(shí)型系統(tǒng)是一個(gè)符號(hào)系統(tǒng);n 系統(tǒng)具有自動(dòng)推理的能力,能從結(jié)構(gòu)步驟分析、解決、推理問(wèn)題等,這些都表現(xiàn)出具有人工智能及其系統(tǒng)的特點(diǎn)。從這種意義上講,“信息”與“關(guān)聯(lián)”是構(gòu)成知識(shí)的兩個(gè)要素。☆數(shù)據(jù)、信息和知識(shí)間的關(guān)系是:l 數(shù)據(jù)是信息的載體和表示;l 信息是數(shù)據(jù)在特定場(chǎng)合下的含義,或者說(shuō)信息是數(shù)據(jù)的語(yǔ)義。 知識(shí)知識(shí)不僅是人工智能領(lǐng)域中研究的重要對(duì)象,而且也是知識(shí)工程與知識(shí)發(fā)現(xiàn)處理的重要對(duì)象。但人工智能系統(tǒng)較率低,不能應(yīng)用于實(shí)際。面對(duì)浩如煙海的信息資源,人類(lèi)的自然智能越來(lái)越顯得難于駕馭。數(shù)據(jù)庫(kù)中存在著大量數(shù)據(jù),卻缺乏從這些數(shù)據(jù)中自動(dòng)、高效地獲取知識(shí)的手段,出現(xiàn)了“數(shù)據(jù)豐富,知識(shí)貧乏”的現(xiàn)象。狹義地說(shuō),知識(shí)是一種有組織的經(jīng)驗(yàn)、價(jià)值觀(guān)、相關(guān)信息和洞察力的組合。l 信息僅是對(duì)客觀(guān)事物的一般性描述,它還不是知識(shí)。知識(shí)工程的目的是在研究知識(shí)的基礎(chǔ)上,開(kāi)發(fā)智能系統(tǒng)。知識(shí)工程的研究使人工智能的研究從理論轉(zhuǎn)向了應(yīng)用,從基于推理的模型轉(zhuǎn)向基于知識(shí)的模型,是新一代計(jì)算機(jī)的重要理論基礎(chǔ)。為了建立專(zhuān)家?guī)?,需?duì)領(lǐng)域問(wèn)題的專(zhuān)家知識(shí),用相應(yīng)的知識(shí)表示方法將其表示出來(lái),然后再進(jìn)行形式化,并經(jīng)編碼放入知識(shí)庫(kù)中。由此看出,專(zhuān)家系統(tǒng)數(shù)據(jù)庫(kù)只是一個(gè)存儲(chǔ)很少的用于暫存中間信息的工作存儲(chǔ)器(也稱(chēng)內(nèi)涵數(shù)據(jù)庫(kù)),而不是通常概念上的用于存放大量信息的數(shù)據(jù)庫(kù)(也稱(chēng)外延數(shù)據(jù)庫(kù))。如,① 有的系統(tǒng)首先由知識(shí)工程師向領(lǐng)域?qū)<耀@取知識(shí),然后通過(guò)相應(yīng)的知識(shí)編輯軟件把知識(shí)送到知識(shí)庫(kù)中;② 有的系統(tǒng)自身就具有部分學(xué)習(xí)功能,由系統(tǒng)直接與領(lǐng)域?qū)<覍?duì)話(huà)獲取知識(shí);③ 有的系統(tǒng)具有較強(qiáng)的學(xué)習(xí)功能,可在系統(tǒng)運(yùn)行過(guò)程中通過(guò)歸納、總結(jié),得出新的知識(shí)。數(shù)據(jù)集:數(shù)據(jù)庫(kù)記錄的集合F;模式:即知識(shí),它給出了數(shù)據(jù)特性或數(shù)據(jù)之間的關(guān)系
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1