freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應(yīng)用v(文件)

2025-06-07 08:48 上一頁面

下一頁面
 

【正文】 概述 ? 小波分析預(yù)測方法 20世紀(jì)數(shù)學(xué)研究成果中最杰出的代表。 組合預(yù)測方法是建立在信息利用最大化的基礎(chǔ)上,它集結(jié)多種單一模型所包含的信息,進(jìn)行最優(yōu)組合。 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練 ? 訓(xùn)練的終止條件 – 獲得一組權(quán)重值,使得訓(xùn)練集中幾乎所有樣本都分類正確 ? 訓(xùn)練步驟 – 利用隨機(jī)值對權(quán)值進(jìn)行初始化 – 將訓(xùn)練樣本逐一地輸入給神經(jīng)網(wǎng)絡(luò),進(jìn)行訓(xùn)練 – 對于每個神經(jīng)元 ? 將其所有的輸入值進(jìn)行線性求和計算得到總的輸入 ? 利用激勵函數(shù)計算其輸出值 ? 計算誤差 ? 修正網(wǎng)絡(luò)權(quán)值和閾值(偏差) 決策樹 決策樹分類是用屬性值對樣本集逐級劃分,直到一個節(jié)點(diǎn)僅含有同一類的樣本為止。 多叉樹( ID3)的內(nèi)部節(jié)點(diǎn)是屬性,邊是該屬性的所有取值,有幾個屬性值,就有幾條邊。然后再依次處理各個子集。對于同樣一組樣本,可以有很多決策樹能符合這組樣本。 決策樹 ? 剪枝技術(shù) 是一種克服噪聲的技術(shù),同時它也能使樹得到簡化而變得更容易理解。當(dāng)數(shù)據(jù)稀疏時,要防止過分剪枝( overpruning)。 實現(xiàn)過程 8 關(guān)聯(lián)分析 概述 Apriori FP- Growth 概述 ? Apriori算法的基本流程 使用逐層搜索的迭代方法,通過對數(shù)據(jù)庫的多次掃描發(fā)現(xiàn)所有的頻繁項集。重復(fù)上述過程直到再也發(fā)現(xiàn)不了新的頻繁項集為止。 FPGrpwth算法 ? 改進(jìn)的算法 —— FPgrowth (1)它構(gòu)造了一種新穎的 、 緊湊的數(shù)據(jù)結(jié)構(gòu) FPtree。 (3)挖掘過程中采用的搜索技術(shù)是基于分區(qū)的 , 通過分割再解決的方法 , 而不是 Apriori類算法的自下向上產(chǎn)生頻繁模式的集合 。 Web挖掘是一項綜合技術(shù),覆蓋了多個研究領(lǐng)域,包括Web技術(shù)、數(shù)據(jù)庫、數(shù)據(jù)挖掘、計算機(jī)語言學(xué)、信息獲取、統(tǒng)計學(xué)以及人工智能等。 Web挖掘可在很多方面發(fā)揮作用,如搜索引擎結(jié)構(gòu)挖掘、確定權(quán)威頁面、 Web文檔分類、 Web日志挖掘和智能檢索等。 ? 海量文檔的處理效率。 -選擇特征變量和數(shù)據(jù)清洗 -建立呼叫指紋庫 -設(shè)定呼叫指紋相似度閾值,大于該閾值的匹配用戶對可界定為疑似重入網(wǎng)用戶。 數(shù)據(jù)可能存儲在數(shù)據(jù)庫、數(shù)據(jù)倉庫和其他信息資料庫中。只有當(dāng)表達(dá)式 E比列舉所有 FE中元素的描述方法更為簡單時,我們才可稱之為模式。在 OECD所劃分的四類知識中,關(guān)于 Knowwhat和 Knowwhy的知識基本屬于顯性知識。 知識表示 知 識 表 示 方 法替 代 表 示 分 布 表 示直 接 表 示局 部 表 示陳 述 性 表 示過 程 性 表 示邏 輯 表 示 產(chǎn) 生 式 表 示 語 義 網(wǎng) 絡(luò) 表 示框 架 表 示腳 本 表 示 知識表示 ?產(chǎn)生式系統(tǒng) 自然界的各種知識單元之間存在著大量的因果關(guān)系,這些因果關(guān)系或者前提與結(jié)論的關(guān)系,采用產(chǎn)生式(或稱規(guī)則)表示是非常方便的。 知識表示 ?概念圖 概念圖以圖形表示就是一種有向連通圖,包括概念結(jié)點(diǎn)和概念關(guān)系結(jié)點(diǎn)兩種。 框架是一種通用的知識表達(dá)方法,對于如何運(yùn)用框架還沒有一種統(tǒng)一的形式,常常由各種問題的不同需要決定。 12 語義網(wǎng)和本體 語義網(wǎng) 本體 語義網(wǎng) ?層次結(jié)構(gòu) 語義網(wǎng) ?Unicode和 URI層 Unicode和 URI是整個語義網(wǎng)的基礎(chǔ),其中 Unicode負(fù)責(zé)資源的編碼, URI負(fù)責(zé)資源的標(biāo)識。 語義網(wǎng) ?RDF和 RDF Schema層 RDF采用三元組又稱為陳述( Statement),表示互聯(lián)網(wǎng)的資源、屬性和值。 RDFS在 RDF的基礎(chǔ)上引入類、類之間的關(guān)系、屬性之間的關(guān)系以及屬性的定義域與值域等。 語義網(wǎng) ?邏輯( Logic)層 該層用來產(chǎn)生規(guī)則,主要提供公理和推理規(guī)則,為智能推理提供基礎(chǔ)。 ?作用 -為人類和應(yīng)用系統(tǒng)提供一個對于主題的共同理解。 SPARQL語句的解析,轉(zhuǎn)化為 SQL以及基于規(guī)則的推理引擎。 本體 ?分類 -頂級 (Toplevel)本體描述的是最普遍的概念及概念之間的關(guān)系,如空間、時間、事件、行為等,與具體應(yīng)用無關(guān),其他本體均為其特例; -領(lǐng)域本體 (Domain Ontology)描述的是特定領(lǐng)域中的概念和概念之間的關(guān)系; -任務(wù)本體 (Task Ontology)描述的是特定任務(wù)或行為中的概念及概念之間的關(guān)系; -應(yīng)用本體 (Application Ontology)描述的是依賴于特定領(lǐng)域和任務(wù)的概念和概念之間的關(guān)系。其主要的數(shù)據(jù)結(jié)構(gòu)是圖,但是用戶操作主要還是在模型上進(jìn)行。 -為在不同的應(yīng)用程序之間共享信息和知識,描述應(yīng)用程序的領(lǐng)域,定義術(shù)語及其關(guān)系。 ?信任( Trust)層 主要提供信任機(jī)制,以保證用戶代理( Agent)在 Web上進(jìn)行個性化服務(wù)和交互更安全可靠。 語義網(wǎng) ?本體( Ontology)層 該層用于描述各種資源之間的聯(lián)系,本體揭示了資源本身及資源之間更為復(fù)雜和豐富的語義,從而將信息的結(jié)構(gòu)和內(nèi)容分離,對信息進(jìn)行完全形式化的描述,使 Web信息具有計算機(jī)可理解的語義。 RDF提供了一套標(biāo)準(zhǔn)的數(shù)據(jù)語義描述規(guī)范,但它還需要定義描述中使用的詞匯。 XML Schema提供了一種對 XML文檔進(jìn)行數(shù)據(jù)校驗的機(jī)制,基于 XML語法提供多種數(shù)據(jù)類型,對 XML標(biāo)記的結(jié)構(gòu)和使用方法進(jìn)行了規(guī)范。 知識管理 ?框架 框架通常由描述事物的各個方面的槽組成,每個槽可以有若干個側(cè)面,而每個側(cè)面又可以有若干個值。概念結(jié)點(diǎn)表示問題領(lǐng)域中的一個具體的或抽象的實體,概念關(guān)系結(jié)點(diǎn)表示概念結(jié)點(diǎn)之間的聯(lián)系。 知識表示 ?語義網(wǎng)絡(luò) 語義網(wǎng)絡(luò)是對對象及其屬性分類知識編碼的圖形結(jié)構(gòu)。例如技術(shù)高超的廚師或藝術(shù)家可能達(dá)到世界水平,卻很難將自己的技術(shù)或技巧表達(dá)出來從而將其傳播給別人或共享。 知識分類 ? 顯性知識 可以通過正常的語言方式傳播的知識,典型的顯性知識主要是指以專利、科學(xué)發(fā)明和特殊技術(shù)等形式存在的知識,存儲在書本、計算機(jī)數(shù)據(jù)庫、 CD ROM中。 知識的形式可能是模式、關(guān)聯(lián)、變化、異常以及其他有意義的結(jié)構(gòu)。 ? 數(shù)據(jù) 指一個有關(guān)事實 F的集合(如學(xué)生檔案數(shù)據(jù)庫中有關(guān)學(xué)生基本情況的各條記錄),用來描述事物有關(guān)方面的信息。 Web分類 統(tǒng) 計 和分 析統(tǒng) 計 量特 征 提 取學(xué) 習(xí)特 征 表 示分 類 器類 別訓(xùn) 練 集新 文 本分 類過 程訓(xùn) 練 過 程文 本 模 型10 數(shù)據(jù)挖掘?qū)嵗? 客戶細(xì)分 重入網(wǎng)識別 WAP日志挖掘 客戶細(xì)分 ? 客戶群價值分布 低端客戶 中高端客戶 高端客戶 中端客戶0 . 00250 . 00500 . 00750 . 00客戶價值n = 3606 n = 569 n = 108 n = 541 客戶細(xì)分 ? 客戶消費(fèi)行為的聚類結(jié)果 客戶細(xì)分 ? 客戶通話行為的聚類結(jié)果 重入網(wǎng)識別 ? 識別過程 -確定待匹配用戶和新入網(wǎng)用戶清單。 Web聚類 主要困難 ? 一個 Web文檔可能包含多個主題,允許屬于不同主題的文檔歸入多個不同的簇。如果將看作輸入,將看作輸出,則 Web挖掘就是一個從輸入到輸出的映射,即 ξ:→ 。 優(yōu)點(diǎn):只掃描數(shù)據(jù)庫二次,并且不用產(chǎn)生候選項集,提高了效率。 (2)開發(fā)了基于 FPtree的模式片斷成長算法 , 它從長度為 1的頻繁模式開始 , 只檢查它的條件模式構(gòu)建它的條件模式樹 , 并且在這個樹上遞歸地進(jìn)行挖掘 。 Han等提出的一種新的算法理論,用一種壓縮的數(shù)據(jù)結(jié)構(gòu) (FPtree)存儲關(guān)聯(lián)規(guī)則挖掘所需的全部數(shù)據(jù)信息,通過對源數(shù)據(jù)的兩次掃描,將數(shù)據(jù)信息存到這種結(jié)構(gòu)里,避開了產(chǎn)生候選項集的步驟,極大地減少了數(shù)據(jù)交換和頻繁匹配的開銷。算法的第一次掃描僅僅計算每個項目的具體支持度,以確定長度為 1的頻繁項集。 ? 構(gòu)建模型:預(yù)設(shè)分類類別 – 對每個樣本進(jìn)行類別標(biāo)記 – 訓(xùn)練集構(gòu)成分類模型 – 分類模型可表示為:分類規(guī)則、決
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1