freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第6章現(xiàn)代數(shù)據(jù)挖掘技術(shù)與發(fā)展-wenkub

2022-08-17 12:28:34 本頁面
 

【正文】 現(xiàn) 。 知識發(fā)現(xiàn)是用一種簡潔的方式從大量數(shù)據(jù)中抽取信息的一種技術(shù) , 所抽取的信息是隱含的 、 未知的 , 并且具有潛在應(yīng)用價值 。 (2) 通過現(xiàn)代挖掘技術(shù)及應(yīng)用的學(xué)習(xí)掌握規(guī)則型 、 神經(jīng)網(wǎng)絡(luò)型 、 遺傳算法型 、 粗糙集型和決策樹型現(xiàn)代挖掘技術(shù) 。 (3) 通過知識發(fā)現(xiàn)工具與應(yīng)用的學(xué)習(xí)掌握知識挖掘工具的系統(tǒng)結(jié)構(gòu) 、運用中的問題和知識挖掘的價值 。 知識發(fā)現(xiàn)意味著在數(shù)據(jù)倉庫或數(shù)據(jù)集市的幾千兆 、 幾萬兆字節(jié)數(shù)據(jù)中尋找預(yù)先未知的商業(yè)模式與事實 。 知識發(fā)現(xiàn)系統(tǒng)的數(shù)據(jù)庫接口可以直接與數(shù)據(jù)倉庫通信 。 Apriori算法的第 1步采用了遞歸方法 , 算法表示為 L1={large 1itemsets}。//產(chǎn)生 k項集的候選集 for all transactions t∈ D do begin Ct=subset(Ck,t)。 這種規(guī)則形如 I1,I2,I3,… Ii1,Ii+1… ,Ik→ Ii,。 神經(jīng)網(wǎng)絡(luò)型現(xiàn)代挖掘技術(shù) ( 1) 基于自組織神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù) 一種無教師學(xué)習(xí)過程 、 可以提取一組數(shù)據(jù)中的重要特征或某種內(nèi)在知識 ( 2) 模糊神經(jīng)網(wǎng)絡(luò)類型數(shù)據(jù)挖掘技術(shù) 模糊 BP網(wǎng)絡(luò) 、 模糊 Kohonen聚類網(wǎng)絡(luò) 、 模糊推理網(wǎng)絡(luò) 、 模糊 ART模型等 模糊 BP網(wǎng)絡(luò)中 , 樣本的希望輸出值改為樣本相對各類的希望隸屬度 輸出表達方面實現(xiàn)了模糊化 , 而且將樣本的隸屬度引入了權(quán)系數(shù)的修正規(guī)則中 , 使權(quán)系數(shù)的修正規(guī)則也實現(xiàn)了模糊化 。 ( 2) 計算當前基因群體中所有個體的環(huán)境適合度 ( 3) 用適應(yīng)函數(shù)評價每一個體對環(huán)境的適應(yīng)度 ( 4) 選擇適應(yīng)度好的生物個體進行復(fù)制 ( 5) 選擇適應(yīng)度好的生物個體進行復(fù)制交叉配對繁殖 ( 6) 新生代的變異操作 遺傳算法型現(xiàn)代挖掘技術(shù) 編碼并生成祖先群體 計算當前基因群體中所有個體的適合度 是否滿足最優(yōu)解條件 ? 選擇群體中適應(yīng)值高的個體進行復(fù)制 交叉操作 變異操作 終止 遺傳算法型現(xiàn)代挖掘技術(shù) 用四個染色體來定義客戶類型: 基因 1:客戶的年齡下限 基因 2:客戶的年齡上限 基因 3:客戶的收入水平 基因 4:客戶的人口狀況 ( 人口狀況可以分成:少 ( 1至 2人 ) 、 一般 ( 3至 4人 ) 和多 ( 5人以上 ) 三種狀況 ) 客戶 ID 年齡 累計購買金額 收入 家庭人口 性別 10985 46 1843 中等 4 女 18595 49 0 中等 2 男 47382 61 3628 低 5 男 74912 36 18463 高 6 女 95623 29 8463 高 3 男 85526 32 274 中等 2 男 58753 52 1846 低 2 女 64957 48 0 中等 3 女 76957 27 21634 高 5 男 65839 45 842 低 1 女 遺傳算法型現(xiàn)代挖掘技術(shù) 所有的生物個體按順序排放在一張二維表格上 , 使每個生物體的上 、 下 、 左 、 右都與其它生物體相鄰接 。 而 9702 990211就是邊界實例 , 即它們不能根據(jù)有效知識進行適當?shù)姆诸?。 同樣 , 980625沒有流失 , 但是不能排除 970230和 990211流失 。 如果樣本都在同一類 , 則算法停止 , 把該節(jié)點改成樹葉節(jié)點 , 并用該類標記 。 (a)給定節(jié)點的所有樣本都屬于同一類 。 信息增益是指劃分前后進行正確預(yù)測所需的信息量之差 。 計算剩余各個屬性的相應(yīng)的信息增益,選擇信息增益最大的屬性作為測試屬性,這時信息增益最大的是“學(xué)生”屬性,創(chuàng)建一個節(jié)點,用“學(xué)生”標記 。 ? (2)利用粗糙集技術(shù)對本表的數(shù)據(jù)進行分析,討論可能會得到什么結(jié)論。對該系統(tǒng)進行一個實際的評價,并描述一下其具體的實現(xiàn)方法。討論如何挖掘這種商業(yè)模式。 ( tight coupling) DM系統(tǒng)被平滑地集成到 DB/DW系統(tǒng)
點擊復(fù)制文檔內(nèi)容
數(shù)學(xué)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1