freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設計(論文)-基于關聯(lián)分析的web日志挖掘-wenkub

2023-06-16 01:53:23 本頁面
 

【正文】 ...................... 1 一、 Web 日志挖掘 .................................................... 2 (一)、數(shù)據(jù)預處理 ............................................... 2 (二)、模式發(fā)現(xiàn) ................................................. 4 (三)、模式分析 ................................................. 5 二、關聯(lián)分析 ........................................................ 5 (一)關聯(lián)規(guī)則 .................................................. 5 (二) Apriori 方 法簡介 ........................................... 7 四、實證分析 ........................................................ 8 (一)數(shù)據(jù)預處理 ................................................ 8 (二)模式發(fā)現(xiàn) .................................................. 9 (三) 模式分析 ................................................. 10 五、個性化推薦 ..................................................... 11 六 、結束語 ........................................................ 12 參考文獻 ........................................................... 13 附錄 ............................................................... 15 南京財經(jīng)大學本科畢業(yè)論文 2 基于 關聯(lián) 分析 的 Web 日志挖掘 摘要 :web 日志挖掘是 web 數(shù)據(jù)挖掘中的一個重要組成部分,通過從 Web 訪問日志中發(fā)現(xiàn)用戶的訪問模式,預測用戶的瀏覽行為。實證分析 Web Log Mining Based On Association Analysis Abstract: Web log mining is an important part of web data mining, finding the user39。 Association analysis。 根據(jù)所挖掘的 Web 數(shù)據(jù)的類型,可以將 Web 數(shù)據(jù)挖掘分為以下三類: Web 內(nèi)容挖掘 (Web Content Mining)、 Web 結構挖掘 (Web Structure Mining)、 Web 使用挖掘 (Web Usage Mining)(也稱為 Web日志挖掘)。 下面是一段日志:① 20211017 00:00:00② ③ 80 ④ GET ⑤ / ⑥ Mozilla/+(Windows; +U;+Windows+NT+; +zhCN; +rv: )+Gecko/20210426+Firefox/。 1.數(shù)據(jù)凈化 數(shù)據(jù)凈化 , 是指將待處理的日志數(shù)據(jù)導入到關系數(shù)據(jù)庫 ,刪除 Web日志數(shù)據(jù)中的錯誤值、缺失值等,同時把與 Web數(shù)據(jù)挖掘無關的變量或數(shù)據(jù)進行清理,已達到簡便運算的目的; 用戶識別 , 是從 Web日志數(shù)據(jù)中找出每個用戶的訪問地址,避免挖掘的重復性。 ( 3) 如果 Web 服務器既沒有 Cookie 也沒有用戶 ID,最常用的方法就是采用啟發(fā)式規(guī)則。會話識別的目的是將用戶的所有訪問序列分成單個的訪問序列。 ( 2)對用戶在一個頁面停留時間設一個域 值△ t。 ( 3)利用用戶的訪問歷史和引用頁來劃分??梢园?Web頁簡單地分為兩類:內(nèi) 容頁和導航頁。 ( 二 ) 模式發(fā)現(xiàn) 模式發(fā)現(xiàn) , 是對預處理后的數(shù)據(jù)用數(shù)據(jù)挖掘算法來分析數(shù)據(jù)。雖然缺乏深度 , 但仍可用于改進網(wǎng)站結構 , 增強系統(tǒng)安全性 , 提高網(wǎng)站訪問的效率等。分類算法最知名的是決策樹方法,此外還有神經(jīng)元網(wǎng)絡、 Bayesian分類等。主要算法有 k— means、 DBSCAN等。 ( 5) 路徑分析。 二 、關聯(lián)分析 (一) 關聯(lián)規(guī)則 顧名思義,關聯(lián)規(guī)則( association rule)挖掘技術用于于發(fā)現(xiàn)數(shù)據(jù)庫中屬性之間的有趣聯(lián)系。設 },{ 21 miiiI ??是數(shù)據(jù)集中所有項的集合, I 是二進制文字的集合。設 X , Y 是數(shù)據(jù)集 D 中的項目集。 規(guī)則 YX?? 在數(shù)據(jù)庫 D 中的支持度 (support) 是交易集中同時包含 X , Y 的事務數(shù)與所有事務數(shù)之比,記為 Y) support(X ?? )(sup YXport ?? 。 Apriori算法需要兩個步驟:第一個是生成條目集;第二個是使用生成的條目集創(chuàng)建一組關聯(lián)規(guī)則。 k++) do begin Ck+1 = 由 Lk產(chǎn)生的候選 。 /new/clubmain/newim
點擊復制文檔內(nèi)容
畢業(yè)設計相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1