freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計(論文)-基于關(guān)聯(lián)分析的web日志挖掘-免費閱讀

2025-07-07 01:53 上一頁面

下一頁面
  

【正文】 對于以上的實證例子,我們可以在置信度高于最低置信度的相關(guān)鏈接之間,建立某種信息快速互聯(lián)的橋梁, 亦或是在網(wǎng)頁規(guī)劃中,充分考慮鏈接之間的關(guān)聯(lián)關(guān)系,從而為更人性化、合理化的網(wǎng)頁設(shè)計提供決策依據(jù)。 /newimg/,863。 for each 數(shù)據(jù)庫中的事務(wù) t do 增加包含在 t 中的所有候選 Ck+1的計數(shù) Lk+1 = Ck+1 中滿足 min_support的候選 南京財經(jīng)大學(xué)本科畢業(yè)論文 9 圖 2:Apriori算法圖解 數(shù)據(jù)庫 TDB TID Items 10 A, C, D 20 B, C, E 30 A, B, C, E 40 B, E Itemset Sup {A} 2 {B} 3 {C} 3 {D} 1 {E} 3 第一次掃描 C1 Itemset Sup {A} 2 {B} 3 {C} 3 {E} 3 L1 Itemset {AB} {AC} {AE} {BC} {BE} {CE} C2 第二 次掃描 Itemset Sup {AB} 1 {AC} 2 {AE} 1 {BC} 2 {BE} 3 {CE} 2 C2 Itemset Sup {AC} 2 {BC} 2 {BE} 3 {CE} 2 Itemset {BCE} C3 第三 次掃描 L3 L2 Itemset Sup {BCE} 2 南京財經(jīng)大學(xué)本科畢業(yè)論文 10 三 、實證分析 本數(shù)據(jù)來源為某網(wǎng)站某天 的全部 Web日志數(shù)據(jù)。支持度描述了 X , Y 這兩個項集在所有事務(wù)中同時出現(xiàn)的概率。 I 中的任何子集稱為項目集(itemset),若 k|X| ? ,則稱集合 X 為 ?K 項集。路徑分析可以用來確定網(wǎng)站上的頻繁訪問路徑 , 從而調(diào)整和優(yōu)化網(wǎng)站結(jié)構(gòu) , 使得用戶訪問所需網(wǎng)頁更加簡單快捷 , 還可以根據(jù)用戶典型的瀏覽模式用于智能推薦和有針對性的電子商務(wù)活動。 ( 3)聚類。分有統(tǒng)計、分類、聚類、關(guān)聯(lián)規(guī)則、路徑分析等多種方法。如果一個用戶的請求不能通過引用頁的鏈接進(jìn)入 , 則屬于另一個會話。常用的算法有以下幾種 : ( 1) 對用戶在整個網(wǎng)站的停留時間設(shè)一個閾值 T。目前 , 由于本地緩存、代理服務(wù)器和防火墻的存在 , 為用戶動態(tài)的分配 IP 地址 , 想要識別出每一個用戶變得很復(fù)雜。Web日志挖掘是指采用數(shù)據(jù)挖掘的技術(shù),通過對 Web服務(wù)器日志中大量的用戶訪問記錄深入分析,發(fā)現(xiàn)用戶的訪問模式和興趣愛好等有趣、新穎、潛在有用的以及可理解的未知信息和知識,用于分析站點的使用情況,從而輔助管理和支持決策。s access pattern in the Web access logs ,the researcher can predict the user39。 關(guān)鍵詞 :web日志挖掘 。但是,我們又不得不面對“人們被數(shù)據(jù)淹沒 ,人們卻饑餓于知識”的現(xiàn)實。 Web日志挖掘一般都包含以下幾個過程: ( 一) 數(shù)據(jù)預(yù)處理 數(shù)據(jù)預(yù)處理是 Web 日志挖掘的首要環(huán)節(jié) , 其任務(wù)是將原始日志數(shù)據(jù)轉(zhuǎn)換成適合數(shù)據(jù)挖掘和模式發(fā)現(xiàn)所必需的格式 , 預(yù)處理可以直接簡化數(shù)據(jù)挖掘過程,使結(jié)果更具客觀性。 會話 , 是指同一個用戶連續(xù)請求的頁面。否則 , 分屬于兩個會話。當(dāng)用戶對該網(wǎng)頁訪問的時間小于時間點為導(dǎo)航頁,大于時間點則為內(nèi)容頁。分類包括的挖掘技術(shù)將找出定義了一個項或事件是否屬于數(shù)據(jù)中某特定子集或類的規(guī)則。關(guān)聯(lián)分析的目的是挖掘隱藏在數(shù)據(jù)間的相互關(guān)系,自動探測以前未發(fā)現(xiàn)的隱藏著的模式,關(guān)聯(lián)分析經(jīng)常被表達(dá)為規(guī)則的形式。 T 中的元素 },2,1{ pji j ??? 稱為項。 一個 關(guān)聯(lián)規(guī)則是形如 YX?? 的蘊涵式,這里 X , Y 都是項目集,且 1CX? ,1?Y ,并且 ??YX? , X , Y 分別稱為關(guān)聯(lián)規(guī)則 YX?? 的前提和結(jié)論。 for (k = 1。 /new/clubmain/newimg/,1010。 ( 2)生成關(guān)聯(lián)規(guī)則 從單項集合中,生成可能的雙項集合規(guī)則,分別計算置信度。 Web 日志挖掘作為 Web數(shù)據(jù)挖掘的嶄新研究方向 ,今年來已經(jīng)取得了一些突破性的進(jìn)展 , 但是由于 Web 的不確定性和多樣性 ,以及 Web的不斷壯大,還有很多問題亟待解決 , 有待于我們進(jìn)一步去研究和探索。 /,453。 /new/clubmain/newimg/, 1056。 Apriori算法需要兩個步驟:第一個是生成條目集;第二個是使用生成的條目集創(chuàng)建一組關(guān)聯(lián)規(guī)則。設(shè) X , Y 是數(shù)據(jù)集 D 中的項目集。 二 、關(guān)聯(lián)分析 (一) 關(guān)聯(lián)規(guī)則 顧名思義,關(guān)聯(lián)規(guī)則( association rule)挖掘技術(shù)用于于發(fā)現(xiàn)數(shù)據(jù)庫中屬性之間的有趣聯(lián)系。主要算法有 k— means、 DBSCAN等。雖然缺乏深度 , 但仍可用于改進(jìn)網(wǎng)站結(jié)構(gòu) , 增強(qiáng)系統(tǒng)安全性 , 提高網(wǎng)站訪問的效率等。可以把 Web頁簡單地分為兩類:內(nèi) 容頁和導(dǎo)航頁。 ( 2)對用戶在一個頁面停留時間設(shè)一個域 值△ t。 ( 3) 如果 Web 服務(wù)器既沒有 Cookie 也沒有用戶 ID,最常用的方法就是采用啟發(fā)式規(guī)則。 下面是一段日志:① 20211017 00:00:00② ③ 80 ④ GET ⑤ / ⑥
點擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1