freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計(論文)-基于關(guān)聯(lián)分析的web日志挖掘(文件)

2025-06-29 01:53 上一頁面

下一頁面
 

【正文】 g/, 1056。873。 /,453。 南京財經(jīng)大學(xué)本科畢業(yè)論文 12 表 1:關(guān)聯(lián)度計算結(jié)果表 關(guān)聯(lián)度 關(guān)聯(lián) 數(shù) 分母 數(shù) 分子 分母 118 130 /newimg/ /newimg/ 118 133 /newimg/ /newimg/ 114 129 /newimg/ /newimg/ 112 128 /newimg/ /newimg/ 112 128 /newimg/ /newimg/ 112 128 /newimg/ /newimg/ 112 129 /newimg/ /newimg/ 112 130 /newimg/ /newimg/ 114 133 /newimg/ /newimg/ 153 179 /new/clubmain/newimg/ /new/clubmain/newimg/ 109 129 /newimg/ /newimg/ 112 133 /newimg/ /newimg/ 153 182 /new/clubmain/newimg/ /new/clubmain/newimg/ 109 130 /newimg/ /newimg/ 148 179 /new/clubmain/newimg/ /new/clubmain/newimg/ 147 178 /new/clubmain/newimg/ /new/clubmain/newimg/ 147 179 /new/clubmain/newimg/ /new/clubmain/newimg/ 146 178 /new/clubmain/newimg/ /new/clubmain/newimg/ 148 181 /new/clubmain/newimg/ /new/clubmain/newimg/ 146 182 /new/clubmain/newimg/ /new/clubmain/newimg/ 145 181 /new/clubmain/newimg/ /new/clubmain/newimg/ 142 178 /new/clubmain/newimg/ /new/clubmain/newimg/ 145 182 /new/clubmain/newimg/ /new/clubmain/newimg/ 142 181 /new/clubmain/newimg/ /new/clubmain/newimg/ 57 181 / /new/clubmain/newimg/ …… …… …… …… …… (算法詳 見附錄) 南京財經(jīng)大學(xué)本科畢業(yè)論文 13 四 、個性化推薦 通過以上的關(guān)聯(lián) 分析, 有了用戶頻繁訪問路徑和鏈接之間的興趣度,可以構(gòu)建個性化推薦系統(tǒng)模型。 Web 日志挖掘作為 Web數(shù)據(jù)挖掘的嶄新研究方向 ,今年來已經(jīng)取得了一些突破性的進(jìn)展 , 但是由于 Web 的不確定性和多樣性 ,以及 Web的不斷壯大,還有很多問題亟待解決 , 有待于我們進(jìn)一步去研究和探索。如:當(dāng)客戶瀏覽 /newimg/,有 /newimg/,那么,在兩者之間就存在很高的關(guān)聯(lián)性,從而我們有必要對這兩個鏈接建立某種跟緊密的聯(lián)系。 ( 2)生成關(guān)聯(lián)規(guī)則 從單項集合中,生成可能的雙項集合規(guī)則,分別計算置信度。 /newimg/,854。 /new/clubmain/newimg/,1010。 (一) 數(shù)據(jù)預(yù)處理 由于 Web日志數(shù)據(jù)時一個非常龐大的數(shù)據(jù)集體,因此選用數(shù)據(jù)庫作為分析工具 , 將原始數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫 ,取出前 10000行日志數(shù)據(jù),處理如下 : :存在缺失值的整行 刪除,訪問方式除 GET、 POST、 OPTIONS以外的整行 刪除; 2. 用戶識別:由于數(shù)據(jù)中不存在 IP地址相同,但是操作系統(tǒng)類型或者瀏覽器軟件不同的情況, 從而認(rèn)為不同的 IP地址代表不同的用戶; 、及路徑補(bǔ)充:用戶會話被定義為用戶在對網(wǎng) 站的一次訪問過程中所請求的 URL的集合,若某一用戶發(fā)出連續(xù)兩個 URL的請求的時間差不超過規(guī)定的時間閾值,則這兩次請求被劃分在同一用戶會話中,否則分別屬于兩個不同的用戶會話,對與本數(shù)據(jù), 時間閾值設(shè)為 30分鐘。 for (k = 1。 2. 置信度 規(guī)則 YX?? 在事務(wù)集中的置信度 (confidence)是指同時包含 X , Y 的事務(wù)數(shù)與包含 X 的事務(wù)數(shù)之比,它用來衡量關(guān)聯(lián)規(guī)則的可信程度。 一個 關(guān)聯(lián)規(guī)則是形如 YX?? 的蘊涵式,這里 X , Y 都是項目集,且 1CX? ,1?Y ,并且 ??YX? , X , Y 分別稱為關(guān)聯(lián)規(guī)則 YX?? 的前提和結(jié)論。設(shè) kt 和 X 分別為 D 中的事務(wù)和項目集,如果 kt X? ,稱事務(wù) kt 包含項目 集 X 。 T 中的元素 },2,1{ pji j ??? 稱為項。 ( 三 ) 模式分析 基于以上的所有過程, 對原始數(shù)據(jù)進(jìn)行進(jìn)一步分析,找出用戶的瀏覽模式規(guī)律,即用戶的興趣愛好及習(xí)慣,并使其可視化,為網(wǎng)頁的規(guī)劃及網(wǎng)站建設(shè)的決策提供具體理論依據(jù)。關(guān)聯(lián)分析的目的是挖掘隱藏在數(shù)據(jù)間的相互關(guān)系,自動探測以前未發(fā)現(xiàn)的隱藏著的模式,關(guān)聯(lián)分析經(jīng)常被表達(dá)為規(guī)則的形式。聚類是將數(shù)據(jù)集劃分為多個類,使得在同一類中的數(shù)據(jù)之間有南京財經(jīng)大學(xué)本科畢業(yè)論文 6 較高的相似度,而在不同類中的數(shù)據(jù)差別盡可能大。分類包括的挖掘技術(shù)將找出定義了一個項或事件是否屬于數(shù)據(jù)中某特定子集或類的規(guī)則。 ( 1)統(tǒng)計。當(dāng)用戶對該
點擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1