freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計(jì)(論文)-基于關(guān)聯(lián)分析的web日志挖掘(參考版)

2025-01-19 21:25本頁面
  

【正文】 Web 日志挖掘作為 Web數(shù)據(jù)挖掘的嶄新研究方向 ,今年來已經(jīng)取得了一些突破性的進(jìn)展 , 但是由于 Web 的不確定性和多樣性 ,以及 Web的不斷壯大,還有很多問題亟待解決 , 有待于我們進(jìn)一步去研究和探索。如:當(dāng)客戶瀏覽 /newimg/,有 /newimg/,那么,在兩者之間就存在很高的關(guān)聯(lián)性,從而我們有必要對這兩個(gè)鏈接建立某種跟緊密的聯(lián)系。 南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文 12 表 1:關(guān)聯(lián)度計(jì)算結(jié)果表 關(guān)聯(lián)度 關(guān)聯(lián) 數(shù) 分母 數(shù) 分子 分母 118 130 /newimg/ /newimg/ 118 133 /newimg/ /newimg/ 114 129 /newimg/ /newimg/ 112 128 /newimg/ /newimg/ 112 128 /newimg/ /newimg/ 112 128 /newimg/ /newimg/ 112 129 /newimg/ /newimg/ 112 130 /newimg/ /newimg/ 114 133 /newimg/ /newimg/ 153 179 /new/clubmain/newimg/ /new/clubmain/newimg/ 109 129 /newimg/ /newimg/ 112 133 /newimg/ /newimg/ 153 182 /new/clubmain/newimg/ /new/clubmain/newimg/ 109 130 /newimg/ /newimg/ 148 179 /new/clubmain/newimg/ /new/clubmain/newimg/ 147 178 /new/clubmain/newimg/ /new/clubmain/newimg/ 147 179 /new/clubmain/newimg/ /new/clubmain/newimg/ 146 178 /new/clubmain/newimg/ /new/clubmain/newimg/ 148 181 /new/clubmain/newimg/ /new/clubmain/newimg/ 146 182 /new/clubmain/newimg/ /new/clubmain/newimg/ 145 181 /new/clubmain/newimg/ /new/clubmain/newimg/ 142 178 /new/clubmain/newimg/ /new/clubmain/newimg/ 145 182 /new/clubmain/newimg/ /new/clubmain/newimg/ 142 181 /new/clubmain/newimg/ /new/clubmain/newimg/ 57 181 / /new/clubmain/newimg/ …… …… …… …… …… (算法詳見附錄) 南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文 13 四 、個(gè)性化推薦 通過以上的關(guān)聯(lián) 分析, 有了用戶頻繁訪問 路徑和鏈接之間的興趣度,可以構(gòu)建個(gè)性化推薦系統(tǒng)模型。 ( 2)生成關(guān)聯(lián)規(guī)則 從單項(xiàng)集合中,生成可能的雙項(xiàng)集合規(guī)則,分別計(jì)算置信度。 /,453。 /newimg/,854。873。 /new/clubmain/newimg/,1010。 /new/clubmain/newimg/, 1056。 (一) 數(shù)據(jù)預(yù)處理 由于 Web日志數(shù)據(jù)時(shí)一個(gè)非常龐大的數(shù)據(jù)集體,因此選用數(shù)據(jù)庫作為分析工具 , 將原始數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫 ,取出前 10000行日志數(shù)據(jù),處理如下 : :存在缺失值的整行 刪除,訪問方式除 GET、 POST、 OPTIONS以外的整行 刪除; 2. 用戶識(shí)別:由于數(shù)據(jù)中不存在 IP地址相同,但是操作系統(tǒng)類型或者瀏覽器軟件不同的情況, 從而認(rèn)為不同的 IP地址代表不同的用戶; 、及路徑補(bǔ)充:用戶會(huì)話被定義為用戶在對網(wǎng)站的一次訪問過程中所請求的 URL的集合,若某一用戶發(fā)出連續(xù) 兩個(gè) URL的請求的時(shí)間差不超過規(guī)定的時(shí)間閾值,則這兩次請求被劃分在同一用戶會(huì)話中,否則分別屬于兩個(gè)不同的用戶會(huì)話,對與本數(shù)據(jù), 時(shí)間閾值設(shè)為 30分鐘。 k++) do begin Ck+1 = 由 Lk產(chǎn)生的候選 。 for (k = 1。 Apriori算法需要兩個(gè)步驟:第一個(gè)是生成條目 集;第二個(gè)是使用生成的條目集創(chuàng)建一組關(guān)聯(lián)規(guī)則。 2. 置信度 規(guī)則 YX?? 在事務(wù)集中的置信度 (confidence)是指同時(shí)包含 X , Y 的事務(wù)數(shù)與包含 X 的事務(wù)數(shù)之比,它用來衡量關(guān)聯(lián)規(guī)則的可信程度。 規(guī)則 YX?? 在數(shù)據(jù)庫 D 中的支持度 (support) 是交易集中同時(shí)包含 X , Y 的事務(wù)數(shù)與所有事務(wù)數(shù)之比,記為 Y) support(X ?? )(sup YXport ?? 。 一個(gè)關(guān)聯(lián)規(guī)則是形 如 YX?? 的蘊(yùn)涵式,這里 X , Y 都是項(xiàng)目集,且 1CX? ,1?Y ,并且 ??YX? , X , Y 分別稱為關(guān)聯(lián)規(guī)則 YX?? 的前提和結(jié)論。設(shè) X , Y 是數(shù)據(jù)集 D 中的項(xiàng)目集。設(shè) kt 和 X 分別為 D 中的事務(wù)和項(xiàng)目集,如果 kt X? ,稱事務(wù) kt 包含項(xiàng)目集 X 。設(shè) },{ 21 miiiI ??是數(shù)據(jù)集中所有項(xiàng)的集合, I 是二進(jìn)制文字的集合。 T 中的元素 },2,1{ pji j ??? 稱
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1