freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計(jì)(論文)-基于關(guān)聯(lián)分析的web日志挖掘(文件)

 

【正文】 g/, 1056。873。 /,453。 南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文 12 表 1:關(guān)聯(lián)度計(jì)算結(jié)果表 關(guān)聯(lián)度 關(guān)聯(lián) 數(shù) 分母 數(shù) 分子 分母 118 130 /newimg/ /newimg/ 118 133 /newimg/ /newimg/ 114 129 /newimg/ /newimg/ 112 128 /newimg/ /newimg/ 112 128 /newimg/ /newimg/ 112 128 /newimg/ /newimg/ 112 129 /newimg/ /newimg/ 112 130 /newimg/ /newimg/ 114 133 /newimg/ /newimg/ 153 179 /new/clubmain/newimg/ /new/clubmain/newimg/ 109 129 /newimg/ /newimg/ 112 133 /newimg/ /newimg/ 153 182 /new/clubmain/newimg/ /new/clubmain/newimg/ 109 130 /newimg/ /newimg/ 148 179 /new/clubmain/newimg/ /new/clubmain/newimg/ 147 178 /new/clubmain/newimg/ /new/clubmain/newimg/ 147 179 /new/clubmain/newimg/ /new/clubmain/newimg/ 146 178 /new/clubmain/newimg/ /new/clubmain/newimg/ 148 181 /new/clubmain/newimg/ /new/clubmain/newimg/ 146 182 /new/clubmain/newimg/ /new/clubmain/newimg/ 145 181 /new/clubmain/newimg/ /new/clubmain/newimg/ 142 178 /new/clubmain/newimg/ /new/clubmain/newimg/ 145 182 /new/clubmain/newimg/ /new/clubmain/newimg/ 142 181 /new/clubmain/newimg/ /new/clubmain/newimg/ 57 181 / /new/clubmain/newimg/ …… …… …… …… …… (算法詳 見(jiàn)附錄) 南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文 13 四 、個(gè)性化推薦 通過(guò)以上的關(guān)聯(lián) 分析, 有了用戶頻繁訪問(wèn)路徑和鏈接之間的興趣度,可以構(gòu)建個(gè)性化推薦系統(tǒng)模型。 Web 日志挖掘作為 Web數(shù)據(jù)挖掘的嶄新研究方向 ,今年來(lái)已經(jīng)取得了一些突破性的進(jìn)展 , 但是由于 Web 的不確定性和多樣性 ,以及 Web的不斷壯大,還有很多問(wèn)題亟待解決 , 有待于我們進(jìn)一步去研究和探索。如:當(dāng)客戶瀏覽 /newimg/,有 /newimg/,那么,在兩者之間就存在很高的關(guān)聯(lián)性,從而我們有必要對(duì)這兩個(gè)鏈接建立某種跟緊密的聯(lián)系。 ( 2)生成關(guān)聯(lián)規(guī)則 從單項(xiàng)集合中,生成可能的雙項(xiàng)集合規(guī)則,分別計(jì)算置信度。 /newimg/,854。 /new/clubmain/newimg/,1010。 (一) 數(shù)據(jù)預(yù)處理 由于 Web日志數(shù)據(jù)時(shí)一個(gè)非常龐大的數(shù)據(jù)集體,因此選用數(shù)據(jù)庫(kù)作為分析工具 , 將原始數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù) ,取出前 10000行日志數(shù)據(jù),處理如下 : :存在缺失值的整行 刪除,訪問(wèn)方式除 GET、 POST、 OPTIONS以外的整行 刪除; 2. 用戶識(shí)別:由于數(shù)據(jù)中不存在 IP地址相同,但是操作系統(tǒng)類型或者瀏覽器軟件不同的情況, 從而認(rèn)為不同的 IP地址代表不同的用戶; 、及路徑補(bǔ)充:用戶會(huì)話被定義為用戶在對(duì)網(wǎng) 站的一次訪問(wèn)過(guò)程中所請(qǐng)求的 URL的集合,若某一用戶發(fā)出連續(xù)兩個(gè) URL的請(qǐng)求的時(shí)間差不超過(guò)規(guī)定的時(shí)間閾值,則這兩次請(qǐng)求被劃分在同一用戶會(huì)話中,否則分別屬于兩個(gè)不同的用戶會(huì)話,對(duì)與本數(shù)據(jù), 時(shí)間閾值設(shè)為 30分鐘。 for (k = 1。 2. 置信度 規(guī)則 YX?? 在事務(wù)集中的置信度 (confidence)是指同時(shí)包含 X , Y 的事務(wù)數(shù)與包含 X 的事務(wù)數(shù)之比,它用來(lái)衡量關(guān)聯(lián)規(guī)則的可信程度。 一個(gè) 關(guān)聯(lián)規(guī)則是形如 YX?? 的蘊(yùn)涵式,這里 X , Y 都是項(xiàng)目集,且 1CX? ,1?Y ,并且 ??YX? , X , Y 分別稱為關(guān)聯(lián)規(guī)則 YX?? 的前提和結(jié)論。設(shè) kt 和 X 分別為 D 中的事務(wù)和項(xiàng)目集,如果 kt X? ,稱事務(wù) kt 包含項(xiàng)目 集 X 。 T 中的元素 },2,1{ pji j ??? 稱為項(xiàng)。 ( 三 ) 模式分析 基于以上的所有過(guò)程, 對(duì)原始數(shù)據(jù)進(jìn)行進(jìn)一步分析,找出用戶的瀏覽模式規(guī)律,即用戶的興趣愛(ài)好及習(xí)慣,并使其可視化,為網(wǎng)頁(yè)的規(guī)劃及網(wǎng)站建設(shè)的決策提供具體理論依據(jù)。關(guān)聯(lián)分析的目的是挖掘隱藏在數(shù)據(jù)間的相互關(guān)系,自動(dòng)探測(cè)以前未發(fā)現(xiàn)的隱藏著的模式,關(guān)聯(lián)分析經(jīng)常被表達(dá)為規(guī)則的形式。聚類是將數(shù)據(jù)集劃分為多個(gè)類,使得在同一類中的數(shù)據(jù)之間有南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文 6 較高的相似度,而在不同類中的數(shù)據(jù)差別盡可能大。分類包括的挖掘技術(shù)將找出定義了一個(gè)項(xiàng)或事件是否屬于數(shù)據(jù)中某特定子集或類的規(guī)則。 ( 1)統(tǒng)計(jì)。當(dāng)用戶對(duì)該
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1