freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計(論文)-基于關(guān)聯(lián)分析的web日志挖掘(完整版)

2025-07-23 01:53上一頁面

下一頁面
  

【正文】 112 133 /newimg/ /newimg/ 153 182 /new/clubmain/newimg/ /new/clubmain/newimg/ 109 130 /newimg/ /newimg/ 148 179 /new/clubmain/newimg/ /new/clubmain/newimg/ 147 178 /new/clubmain/newimg/ /new/clubmain/newimg/ 147 179 /new/clubmain/newimg/ /new/clubmain/newimg/ 146 178 /new/clubmain/newimg/ /new/clubmain/newimg/ 148 181 /new/clubmain/newimg/ /new/clubmain/newimg/ 146 182 /new/clubmain/newimg/ /new/clubmain/newimg/ 145 181 /new/clubmain/newimg/ /new/clubmain/newimg/ 142 178 /new/clubmain/newimg/ /new/clubmain/newimg/ 145 182 /new/clubmain/newimg/ /new/clubmain/newimg/ 142 181 /new/clubmain/newimg/ /new/clubmain/newimg/ 57 181 / /new/clubmain/newimg/ …… …… …… …… …… (算法詳 見附錄) 南京財經(jīng)大學(xué)本科畢業(yè)論文 13 四 、個性化推薦 通過以上的關(guān)聯(lián) 分析, 有了用戶頻繁訪問路徑和鏈接之間的興趣度,可以構(gòu)建個性化推薦系統(tǒng)模型。如:當(dāng)客戶瀏覽 /newimg/,有 /newimg/,那么,在兩者之間就存在很高的關(guān)聯(lián)性,從而我們有必要對這兩個鏈接建立某種跟緊密的聯(lián)系。 /newimg/,854。 (一) 數(shù)據(jù)預(yù)處理 由于 Web日志數(shù)據(jù)時一個非常龐大的數(shù)據(jù)集體,因此選用數(shù)據(jù)庫作為分析工具 , 將原始數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫 ,取出前 10000行日志數(shù)據(jù),處理如下 : :存在缺失值的整行 刪除,訪問方式除 GET、 POST、 OPTIONS以外的整行 刪除; 2. 用戶識別:由于數(shù)據(jù)中不存在 IP地址相同,但是操作系統(tǒng)類型或者瀏覽器軟件不同的情況, 從而認(rèn)為不同的 IP地址代表不同的用戶; 、及路徑補充:用戶會話被定義為用戶在對網(wǎng) 站的一次訪問過程中所請求的 URL的集合,若某一用戶發(fā)出連續(xù)兩個 URL的請求的時間差不超過規(guī)定的時間閾值,則這兩次請求被劃分在同一用戶會話中,否則分別屬于兩個不同的用戶會話,對與本數(shù)據(jù), 時間閾值設(shè)為 30分鐘。 2. 置信度 規(guī)則 YX?? 在事務(wù)集中的置信度 (confidence)是指同時包含 X , Y 的事務(wù)數(shù)與包含 X 的事務(wù)數(shù)之比,它用來衡量關(guān)聯(lián)規(guī)則的可信程度。設(shè) kt 和 X 分別為 D 中的事務(wù)和項目集,如果 kt X? ,稱事務(wù) kt 包含項目 集 X 。 ( 三 ) 模式分析 基于以上的所有過程, 對原始數(shù)據(jù)進行進一步分析,找出用戶的瀏覽模式規(guī)律,即用戶的興趣愛好及習(xí)慣,并使其可視化,為網(wǎng)頁的規(guī)劃及網(wǎng)站建設(shè)的決策提供具體理論依據(jù)。聚類是將數(shù)據(jù)集劃分為多個類,使得在同一類中的數(shù)據(jù)之間有南京財經(jīng)大學(xué)本科畢業(yè)論文 6 較高的相似度,而在不同類中的數(shù)據(jù)差別盡可能大。 ( 1)統(tǒng)計。 ( 4)最大向前引用算法 ( MF) 。如果兩個相鄰的瀏覽頁面之間的訪問時間超過 T, 則認(rèn)為用戶又開始了一個新的會話??梢酝ㄟ^以下 3 種方法來識別用戶 : ( 1) 如果 Web 服務(wù)器提供 Cookie , 則具有相同 Cookie 值的頁面請求是來自同一個用戶 。當(dāng)前, web日志挖掘主要被用于個性化服務(wù)與定制、改進系統(tǒng)性能和結(jié)構(gòu)、站點修改、商業(yè)智能以及 web特征描述等諸多領(lǐng)域。s browsing behavior. This essay introduces the method of Association analysis in Web log mining,espacally the method of Apriori, at the same time ,we use this method to analysis a particular site’s log data to find the users’ browsing patterns and association rules between web pages 。 本文主要介紹了 web 數(shù)據(jù)挖掘的一般過程及方法,對 Apriori 關(guān)聯(lián)分析方法作了重點闡述,并利用該方法對某網(wǎng)站某天的部分 web 日志數(shù)據(jù)進行了實證分析 , 得出了 用戶瀏覽模式及網(wǎng)頁內(nèi)容之間的關(guān)聯(lián)規(guī)則, 找到單個用戶在瀏覽頁面興趣愛好以及群體用戶的瀏覽習(xí)慣, 繼而對網(wǎng)站的網(wǎng)頁規(guī)劃 布局 提出了 個性化 的意見 。 Positive analysis 南京財經(jīng)大學(xué)本科畢業(yè)論文 3 隨著 WWW在深度和廣度上的發(fā)展, Inter也前所未有地改變著我們的生活,數(shù)據(jù)信息已經(jīng)在這個時代爆炸了。主要包括:①訪問時間;② 用戶 IP地址 ;③訪問的 URL,端口 ;④ 請求方法 (“ GET”、“ POST”等 ); ⑤ 訪問模式; ⑥ agent,即用戶使用的操作系
點擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1