freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計(jì)(論文)-基于關(guān)聯(lián)分析的web日志挖掘-wenkub.com

2025-06-01 01:53 本頁(yè)面
   

【正文】 五 、結(jié)束語(yǔ) 本文 先研究了 web日志挖掘當(dāng)前研究成果,介紹了 web日志挖掘的基本流程,然后著重介紹了如何利用 Apririo關(guān)聯(lián)規(guī)則算法來(lái)挖掘出用戶頻繁訪問(wèn)模式,找出瀏覽頁(yè)面之間的關(guān)聯(lián)規(guī)則,為個(gè)性化推薦系統(tǒng)模型提供了依據(jù)。 ( 3)結(jié)果部分 見(jiàn)表 1:關(guān)聯(lián)度計(jì)算結(jié)果表 (三 )模式分析 當(dāng)我們把最小置信度設(shè)為 85%,通過(guò)關(guān)聯(lián)規(guī)則的形成以及對(duì)應(yīng)置信度的計(jì)算,我們可以從中得到以下有用的信息: :我們可以這樣認(rèn)為,用戶群體在瀏覽 相關(guān)網(wǎng)頁(yè)時(shí),所呈列的鏈接之間是有很大關(guān)聯(lián)的,他們是用戶群的共同愛(ài)好,通過(guò)網(wǎng)頁(yè)布局的調(diào)整,從某種意義上,可以帶來(lái)更高的點(diǎn)擊率及潛在客戶; :我們可以這樣認(rèn)為,用戶群體對(duì)所呈列鏈接之間沒(méi)太多的關(guān)聯(lián),亦或關(guān)聯(lián)規(guī)則中的鏈接在爭(zhēng)奪用戶。 /newimg/,853。 南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文 11 /newimg/。 (二) 模式發(fā)現(xiàn) 對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單處理,得出以下描述性統(tǒng)計(jì): 總用戶數(shù): 1469 總鏈接數(shù): 146 TOP10訪問(wèn)頁(yè)面 : /new/clubmain/newimg/, 1066。 Lk !=?。記為 )(s u p/)(s u p)( Xp o r tYXp o r tYXc o n fid e n c e ??? 規(guī)則 A ? C: 支持度 = support({A}?{C}) = 50% 置信度 = support({A}?{C})/support({A}) = % 圖 1:支持度計(jì)算圖解 Transactionid Items bought 10 A, B, C 20 A, C 30 A,D 40 B,E,F Frequent pattern Support {A} 75% {B} 50% {C} 50% {A,C} 50% 南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文 8 (二) Apriori方法簡(jiǎn)介 Apriori算法最先是由 Agrawal等人于 1993年提出的,它的基本思想是: 首先找出所有具有超出最小支持度的支持度項(xiàng)集,用頻繁的 (k— 1)項(xiàng)集生成候選的頻繁 k項(xiàng)集;其次利用大項(xiàng)集產(chǎn)生所需的規(guī)則; 任何頻繁項(xiàng)集的所有子集一定是頻繁項(xiàng)集是 其核心。 一般使用支 持度( support)和置信度( confidence)兩個(gè)參數(shù)來(lái)描述關(guān)聯(lián)規(guī)則的屬性。項(xiàng)目集 X 的支持率 support(X) ,南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文 7 若 support(X) 不小于用戶指定的最小支持率 (記作: minsupport),則稱(chēng) X 為頻繁項(xiàng)目集,否則稱(chēng) X 為非頻繁項(xiàng)目集。對(duì)應(yīng)每一個(gè)交易有唯一的標(biāo)識(shí),如交易號(hào),記作 TID 。其主要方法有:查詢(xún)、 OLAP 技術(shù)和可視化技術(shù) 等 。目前采用的主要關(guān)聯(lián)規(guī)則挖掘算法有 Apriori、 FPgrowth算法等。在聚類(lèi)技術(shù)中,沒(méi)有預(yù)先定義好的類(lèi)別和訓(xùn)練樣本存在 ,所有記錄都根據(jù)彼此相似程度來(lái)加以歸類(lèi)。該類(lèi)技術(shù)是最廣泛應(yīng)用于各類(lèi)業(yè)務(wù)問(wèn)題的一類(lèi)挖掘技術(shù)。統(tǒng)計(jì)方法是從 Web 站點(diǎn)中抽取知識(shí)的最常用方法 , 它通過(guò)分析會(huì)話文件 , 對(duì)瀏覽時(shí)間、瀏覽路徑等進(jìn)行頻度、平均值等統(tǒng)計(jì)分析。用戶對(duì)網(wǎng)頁(yè)的訪問(wèn)時(shí)間為用戶前后兩次訪問(wèn)該網(wǎng)頁(yè)的時(shí)間差,通過(guò)調(diào)用 SQL語(yǔ)句可以查找到用戶訪問(wèn)網(wǎng)頁(yè)的時(shí)間,進(jìn)而區(qū)分出導(dǎo)航頁(yè)和內(nèi)容頁(yè)。設(shè)一個(gè)用戶會(huì)話里不會(huì)出現(xiàn)用戶以前已經(jīng)訪問(wèn)過(guò)的頁(yè)面 , 如果用戶在向前瀏覽到一個(gè)網(wǎng) 4. 路徑補(bǔ)充 用戶會(huì)話對(duì)數(shù)據(jù)挖掘來(lái)講,顯得粗糙,仍不夠精確,需把會(huì)話進(jìn)一步分成具有一定語(yǔ)意的事務(wù),如同籃子數(shù)據(jù)中顧客一次購(gòu)買(mǎi)的商品?!?t 一般取 10min。一般 T取 30min。在跨越時(shí)間區(qū)段較大的 Web 服務(wù)器日志中 , 用戶可能多次訪問(wèn)該站點(diǎn)。 ( 2) 如果 Web 服務(wù)器沒(méi)有提供 Cookie , 但每個(gè)網(wǎng)站用戶都要一個(gè)登錄標(biāo)識(shí)符 ( 用戶 ID) 方可訪問(wèn)站點(diǎn) , 則利用登錄標(biāo)識(shí)符識(shí)別用戶 。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)凈化、用戶識(shí)別、會(huì)話識(shí)別、路徑補(bǔ)充四南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文 4 個(gè)步驟。 一、 Web 日志挖掘 Web日志挖掘主要是通過(guò)對(duì) web瀏覽的日志數(shù)據(jù)的分析,發(fā)現(xiàn)用戶的瀏覽模式 ,更好地規(guī)劃站點(diǎn) 。隨著興起與 20世紀(jì) 80年代末的數(shù)據(jù)挖掘在 web上的應(yīng)用,從某種程度上改善了上述情況。It also finds the browsing interest of a single user and groups users’ browsing habits, all after then ,we put forward some individual suggestions on web planning. Keywords: Web log mining。關(guān)聯(lián)分析 。南京財(cái)經(jīng)大學(xué)本科畢業(yè)論文 1 目 錄 摘要 ................................................................ 1 關(guān)鍵詞 .............................................................. 1 Abstract ........................................................... 1 Keywords .....................................
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1