freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

計算機科學與技術專業(yè)畢業(yè)設計-web數(shù)據(jù)挖掘技術在電子商務中的應用(存儲版)

2025-07-17 05:28上一頁面

下一頁面
  

【正文】 .................................................... 6 法在 web 數(shù)據(jù)挖掘中的應用 ..................................................................................................................6 客戶群體聚類 ............................................................................................................ 6 web頁面聚類 ............................................................................................................ 8 路徑分析法在 web數(shù)據(jù)挖掘 中的應用 ............................................................................................................8 ....................................................................................... 9 web站點鏈接設置 .............................................................................. 10 第四章 結束語 ................................................................................................................................ 10 致謝 .................................................................................................................................................11 參考文獻 ..........................................................................................................................................11 1 引言 數(shù)據(jù)收集和數(shù)據(jù)存儲技術的快速發(fā)展使得各組織機構可以積累海量數(shù)據(jù),但是提取有用的信息卻成為巨大的挑戰(zhàn)。聚類算法利于客戶群體的聚類,發(fā)掘潛在的客戶;路徑分析法關注客戶行為路徑,發(fā)現(xiàn)客戶興趣與期望,并對網(wǎng)頁的鏈接進行優(yōu)化設置。一般網(wǎng)站進行 web數(shù)據(jù)挖掘,改進客戶對網(wǎng)站的體驗和與網(wǎng)站的交互,數(shù)據(jù)挖掘至少有助于完成3個任務:網(wǎng)站的設計是否符合用戶期望,有沒有 為用戶提供個性化服務,用戶需求有沒有得到更好地滿足。將數(shù)據(jù)庫中的“數(shù)據(jù)”形象地比作礦床,“數(shù)據(jù)挖掘”由此而來。界面內容包括:文本,圖像,音頻,多媒體,視頻和其他類型的數(shù)據(jù)。不同的 web站點和 web訪問日志可以幫助挖掘過程中研究的用戶的行為和 web的結構。客戶訪問某個網(wǎng)站一般都是通過探索興趣詞條來找到相關興趣網(wǎng)頁并通過連接訪問。在 web站點的合理布局時,圖標常用來表現(xiàn) web 站點頁面 瀏覽路徑,圖的節(jié)點表示 web 界面,有向邊表示頁面的超鏈接,各種圖都是建立在頁面與頁面間聯(lián)系或者是一定數(shù)量的用戶瀏覽界面順序的基礎上。目前用于 web 日志挖掘的聚類算法很多,用戶對 web 站點的訪問有某種有序的關系,這種有序關系反映的是用戶的訪問興趣,也就是說先訪問的節(jié)點具有高興趣度。主要記錄的就是什么人在什么時候瀏覽了什么內容,網(wǎng)站的流量和訪問者的信息等。 數(shù)據(jù)預處理 數(shù)據(jù)預處理是 web 挖掘的重要步驟,直接影響到最后分析的數(shù)據(jù)的準確 性和正確性,主要是對日 志文件進行清洗、過濾、轉換及剔除無關記錄。使用的方法是通過檢查日志記錄中的代理域,采用字符串匹配方法剔除。但 是在 web 日志中的訪問事務不是一個顯然的結果,需要采用專門算法來生成,常用的方法是:時間窗口和最大向前路徑算法。使用這個圖形用戶界面對于用戶管理和理解大量的模式提供極大的便利。 增加網(wǎng)頁鏈接促進網(wǎng)站優(yōu)化 通過挖掘用戶的 Web 日志文件,對 Web 站點的鏈接結構的優(yōu)化可以從兩方面來考慮:一是發(fā)現(xiàn)用戶訪問頁面的相關性,對密切相關的網(wǎng)頁之間增加鏈接。 聚類算法在 web 數(shù)據(jù)挖掘中的應用 聚類算法就是將一個 web 站點的分析的有向圖轉變成矩陣后對矩陣的行向量和列向量進行化簡、計算 hamming 距離并進行分類的過程。 客戶群體聚類 如上所述,由矩陣 MM*N 看出,每一列向量表示某客戶對該站點中所有 URL 的 訪問情況。 聚類分 析是電子商務中很重要的一個方面,通過分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,更好的幫助電子商務用戶了解自己的客戶,向客戶提供更合適的服務。 閾值計算也可按公式( 32)來計算,也可按照具體情況自己指定閾值大小。 根據(jù)用戶重復瀏覽路徑可以 導出 用戶興趣視圖, 然后 依據(jù)用戶興趣視圖完成 其 個性化 的 推薦,為用戶提供定制的訪問體驗。頁面 的抽象是圖中的頂點,而且頁面 間的超鏈接 是 抽象為圖中的有向邊。 續(xù)實例( 1)中聚類分 析后,進一步分析客戶訪問模式得: 由于 URL 類 {URL1, URL3}, {URL3, URL6}在一條路徑上,且路徑頻度分別為 %和 %,假設超過了指定的閾值,可以將他們合并起來構成路徑 Pi ={URL1, URL3, URL6}。那么認為路徑 ? ?nddd ..., 21 中用戶需要訪問的是 dn,可以增加鏈接 d1 到 dn的鏈接。 11 致謝 感謝有這次論文寫作的機會 。 經(jīng)過這幾個月的探索分析,我認識了數(shù)據(jù)挖掘這門技術的強大力量,這段時間 我通過圖書館的書籍資料以及互聯(lián)網(wǎng)上的一些相關資源信息的收集、篩選,并且與導師的積極探討,獲得了很多的收獲,也提高了我學習、分析問題、解決問題的方法。站點的主頁一般都是熱門頁面,但是,如果有頁面是多個熱門路徑的交點,那么這 個界面也就很重要。例 如,設某個 web 站點中的日志文件包含某客戶的一次訪問路徑(如圖 31); {A, B, C, D, C, B, A, E, F,G, F, H},實線箭頭表示向前瀏覽方向,虛線箭頭表示瀏覽 的 后退 方向, 而 訪問次序 是由有向邊 的數(shù)字表示,則圖五中 就存在 三條最大向前訪問路徑 【 4】 : 圖 31 1) (A→ B)( B→ C)( C→ D) A B C D E F G H 10 2)( A→ E)( E→ F)( F→ G) 3)( A→ E)( E→ F)( F→ H) 設 TP 為一最大向前訪問路徑, P 的公式 ( 33) 如下所示: niTPkP nit ii,...2,1, ??? ?? 公式( 33) 其中 TPi 為某站點 上 第 I 條最大向前訪問路徑, KI 為 TPi 的訪問次數(shù)。用路徑分析技術進行 web 數(shù)據(jù)挖掘最常用到的是圖。 網(wǎng)站的頻繁瀏覽路徑 就是 某個用戶在相應一段時間內的活動規(guī)律 ,是站點 要進行 路徑優(yōu)化的依據(jù),主要包括: 1) 一個 個體用戶 在 瀏覽 行為中多次重復瀏覽的一個路徑 。如果客戶對某些頁面的訪問情況相同或者相似那么這些界面應該是相關界面,可以聚類。 客戶群體聚類時,先對 URLUID 關聯(lián)矩陣進行預處理,化簡數(shù)據(jù),然后按 Hamming 距離的公式計算 hamming 距離,公式如下: C11 C12… C1j… C1n C21 C22… C2j… C2n … … … … Ci1 Ci2… Cij… Cin MM*N= UID URL 7 iXi idYXYXH ?? ??1),( ( X,Y∈ {0,1}n n≧ 1) 公式( 31) 接 下 去 建 立 列 向 量 間 的 距 離 矩 陣 dHnnM? , 在 這 個 對 稱 矩 陣 中 , 對 于 任 意 的?jid, dHnnM? ? ?njini ???? ,1 表示第 i 個列向量和第 j 個列向量間的 hamming 距離,對角元素為 0。所以,我們可以這么認為,行向量不僅代表了站點的結構,還蘊涵客戶的共同訪問模式,列向量則反應了客戶類型和客戶的個性化訪問子圖。總之, Web 設計者是根據(jù)訪問者的信息來設計和修改網(wǎng)站結構和外觀,而不再完全依靠專家的定性指導來設計網(wǎng)站,站點上頁面內容的安排和鏈接就如超級市場中物品擺放一樣,把具有一定支持度和信任度的相關聯(lián)的物品擺 放在一起有助于銷售。 客戶關系管理中延長客戶駐留時間 在電子商務中,傳統(tǒng)的買方客戶與賣方銷售商之間的空間距離已經(jīng)不存在,在 Inter 上,每個賣方銷售商對于買方客戶來說都一樣。若分析者要求的是所有最小支持度是 20%且最小可信度是 80%,發(fā)送與 2021 年 8 月 8 號以后的規(guī)則并且域名來自于“ .”的用戶感興趣,基于這個條件,查詢語 句就可以表示為: SELECT association_rules(M*A*B) FR
點擊復制文檔內容
畢業(yè)設計相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1