freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于cf的個(gè)性化電子商務(wù)推薦系統(tǒng)研究-文庫(kù)吧資料

2025-06-24 14:13本頁(yè)面
  

【正文】 服務(wù)器 毒 吳腑 19 等黼 蘭州大學(xué)碩士學(xué)位論文 基于CF的個(gè)性化電子商務(wù)推薦系統(tǒng)研究 圖3.4信息檢索系統(tǒng)結(jié)構(gòu) 2、信息檢索評(píng)價(jià) 信息檢索技術(shù)的主要缺點(diǎn)在于以下幾個(gè)方面: (1)較難對(duì)商品進(jìn)行分類,客戶需要逐層尋找自己需要的商品,例如在淘 寶網(wǎng)購(gòu)買手機(jī),需要先確定數(shù)碼大類,然后進(jìn)入手機(jī)小類,查找品牌,最后才能 鎖定型號(hào)。 (2)關(guān)鍵字查詢,基本上所有電子商務(wù)網(wǎng)站都具有關(guān)鍵字查詢功能,用來 快速查找和定位到所選商品,關(guān)鍵字查詢應(yīng)該是電子商務(wù)中應(yīng)用最早并且最簡(jiǎn)單 的推薦系統(tǒng)【271。如淘寶網(wǎng), 先將使所有商品分成虛擬、數(shù)碼、美容、服裝、配飾、家居、母嬰、食品、文體、 服務(wù)、保險(xiǎn)十一個(gè)大類,然后在此技術(shù)上再進(jìn)一步細(xì)分。常見的信息檢索系統(tǒng)有網(wǎng)絡(luò)搜索 引擎Google、Baidu、sohu等。本文重點(diǎn)介紹信息檢索技術(shù)、關(guān)聯(lián)規(guī)則和協(xié)同過 濾三種技術(shù)。 5、頁(yè)面布局(Page Layout),根據(jù)客戶的興趣,將客戶感興趣的商品顯示在 電子商務(wù)網(wǎng)站頁(yè)面的顯眼位置。 3、排序列表(Sort List),根據(jù)客戶對(duì)商品特征查詢,返回客戶需求的商品 排序列表。電 子商務(wù)推薦系統(tǒng)的推薦表現(xiàn)形式主要有以下幾種: l、電子郵件(Email),電子商務(wù)管理者可以將電子商務(wù)推薦系統(tǒng)推薦出來的 客戶感興趣的商品信息發(fā)送給客戶。 3.3.2電子商務(wù)推薦系統(tǒng)的數(shù)據(jù)源 電子商務(wù)的推薦系統(tǒng)的數(shù)據(jù)源主要來自客戶數(shù)據(jù)庫(kù)、銷售數(shù)據(jù)庫(kù)、服務(wù)器上 記錄的客戶訪問日志或經(jīng)過數(shù)據(jù)清理、轉(zhuǎn)換的數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)(第二章已有介 紹),具體的數(shù)據(jù)來自以下幾個(gè)方面: 1、客戶的在電子商務(wù)網(wǎng)站的瀏覽行為; 2、客戶注冊(cè)信息; 3、客戶對(duì)某產(chǎn)品的等級(jí)評(píng)價(jià)或評(píng)分?jǐn)?shù)據(jù); 4、客戶輸入的關(guān)鍵詞或商品屬性; 5、客戶購(gòu)買歷史數(shù)據(jù); 6、商品信息; 7、企業(yè)活動(dòng)信息; 8、購(gòu)物籃信息。 3.3電子商務(wù)推薦系統(tǒng)概述 3.3.1電子商務(wù)推薦系統(tǒng)的定義 電子商務(wù)推薦系統(tǒng)(E.commerce recommender systems)是應(yīng)用于電子商務(wù)的 商品推薦軟件系統(tǒng),該系統(tǒng)模擬傳統(tǒng)商務(wù)模式的營(yíng)銷員,作為電子商務(wù)網(wǎng)站的“虛 擬店員”,向客戶提供商品建議和信息【261。 (3)產(chǎn)品的市場(chǎng)定位。 (2)產(chǎn)品生命周期策略。通過孤立點(diǎn)分析,找出與其他客戶群體不同的客 戶,對(duì)該客戶進(jìn)行分析,預(yù)防欺詐行為。分析現(xiàn)有客戶的購(gòu)買行為,通過預(yù)測(cè)模型對(duì)客 戶將來的消費(fèi)行為進(jìn)行預(yù)測(cè),挖掘客戶的潛在購(gòu)買力,提前對(duì)客戶進(jìn)行商品推薦。對(duì)現(xiàn)有客戶進(jìn)行聚類分析,并根據(jù)聚類結(jié)果對(duì)客戶進(jìn)行分類, 根據(jù)不同分類人群的特點(diǎn),采取不同的營(yíng)銷策略,以增加電子商務(wù)面向?qū)ο笸扑] 的針對(duì)性和實(shí)效性。如通過對(duì) 已有數(shù)據(jù)的分析,發(fā)現(xiàn)年齡在35歲左右收入在5000元左右的女性對(duì)某名牌包的 購(gòu)買興趣比較大,當(dāng)發(fā)現(xiàn)具有相同特征的新客戶的時(shí)候,便可以向該客戶推薦該 品牌包。 (2)發(fā)掘潛在客戶。對(duì)電子商務(wù)企業(yè)來說,客戶是企業(yè)發(fā)展的關(guān)鍵和命脈,對(duì) 一個(gè)企業(yè)來說,利潤(rùn)的最大化不僅僅是簡(jiǎn)單的擴(kuò)大市場(chǎng)份額,還存在著如何保留 已有客戶這一嚴(yán)重的問題。數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、信息庫(kù)主要負(fù)責(zé)數(shù)據(jù)的收集、清理和集 成工作;數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器,根據(jù)挖掘主題負(fù)責(zé)提取與主題相關(guān)的數(shù)據(jù); 數(shù)據(jù)挖掘引擎用來進(jìn)行模式挖掘;模式評(píng)估模塊,度量用戶的興趣度,一般該模 塊使用興趣度閾值的方法過濾發(fā)現(xiàn)的模式;知識(shí)庫(kù)為某個(gè)主題領(lǐng)域的知識(shí),用于 指導(dǎo)搜索,指導(dǎo)數(shù)據(jù)挖掘,并為模式評(píng)估提供支持,這些知識(shí)【25】主要包括不同 領(lǐng)域的興趣度限制、閩值和元數(shù)據(jù)、用戶確信的知識(shí)等;圖形用戶界面實(shí)現(xiàn)用戶 和系統(tǒng)的交互,并將挖掘的模式顯式給顧客。 目前,數(shù)據(jù)挖掘技術(shù)已經(jīng)廣泛的應(yīng)用到了分子生物學(xué)、產(chǎn)品質(zhì)量分析、基因工程 研究、信息檢索、訪問模式發(fā)現(xiàn)、金融風(fēng)險(xiǎn)預(yù)測(cè)及分類發(fā)現(xiàn)多個(gè)領(lǐng)域【231。包括機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、模式識(shí)別、數(shù)理統(tǒng)計(jì)、數(shù)據(jù)庫(kù)、粗糙集、模糊數(shù) 學(xué)等相關(guān)技術(shù)【221。 本章的內(nèi)容將為以下幾章的數(shù)據(jù)挖掘內(nèi)容提供數(shù)據(jù)支持和保障。確定每天進(jìn)行一次數(shù)據(jù)更新,所以調(diào)度包的時(shí)間是 一天,可以將作業(yè)的執(zhí)行頻率為一天。 Q L語(yǔ)句選擇更新后的數(shù)據(jù), 2、完成包的創(chuàng)建以后,就可以通過生成項(xiàng)目,對(duì)包進(jìn)行部署,根據(jù)不同的 要求,可以把包部署到不同的位置:SQL Server 統(tǒng)。如銷售事 實(shí)表,有時(shí)則需要覆蓋已前的信息,有時(shí)需要增量裝載,要根據(jù)實(shí)際情況進(jìn)行確 定。 我們需要增量增添裝載相應(yīng)的內(nèi)容。自動(dòng)更新步驟如下: auto 1、建立“電子商務(wù)數(shù)據(jù)倉(cāng)庫(kù)自動(dòng)更新”解決方案E update,在該解決方 案中建立包括三個(gè)任務(wù)的一個(gè)包,用于實(shí)現(xiàn)數(shù)據(jù)立方體、事實(shí)表和維表的更新。我們可以將電子商務(wù)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù) 的更新周期定為一天或者是更短的時(shí)間(需要根據(jù)電子商務(wù)實(shí)際需要進(jìn)行定)。 表2.4維表概況 電子商務(wù)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)裝載階段利用數(shù)據(jù)庫(kù)管理系統(tǒng)提供的后端管理,對(duì) 事實(shí)表和維表進(jìn)行匯總、建立索引、排序、計(jì)算視圖與備份等操作,并將數(shù)據(jù)分 級(jí)處理、增量地更新到數(shù)據(jù)倉(cāng)庫(kù)中。本文設(shè)計(jì)電子商務(wù)數(shù)據(jù)倉(cāng)庫(kù)有七個(gè)維表:如表2.4所示,時(shí)間 維表分為年、月、周、日、小時(shí)、分、秒7各層次,并可以根據(jù)時(shí)間維表進(jìn)行 OLAP的上卷和下鉆操作;地點(diǎn)維表包含國(guó)家、省份、城市三個(gè)概念抽象層次; 商品維表記錄商品的名稱、型號(hào)、類型、顏色、材料等信息;活動(dòng)維表記錄會(huì)話 開始、會(huì)話結(jié)束、登錄、下載、點(diǎn)擊、購(gòu)買等活動(dòng);客戶維表記錄客戶的性別、 年齡等信息;IP地址維表記錄電子商務(wù)網(wǎng)站訪問客戶的IP地址信息;引用維表 記錄客戶引用或訪問URL地址情況。 表2.2銷售事實(shí)表 如表2.3所示,客戶行為事實(shí)表包含6個(gè)維表的關(guān)鍵字,月j戶維表關(guān)鍵字 user_key、時(shí)間維表鍵字time_key、地點(diǎn)表關(guān)鍵字loca_key、活動(dòng)維表關(guān)鍵字beha 蘭州大學(xué)碩士學(xué)位論文 基于CF的個(gè)性化電子商務(wù)推薦系統(tǒng)研究 key、引用維表關(guān)鍵字reco_key和ip地址維表關(guān)鍵字ip_key和以及頁(yè)面瀏覽時(shí)間 visit_time、傳輸字節(jié)數(shù)units_sold和H”rP狀態(tài)碼http_eode 3個(gè)度量,傳輸字節(jié)數(shù) 和HTTP狀態(tài)碼從Web使用日志大小域和狀態(tài)域中提取。本文提出的電子商務(wù)數(shù) 據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型包括銷售事實(shí)表和客戶點(diǎn)擊事實(shí)表兩個(gè)主題事實(shí)表。 (1)事實(shí)表。因?yàn)殡娮由虅?wù)數(shù)據(jù)的復(fù)雜性,我們采用事實(shí)星座模型的多維 數(shù)據(jù)模型,也便于數(shù)據(jù)挖掘和聯(lián)機(jī)分析處理,如圖2.6所示。 2.2.4數(shù)據(jù)集成、數(shù)據(jù)裝載與多維數(shù)據(jù)模型構(gòu)建 電子商務(wù)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)集成階段是基于多維的數(shù)據(jù)模型。如果在客戶的歷史訪 問記錄中,直接鏈接到該頁(yè)面有多個(gè)頁(yè)面,根據(jù)網(wǎng)站的網(wǎng)頁(yè)拓?fù)浣Y(jié)構(gòu),我們從請(qǐng) 求時(shí)間上選定最接近當(dāng)前請(qǐng)求頁(yè)面的頁(yè)面,作為本次請(qǐng)求的參照補(bǔ)充頁(yè)面實(shí)現(xiàn)路 徑補(bǔ)充。具體的補(bǔ)充辦法如下: (1)路徑不完整判斷:客戶被請(qǐng)求的Web頁(yè)面不是直接鏈接到當(dāng)前客戶已 經(jīng)請(qǐng)求的最后一個(gè)Web頁(yè)面上,我們認(rèn)為就出現(xiàn)了路徑不完整的情況,需要對(duì) 客戶訪問路徑進(jìn)行補(bǔ)充。 我們可以結(jié)合站點(diǎn)的拓?fù)浣Y(jié)構(gòu)對(duì)客戶訪問路徑進(jìn)行補(bǔ)充,我們將站點(diǎn)的拓?fù)? 結(jié)構(gòu)用前綴樹進(jìn)行表示,如圖2.5所示。當(dāng)我們利用不完整的訪 10 蘭州人學(xué)碩士學(xué)位論文 基于CF的個(gè)性化電子商務(wù)推薦系統(tǒng)研究 問日志進(jìn)行電子商務(wù)數(shù)據(jù)挖掘時(shí),挖掘出的模式很可能是片面的、不準(zhǔn)確的。 4、路徑補(bǔ)充 當(dāng)客戶向Web服務(wù)器發(fā)出頁(yè)面請(qǐng)求時(shí),由于客戶端頁(yè)面緩存技術(shù)和代理服 務(wù)器的使用,如果被請(qǐng)求的頁(yè)面存在于代理服務(wù)器或者緩存當(dāng)中,電子商務(wù)Web 服務(wù)器就不會(huì)接收到這個(gè)請(qǐng)求信息。會(huì)話可以采用如下形式進(jìn)行表示: Session={uid,timeb,timee“(urll,timel),(url2,time2),……(urln,timen)]}。 會(huì)話識(shí)別。這樣根據(jù)IP地址識(shí)別客戶變得困難。通過客戶的注冊(cè)登記信息進(jìn)行識(shí)別比較容易, 但對(duì)于未注冊(cè)客戶無法進(jìn)行識(shí)別。 表2.1 Web Log表 序號(hào) 字段名 中文名 數(shù)據(jù)類型 備注 9 蘭州大學(xué)碩士學(xué)位論文 基于CF的個(gè)性化電子商務(wù)推薦系統(tǒng)研究 1 2 3 4 5 6 7 itemkey user_key session ko/ ip_address visittime visit_ufl refered 索引 客戶ID 客戶會(huì)話ID 客戶口地址訪問時(shí)間 訪問URL 參考頁(yè)面 Ch缸20) Char(50) Char(50) Char(30) Chat(60) Char(60) 外鍵 外鍵 外鍵 ■●■■●■■■■■■■■■■■■●●■■■■■■■■一 167。以一個(gè)Web日志數(shù)據(jù)為例,Web日志數(shù)據(jù)包括以下幾個(gè) 部分: 2 1 0.26.5 1.39-[07/May/2009:00:oo:oo+0000】ftGET/lzusdh/notice.html HTTP/1.0200”304”http://www.tuanwei.1zu.edu.cn/”Mozilla/4.04” 對(duì)以上WEB同志數(shù)據(jù)進(jìn)行解讀:IP地址為210.26.51.39;訪問時(shí)間為 “07/May/2009:00:00:00+0000”;狀念“GET”;請(qǐng)求網(wǎng)址為“/lzusdh/notice.html”; 協(xié)議為“HTTP/1.0200”; 狀態(tài)為“304”; 參考頁(yè)面為 “http://www.tuanwei.1zu.edu.cn/”;代理“Mozilla/4.04”。 (1)通過狀態(tài)域識(shí)別出的客戶請(qǐng)求失敗的訪問記錄; (2)通過檢查robots.txt文件或檢查代理域,識(shí)別出網(wǎng)絡(luò)爬蟲(Crawler OI" Spid哪和搜索代理(Agent)等對(duì)電子商務(wù)網(wǎng)站進(jìn)行訪問的記錄【20】; (3)識(shí)別出文件后綴名為zip、jPg、jpeg、gif,cgi、jS的訪問記錄。由于客戶對(duì)電子商務(wù)Web服務(wù)器進(jìn)行請(qǐng)求, 需要每個(gè)文件都形成一個(gè)連接,這樣客戶向電子商務(wù)網(wǎng)站請(qǐng)求的一個(gè)頁(yè)面中包含 多個(gè)文件,就需要進(jìn)行多個(gè)連接,同時(shí)也在電子商務(wù)服務(wù)器同志上形成了多條記 錄。在電子商務(wù)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)處理中,客戶數(shù)據(jù)文件、商業(yè)數(shù)據(jù)庫(kù) 的數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)清理工作較簡(jiǎn)單,可以采用分箱、聚類、計(jì)算機(jī)和人工相結(jié)合、 回歸等方法,已有的論述也比較多,本文不再進(jìn)行介紹,本文介紹的重點(diǎn)是Web 使用日志中的數(shù)據(jù)轉(zhuǎn)換與數(shù)據(jù)清洗【20】: 數(shù)據(jù)清洗。 2、數(shù)據(jù)轉(zhuǎn)換與消噪 經(jīng)過數(shù)據(jù)抽取后的數(shù)據(jù)大多是含噪聲的(錯(cuò)誤的或偏離期望的孤立點(diǎn))、不 蘭州大學(xué)碩士學(xué)位論文 基于CF的個(gè)性化電子商務(wù)推薦系統(tǒng)研究 完整的(有些感興趣的屬性缺少屬性值,或僅包含聚集數(shù)據(jù))或不一致的數(shù)據(jù)。客戶數(shù)據(jù) 庫(kù)的信息主要記錄客戶的相關(guān)特征,如客戶名、客戶ID、年齡、性別、職業(yè)、 收入、學(xué)歷、電子郵件、聯(lián)系方式和家庭住址等,這些數(shù)據(jù)可以從客戶登記信息 中或從電子商務(wù)網(wǎng)站的注冊(cè)頁(yè)面中獲得。 2.2.3原始數(shù)據(jù)處理 1、數(shù)據(jù)抽取 電子商務(wù)數(shù)據(jù)抽取是指在電子商務(wù)系統(tǒng)中,提取與電子商務(wù)決策相關(guān)數(shù)據(jù)的 過程。以隱式數(shù)據(jù)為研究對(duì)象的電 子商務(wù)推薦系統(tǒng)能自動(dòng)獲取數(shù)據(jù),一般不需要客戶人為地給出自己的偏好信息。 隱式數(shù)據(jù)指的是客戶以一種隱蔽的方式表達(dá)自己的興趣偏好,通常這種偏好 反映在客戶網(wǎng)上瀏覽或購(gòu)物的過程中所表現(xiàn)出自己的興趣偏好。顯 示數(shù)據(jù)的針對(duì)性較強(qiáng),數(shù)據(jù)的可用性較大。 7 蘭州大學(xué)碩士學(xué)位論文 基于CF的個(gè)性化電子商務(wù)推薦系統(tǒng)研究 2.2.2數(shù)據(jù)源分類 根據(jù)數(shù)據(jù)的來源形式,可以將數(shù)據(jù)源分為顯式數(shù)據(jù)和隱式數(shù)據(jù)。 5、查詢數(shù)據(jù) 查詢數(shù)據(jù)是電了商務(wù)站點(diǎn)在服務(wù)器上產(chǎn)生的數(shù)據(jù)。URL可以是一個(gè)靜態(tài)文件, 也可以是在應(yīng)答時(shí)需要調(diào)用的可執(zhí)行文件的名字,即URL地址。其中 IP,Server,Bytes,Request,Status,Service name,Protocol of version,Time,User agent,Cookie,Refen'er'’客戶訪問電子 商務(wù)網(wǎng)站的信息內(nèi)容。其中服務(wù)器上存儲(chǔ)的cookie部分是 cookie logs,Cookie level”。 logs: error logs為請(qǐng)求失敗的數(shù)據(jù),包括超時(shí),授權(quán)失敗,丟失連接等。 4、電子商務(wù)網(wǎng)站服務(wù)器上存儲(chǔ)的客戶瀏覽日志。 2、存儲(chǔ)在傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)里的有關(guān)電子商務(wù)的商品信息、商務(wù)站點(diǎn)信息、 客戶交易數(shù)據(jù)、購(gòu)物籃數(shù)據(jù)、客戶對(duì)商品的評(píng)分?jǐn)?shù)據(jù)等。2電子商務(wù)數(shù)據(jù)挖掘的數(shù)據(jù)源 2.2.1數(shù)據(jù)來源 電子商務(wù)的數(shù)據(jù)源主要存儲(chǔ)在客戶數(shù)據(jù)庫(kù)、商業(yè)數(shù)據(jù)庫(kù)以及Web使用日志中, 這些數(shù)據(jù)源主要包括以下幾種㈣: 1、客戶注冊(cè)信息,如客戶的姓名、年齡、性別、所在地、職業(yè)、收入狀況 等信息。 數(shù)據(jù)倉(cāng)庫(kù)在電子商務(wù)數(shù)據(jù)挖掘中起到承上啟下的作用。 蘭州大學(xué)碩士學(xué)位論文 基于CF的個(gè)性化電子商務(wù)推薦系統(tǒng)研究 第二章數(shù)據(jù)倉(cāng)庫(kù)技術(shù) 2.1基于電子商務(wù)的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)模型 圖2.4基于電子商務(wù)的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)模型 如圖2.4,基于電子商務(wù)的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)主要包括數(shù)據(jù)處理、數(shù)據(jù)集成與裝 載、提供分析處理服務(wù)三個(gè)部分。 第四章基于協(xié)同過濾算法提出個(gè)性化的電子商務(wù)推薦系統(tǒng),針對(duì)不同的客戶 采取不同的推薦算法,并提出面向客戶的
點(diǎn)擊復(fù)制文檔內(nèi)容
規(guī)章制度相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1