freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)畢業(yè)設(shè)計(jì)-web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用(編輯修改稿)

2025-02-13 03:13 本頁面
 

【文章內(nèi)容簡介】 但是只能夠獲取有限的信息如:IP地址,代理和URL。在識別客戶的基礎(chǔ)上就可以進(jìn)一步識別用戶的訪問事務(wù)。但是在web日志中的訪問事務(wù)不是一個顯然的結(jié)果,需要采用專門算法來生成,常用的方法是:時間窗口和最大向前路徑算法。模式算法實(shí)施經(jīng)過預(yù)處理后,可根據(jù)不同需求選擇模式發(fā)現(xiàn)技術(shù),有統(tǒng)計(jì)分析技術(shù),路徑分析技術(shù),基于web日志挖掘的關(guān)聯(lián)挖掘,聚類,時序模式等。例如:統(tǒng)計(jì)分析通過分析網(wǎng)頁視圖,瀏覽時間和導(dǎo)航路徑長度,有助于改進(jìn)系統(tǒng)性能,增加系統(tǒng)安全性,便于站點(diǎn)修改并提供決策支持;路徑分析技術(shù)用于發(fā)現(xiàn)web站點(diǎn)中最經(jīng)常被訪問的路徑,從而調(diào)整站點(diǎn)結(jié)構(gòu);通過訪問模式能挖掘關(guān)于用戶行為及潛在顧客信息的發(fā)現(xiàn)。模式分析模式分析是針對模式發(fā)現(xiàn)后的統(tǒng)計(jì)結(jié)果進(jìn)行挖掘,發(fā)現(xiàn)有用的模式,過濾掉不感興趣的或者無關(guān)聯(lián)的數(shù)據(jù)及模式,具體分析方法要依據(jù)模式分析的挖掘技術(shù)而定。發(fā)現(xiàn)的知識一般也能以被用戶理解,所以為了能讓用戶理解他們需求的知識,一般采取三個方法:查詢,OLAP技術(shù),可視化技術(shù)。例如查詢應(yīng)用:分析者感興趣的是:從一個URLM出發(fā)并保含A,B,這個模式可以表達(dá)成M*A*B。若分析者要求的是所有最小支持度是20%且最小可信度是80%,發(fā)送與2008年8月8號以后的規(guī)則并且域名來自于“.”的用戶感興趣,基于這個條件,查詢語句就可以表示為:SELECT association_rules(M*A*B) FROM logdata WHEREDate=20080808 AND domain=. AND support=20AND confidence=80通過這個查詢得到消息可以用來限制挖掘活動的范圍,減少挖掘過程的代價??梢暬梢暬夹g(shù)指的是幫助用戶挖掘和理解大量的復(fù)雜數(shù)據(jù)采用的是圖形用戶界面。使用這個圖形用戶界面對于用戶管理和理解大量的模式提供極大的便利。可視化有:挖掘過程可視化,挖掘結(jié)果可視化;知識管理可視化這三類。第三章 web數(shù)據(jù)挖掘在電子商務(wù)中的具體應(yīng)用 web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用 客戶關(guān)系管理中發(fā)掘潛在客戶通過分析和探究web日志記錄中的規(guī)律,可以對已經(jīng)存在的訪問者進(jìn)行分類,確定分類的關(guān)鍵屬性及相互間的關(guān)系。對于一個新的訪問者,通過在web上的分類規(guī)則發(fā)現(xiàn),識別出這個客戶與已經(jīng)分類的老客戶的一些公共描述,從而對新客戶進(jìn)行分類。從它的分類中判斷是否需要把這個新客戶作為潛在客戶展示一些特殊的,個性化的頁面內(nèi)容,提高對用戶服務(wù)的質(zhì)量。在電子商務(wù)的數(shù)據(jù)挖掘中,發(fā)現(xiàn)潛在客戶的一種有效的挖掘方法是聚類分析方法。 客戶關(guān)系管理中延長客戶駐留時間在電子商務(wù)中,傳統(tǒng)的買方客戶與賣方銷售商之間的空間距離已經(jīng)不存在,在Internet上,每個賣方銷售商對于買方客戶來說都一樣。為了使買方客戶在網(wǎng)站上能夠長時間駐留,我們就要清楚買方的瀏覽行為,分析客戶的興趣和需求所在,以方便我們及時地向客戶做各種頁面推薦,調(diào)整web頁面,提供本站點(diǎn)特有的某些商品信息或者廣告,達(dá)到客戶滿意,從而延長客戶駐留在自己網(wǎng)頁的時間。 增加網(wǎng)頁鏈接促進(jìn)網(wǎng)站優(yōu)化通過挖掘用戶的Web日志文件,對Web站點(diǎn)的鏈接結(jié)構(gòu)的優(yōu)化可以從兩方面來考慮:一是發(fā)現(xiàn)用戶訪問頁面的相關(guān)性,對密切相關(guān)的網(wǎng)頁之間增加鏈接。二是發(fā)現(xiàn)用戶的期望位置。通過對日志文件的挖掘,可以讓網(wǎng)站設(shè)計(jì)者或者后期維護(hù)者知道哪些界面是訪問者經(jīng)常連續(xù)點(diǎn)擊訪問的頁面,就可以調(diào)整這些相關(guān)的頁面鏈接,可以將這些鏈接放在明顯的部分,并改變鏈接深度,使得用戶易于訪問,用戶就不需要在一大堆不感興趣的鏈接之間尋找自己想要的鏈接,從而避免降低用戶對網(wǎng)站的興趣。 發(fā)現(xiàn)用戶期望現(xiàn)用戶的期望位置也就是如果在期望位置的訪問頻率高于實(shí)際位置的訪問頻率,可以考慮在期望位置和實(shí)際位置之間建立導(dǎo)航鏈接。網(wǎng)站網(wǎng)頁的內(nèi)容設(shè)置會直接影響客戶訪問網(wǎng)站的效率。并且,網(wǎng)站的瀏覽者所關(guān)注的內(nèi)容是會隨時變化的,利用日志文件進(jìn)行用戶訪問頁面的信息挖掘,發(fā)掘訪問者進(jìn)行的瀏覽模式,能為網(wǎng)頁內(nèi)容設(shè)置的改良提供實(shí)用的建議??傊?,Web設(shè)計(jì)者是根據(jù)訪問者的信息來設(shè)計(jì)和修改網(wǎng)站結(jié)構(gòu)和外觀,而不再完全依靠專家的定性指導(dǎo)來設(shè)計(jì)網(wǎng)站,站點(diǎn)上頁面內(nèi)容的安排和鏈接就如超級市場中物品擺放一樣,把具有一定支持度和信任度的相關(guān)聯(lián)的物品擺放在一起有助于銷售。網(wǎng)站管理員按照大多數(shù)訪問者的瀏覽模式對網(wǎng)站進(jìn)行組織,盡量為大多數(shù)訪問者的瀏覽提供方便,給客戶留下好的印象,增加下次訪問的機(jī)率。聚類算法就是將一個web站點(diǎn)的分析的有向圖轉(zhuǎn)變成矩陣后對矩陣的行向量和列向量進(jìn)行化簡、計(jì)算hamming距離并進(jìn)行分類的過程。聚類算法分為對客戶群體的聚類和web頁面的聚類。一個web站點(diǎn)的拓?fù)浣Y(jié)構(gòu)是一副有向圖,每個客戶在一段時間內(nèi)的訪問模式就是它的子圖,具有相似訪問子圖的客戶很可能就是需求相似的客戶,將這些需求相似的客戶歸類,這就是客戶聚類。一個web站點(diǎn)可以用如下的有向圖來表示:G=(N,NP,E,EP)其中,N為結(jié)點(diǎn)集;NP 記錄客戶UID及其訪問的結(jié)點(diǎn)Node的次數(shù),為結(jié)點(diǎn)屬性集;E為有向邊集;EP記錄有向邊及該有向邊所在路徑的編號,為有向邊屬性集【4】。在有向圖G的所有結(jié)點(diǎn)集N中一般可以得到站點(diǎn)所有的URL,從結(jié)點(diǎn)屬性集NP也能得到訪問每個結(jié)點(diǎn)的UID和對應(yīng)訪問的次數(shù),這樣就可以得到一個URLUID的關(guān)聯(lián)矩陣Mm*n ,如下:C11 C12…C1j…C1nC21 C22…C2j…C2n… … … …Ci1 Ci2…Cij…CinMM*N=UIDURL其中,Ci,j 是j客戶在某段期間訪問第i個URL的次數(shù);由矩陣MM*N 看出,每一列向量表示某客戶對該站點(diǎn)中所有URL的訪問情況。每一行向量表示所有客戶對某個URL的訪問情況。所以,我們可以這么認(rèn)為,行向量不僅代表了站點(diǎn)的結(jié)構(gòu),還蘊(yùn)涵客戶的共同訪問模式,列向量則反應(yīng)了客戶類型和客戶的個性化訪問子圖。分別度量行向量和列向量的相似性就可以得到相關(guān)web界面和相似客戶群體,進(jìn)一步分析還能獲得客戶訪問模式,也就是頻繁訪問路徑【4】。 客戶群體聚類如上所述,由矩陣MM*N 看出,每一列向量表示某客戶對該站點(diǎn)中所有URL的訪問情況。因?yàn)樗强蛻粼L問本站點(diǎn)的個性化子圖,故具有相似的訪問子圖的客戶即為相似客戶群體。根據(jù)客戶登記數(shù)據(jù)庫查詢是否交易,若客戶僅做了瀏覽而并未與商家成交,即列向量的值是未成交次數(shù),那么此相似客戶群為潛在客戶群;否則,為交易客戶群。對矩陣MM*N 列向量的聚類是考慮他們的相似性度量,可以通過Hamming距離進(jìn)行。即對于M[i,j]0,令M[i,j]=,距離越小,其相似度越高。根據(jù)hamming距離的實(shí)際情況設(shè)定閾值,然后對客戶進(jìn)行聚類【4】。客戶群體聚類時,先對URLUID關(guān)聯(lián)矩陣進(jìn)行預(yù)處理,化簡數(shù)據(jù),然后按Hamming距離的公式計(jì)算hamming距離,公式如下: (X,Y∈{0,1}n n≧1) 公式(31)接下去建立列向量間的距離矩陣,在這個對稱矩陣中,對于任意的表示第i個列向量和第j個列向量間的hamming距離,對角元素為0。閾值計(jì)算也可按公式(32)來計(jì)算,但是一般情況下也可以按具體情況自己指定閾值大?。? 公式(32)對于任意的如果,那么將第i個客戶和所有滿足這個條件的第j個客戶劃分為一個類。聚類分析是電子商務(wù)中很重要的一個方面,通過分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,更好的幫助電子商務(wù)用戶了解自己的客戶,向客戶提供更合適的服務(wù)。實(shí)例(1)分析:如圖一所示,假設(shè)某個網(wǎng)站一個上午站點(diǎn)中有六個URL,在一段時間內(nèi)共有7個客戶訪問了該站點(diǎn)。根據(jù)Web服務(wù)器的日志文件和客戶
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1