freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)畢業(yè)設(shè)計(jì)-web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用(編輯修改稿)

2025-02-13 03:13 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 但是只能夠獲取有限的信息如:IP地址,代理和URL。在識(shí)別客戶的基礎(chǔ)上就可以進(jìn)一步識(shí)別用戶的訪問(wèn)事務(wù)。但是在web日志中的訪問(wèn)事務(wù)不是一個(gè)顯然的結(jié)果,需要采用專門算法來(lái)生成,常用的方法是:時(shí)間窗口和最大向前路徑算法。模式算法實(shí)施經(jīng)過(guò)預(yù)處理后,可根據(jù)不同需求選擇模式發(fā)現(xiàn)技術(shù),有統(tǒng)計(jì)分析技術(shù),路徑分析技術(shù),基于web日志挖掘的關(guān)聯(lián)挖掘,聚類,時(shí)序模式等。例如:統(tǒng)計(jì)分析通過(guò)分析網(wǎng)頁(yè)視圖,瀏覽時(shí)間和導(dǎo)航路徑長(zhǎng)度,有助于改進(jìn)系統(tǒng)性能,增加系統(tǒng)安全性,便于站點(diǎn)修改并提供決策支持;路徑分析技術(shù)用于發(fā)現(xiàn)web站點(diǎn)中最經(jīng)常被訪問(wèn)的路徑,從而調(diào)整站點(diǎn)結(jié)構(gòu);通過(guò)訪問(wèn)模式能挖掘關(guān)于用戶行為及潛在顧客信息的發(fā)現(xiàn)。模式分析模式分析是針對(duì)模式發(fā)現(xiàn)后的統(tǒng)計(jì)結(jié)果進(jìn)行挖掘,發(fā)現(xiàn)有用的模式,過(guò)濾掉不感興趣的或者無(wú)關(guān)聯(lián)的數(shù)據(jù)及模式,具體分析方法要依據(jù)模式分析的挖掘技術(shù)而定。發(fā)現(xiàn)的知識(shí)一般也能以被用戶理解,所以為了能讓用戶理解他們需求的知識(shí),一般采取三個(gè)方法:查詢,OLAP技術(shù),可視化技術(shù)。例如查詢應(yīng)用:分析者感興趣的是:從一個(gè)URLM出發(fā)并保含A,B,這個(gè)模式可以表達(dá)成M*A*B。若分析者要求的是所有最小支持度是20%且最小可信度是80%,發(fā)送與2008年8月8號(hào)以后的規(guī)則并且域名來(lái)自于“.”的用戶感興趣,基于這個(gè)條件,查詢語(yǔ)句就可以表示為:SELECT association_rules(M*A*B) FROM logdata WHEREDate=20080808 AND domain=. AND support=20AND confidence=80通過(guò)這個(gè)查詢得到消息可以用來(lái)限制挖掘活動(dòng)的范圍,減少挖掘過(guò)程的代價(jià)??梢暬梢暬夹g(shù)指的是幫助用戶挖掘和理解大量的復(fù)雜數(shù)據(jù)采用的是圖形用戶界面。使用這個(gè)圖形用戶界面對(duì)于用戶管理和理解大量的模式提供極大的便利??梢暬校和诰蜻^(guò)程可視化,挖掘結(jié)果可視化;知識(shí)管理可視化這三類。第三章 web數(shù)據(jù)挖掘在電子商務(wù)中的具體應(yīng)用 web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用 客戶關(guān)系管理中發(fā)掘潛在客戶通過(guò)分析和探究web日志記錄中的規(guī)律,可以對(duì)已經(jīng)存在的訪問(wèn)者進(jìn)行分類,確定分類的關(guān)鍵屬性及相互間的關(guān)系。對(duì)于一個(gè)新的訪問(wèn)者,通過(guò)在web上的分類規(guī)則發(fā)現(xiàn),識(shí)別出這個(gè)客戶與已經(jīng)分類的老客戶的一些公共描述,從而對(duì)新客戶進(jìn)行分類。從它的分類中判斷是否需要把這個(gè)新客戶作為潛在客戶展示一些特殊的,個(gè)性化的頁(yè)面內(nèi)容,提高對(duì)用戶服務(wù)的質(zhì)量。在電子商務(wù)的數(shù)據(jù)挖掘中,發(fā)現(xiàn)潛在客戶的一種有效的挖掘方法是聚類分析方法。 客戶關(guān)系管理中延長(zhǎng)客戶駐留時(shí)間在電子商務(wù)中,傳統(tǒng)的買方客戶與賣方銷售商之間的空間距離已經(jīng)不存在,在Internet上,每個(gè)賣方銷售商對(duì)于買方客戶來(lái)說(shuō)都一樣。為了使買方客戶在網(wǎng)站上能夠長(zhǎng)時(shí)間駐留,我們就要清楚買方的瀏覽行為,分析客戶的興趣和需求所在,以方便我們及時(shí)地向客戶做各種頁(yè)面推薦,調(diào)整web頁(yè)面,提供本站點(diǎn)特有的某些商品信息或者廣告,達(dá)到客戶滿意,從而延長(zhǎng)客戶駐留在自己網(wǎng)頁(yè)的時(shí)間。 增加網(wǎng)頁(yè)鏈接促進(jìn)網(wǎng)站優(yōu)化通過(guò)挖掘用戶的Web日志文件,對(duì)Web站點(diǎn)的鏈接結(jié)構(gòu)的優(yōu)化可以從兩方面來(lái)考慮:一是發(fā)現(xiàn)用戶訪問(wèn)頁(yè)面的相關(guān)性,對(duì)密切相關(guān)的網(wǎng)頁(yè)之間增加鏈接。二是發(fā)現(xiàn)用戶的期望位置。通過(guò)對(duì)日志文件的挖掘,可以讓網(wǎng)站設(shè)計(jì)者或者后期維護(hù)者知道哪些界面是訪問(wèn)者經(jīng)常連續(xù)點(diǎn)擊訪問(wèn)的頁(yè)面,就可以調(diào)整這些相關(guān)的頁(yè)面鏈接,可以將這些鏈接放在明顯的部分,并改變鏈接深度,使得用戶易于訪問(wèn),用戶就不需要在一大堆不感興趣的鏈接之間尋找自己想要的鏈接,從而避免降低用戶對(duì)網(wǎng)站的興趣。 發(fā)現(xiàn)用戶期望現(xiàn)用戶的期望位置也就是如果在期望位置的訪問(wèn)頻率高于實(shí)際位置的訪問(wèn)頻率,可以考慮在期望位置和實(shí)際位置之間建立導(dǎo)航鏈接。網(wǎng)站網(wǎng)頁(yè)的內(nèi)容設(shè)置會(huì)直接影響客戶訪問(wèn)網(wǎng)站的效率。并且,網(wǎng)站的瀏覽者所關(guān)注的內(nèi)容是會(huì)隨時(shí)變化的,利用日志文件進(jìn)行用戶訪問(wèn)頁(yè)面的信息挖掘,發(fā)掘訪問(wèn)者進(jìn)行的瀏覽模式,能為網(wǎng)頁(yè)內(nèi)容設(shè)置的改良提供實(shí)用的建議??傊?,Web設(shè)計(jì)者是根據(jù)訪問(wèn)者的信息來(lái)設(shè)計(jì)和修改網(wǎng)站結(jié)構(gòu)和外觀,而不再完全依靠專家的定性指導(dǎo)來(lái)設(shè)計(jì)網(wǎng)站,站點(diǎn)上頁(yè)面內(nèi)容的安排和鏈接就如超級(jí)市場(chǎng)中物品擺放一樣,把具有一定支持度和信任度的相關(guān)聯(lián)的物品擺放在一起有助于銷售。網(wǎng)站管理員按照大多數(shù)訪問(wèn)者的瀏覽模式對(duì)網(wǎng)站進(jìn)行組織,盡量為大多數(shù)訪問(wèn)者的瀏覽提供方便,給客戶留下好的印象,增加下次訪問(wèn)的機(jī)率。聚類算法就是將一個(gè)web站點(diǎn)的分析的有向圖轉(zhuǎn)變成矩陣后對(duì)矩陣的行向量和列向量進(jìn)行化簡(jiǎn)、計(jì)算hamming距離并進(jìn)行分類的過(guò)程。聚類算法分為對(duì)客戶群體的聚類和web頁(yè)面的聚類。一個(gè)web站點(diǎn)的拓?fù)浣Y(jié)構(gòu)是一副有向圖,每個(gè)客戶在一段時(shí)間內(nèi)的訪問(wèn)模式就是它的子圖,具有相似訪問(wèn)子圖的客戶很可能就是需求相似的客戶,將這些需求相似的客戶歸類,這就是客戶聚類。一個(gè)web站點(diǎn)可以用如下的有向圖來(lái)表示:G=(N,NP,E,EP)其中,N為結(jié)點(diǎn)集;NP 記錄客戶UID及其訪問(wèn)的結(jié)點(diǎn)Node的次數(shù),為結(jié)點(diǎn)屬性集;E為有向邊集;EP記錄有向邊及該有向邊所在路徑的編號(hào),為有向邊屬性集【4】。在有向圖G的所有結(jié)點(diǎn)集N中一般可以得到站點(diǎn)所有的URL,從結(jié)點(diǎn)屬性集NP也能得到訪問(wèn)每個(gè)結(jié)點(diǎn)的UID和對(duì)應(yīng)訪問(wèn)的次數(shù),這樣就可以得到一個(gè)URLUID的關(guān)聯(lián)矩陣Mm*n ,如下:C11 C12…C1j…C1nC21 C22…C2j…C2n… … … …Ci1 Ci2…Cij…CinMM*N=UIDURL其中,Ci,j 是j客戶在某段期間訪問(wèn)第i個(gè)URL的次數(shù);由矩陣MM*N 看出,每一列向量表示某客戶對(duì)該站點(diǎn)中所有URL的訪問(wèn)情況。每一行向量表示所有客戶對(duì)某個(gè)URL的訪問(wèn)情況。所以,我們可以這么認(rèn)為,行向量不僅代表了站點(diǎn)的結(jié)構(gòu),還蘊(yùn)涵客戶的共同訪問(wèn)模式,列向量則反應(yīng)了客戶類型和客戶的個(gè)性化訪問(wèn)子圖。分別度量行向量和列向量的相似性就可以得到相關(guān)web界面和相似客戶群體,進(jìn)一步分析還能獲得客戶訪問(wèn)模式,也就是頻繁訪問(wèn)路徑【4】。 客戶群體聚類如上所述,由矩陣MM*N 看出,每一列向量表示某客戶對(duì)該站點(diǎn)中所有URL的訪問(wèn)情況。因?yàn)樗强蛻粼L問(wèn)本站點(diǎn)的個(gè)性化子圖,故具有相似的訪問(wèn)子圖的客戶即為相似客戶群體。根據(jù)客戶登記數(shù)據(jù)庫(kù)查詢是否交易,若客戶僅做了瀏覽而并未與商家成交,即列向量的值是未成交次數(shù),那么此相似客戶群為潛在客戶群;否則,為交易客戶群。對(duì)矩陣MM*N 列向量的聚類是考慮他們的相似性度量,可以通過(guò)Hamming距離進(jìn)行。即對(duì)于M[i,j]0,令M[i,j]=,距離越小,其相似度越高。根據(jù)hamming距離的實(shí)際情況設(shè)定閾值,然后對(duì)客戶進(jìn)行聚類【4】??蛻羧后w聚類時(shí),先對(duì)URLUID關(guān)聯(lián)矩陣進(jìn)行預(yù)處理,化簡(jiǎn)數(shù)據(jù),然后按Hamming距離的公式計(jì)算hamming距離,公式如下: (X,Y∈{0,1}n n≧1) 公式(31)接下去建立列向量間的距離矩陣,在這個(gè)對(duì)稱矩陣中,對(duì)于任意的表示第i個(gè)列向量和第j個(gè)列向量間的hamming距離,對(duì)角元素為0。閾值計(jì)算也可按公式(32)來(lái)計(jì)算,但是一般情況下也可以按具體情況自己指定閾值大小: 公式(32)對(duì)于任意的如果,那么將第i個(gè)客戶和所有滿足這個(gè)條件的第j個(gè)客戶劃分為一個(gè)類。聚類分析是電子商務(wù)中很重要的一個(gè)方面,通過(guò)分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,更好的幫助電子商務(wù)用戶了解自己的客戶,向客戶提供更合適的服務(wù)。實(shí)例(1)分析:如圖一所示,假設(shè)某個(gè)網(wǎng)站一個(gè)上午站點(diǎn)中有六個(gè)URL,在一段時(shí)間內(nèi)共有7個(gè)客戶訪問(wèn)了該站點(diǎn)。根據(jù)Web服務(wù)器的日志文件和客戶
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1