freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

網(wǎng)頁序列分析系統(tǒng)課程設(shè)計(論文)-wenkub

2023-07-12 20:37:23 本頁面
 

【正文】 =atoi(p)。//getline(char *,int,char) 表示該行字符達(dá)到 100 個或遇到換行就結(jié)束 const char * split= 。//打開文本數(shù)據(jù) (,ios::trunc)。//保存一行 int 型數(shù)據(jù)數(shù)組 int msn2[10000]。 //void quchu()。 msn1 數(shù)組中數(shù)據(jù)進(jìn)行前后比較,如若相等,則將前一個賦值為 0 msn1 中數(shù)據(jù) 進(jìn)行判斷,大于 0,則將數(shù)據(jù)賦值給數(shù)組 msn2。還有一種情況就是在多次點(diǎn)擊過程中有重復(fù)點(diǎn)擊的網(wǎng)頁,這樣的情況只需選取一次即可,因?yàn)槲覀兯P(guān)系的是網(wǎng)頁點(diǎn)擊的次序而不是次數(shù) ,現(xiàn)對樣例中 9 號用戶的數(shù)據(jù)進(jìn)行分析,用戶 9第一次點(diǎn)擊 6號網(wǎng)頁,第二次點(diǎn)擊 7號網(wǎng)頁,第三次點(diǎn)擊 6號網(wǎng)頁,第四次點(diǎn)擊 8號網(wǎng)頁。 選取的方法是 Clementine 的序列關(guān)聯(lián) ,所以要將數(shù)據(jù)處理成 Clementine 可讀取的格式,并且要刪減不必要的數(shù)據(jù),改寫數(shù)據(jù)的格式,這樣才能達(dá)到分析處理的要求。 基本描述分析 截取部分?jǐn)?shù)據(jù)如下: 1 1 2 3 2 2 4 2 2 2 3 3 5 1 6 1 1 6 6 7 7 7 6 6 8 8 8 8 6 9 4 4 4 10 3 10 5 10 4 4 4 1 1 1 11 1 1 1 3 12 12 1 1 每一行代表一個用戶所點(diǎn)擊的網(wǎng)頁,此次選取的數(shù)據(jù)之中一共有 17 個不同類型的網(wǎng)頁,分別是: frontpage news tech local opinion onair misc weather msnnews health living business msnsports sports summary bbs travel 為了方便處理,將以上各個網(wǎng)頁進(jìn)行編號,分別為 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17。 質(zhì)量分析 此次分析的數(shù)據(jù)總共有 989818,平均每個用戶點(diǎn)擊網(wǎng)頁的次數(shù)是 次 ,每個不同類型的網(wǎng)頁有 10 到 5000 個不同的 URL( 網(wǎng)頁地址 )。站點(diǎn)路徑優(yōu)化實(shí)際上就是站點(diǎn)管理者優(yōu)化其站點(diǎn)結(jié)構(gòu),它的出現(xiàn)就是為了提高用戶的訪問效率以及用戶對站點(diǎn)的忠誠度。本文利用 Clementine 數(shù)據(jù) 挖掘的方法和技術(shù)對用戶所訪問的頁面序列進(jìn)行挖掘,構(gòu)建 網(wǎng)頁推薦的 模型,實(shí)現(xiàn)對當(dāng)前站點(diǎn)排序方式的優(yōu)化,從而最大限度地優(yōu)化用戶訪問體驗(yàn),提高 當(dāng)前站點(diǎn)信 息獲取的整體效率。 [關(guān)鍵詞 ] 網(wǎng)頁推薦 ; Clememtine 數(shù)據(jù) 挖掘;訪問序列 傳統(tǒng)的 Web 網(wǎng)站以系統(tǒng)自身為中心,為了容納大量的信息,以圖結(jié)構(gòu)組織網(wǎng)站,頁面之間存在著比較復(fù)雜的層次關(guān)系。 2 第二章 數(shù)據(jù)基本分析 數(shù)據(jù)說明 本數(shù)據(jù)來自 網(wǎng)絡(luò)信息服務(wù)( IIS)網(wǎng)站 和 年 9 月 28日全天日志記錄,每行連續(xù)數(shù)據(jù)表示 單 個用戶 24 小時內(nèi)瀏覽網(wǎng)頁 的記錄 , 連續(xù)數(shù)據(jù)中的數(shù)字表示用戶對相應(yīng)網(wǎng)頁的瀏覽請求,該訪問請求不會被記錄成詳細(xì)的記錄,即具體的網(wǎng)址,而只是單單記錄了網(wǎng)頁類型。從數(shù)據(jù)的質(zhì)量上看,這是一個較大的數(shù)據(jù)集,數(shù)據(jù)的量足夠大,可以用于數(shù)據(jù)的挖掘分析,且數(shù)據(jù)來源于 Inter Information Server (IIS),有足夠可信度 。 一第三行數(shù)據(jù)為例對單個用戶的數(shù)據(jù)進(jìn)行說明。 結(jié)合 提供的數(shù)據(jù)具體分析:每行數(shù)據(jù)是一個用戶的信息記錄,表示的含義是第 n 號用戶點(diǎn)擊了哪個網(wǎng)頁,是第幾次點(diǎn)擊的。 根據(jù)以上的要求,可將數(shù)據(jù)處理成三列,分別表示用戶號,用戶點(diǎn)擊的網(wǎng)頁號,此次點(diǎn)擊的次序號。 msn2 中數(shù)據(jù)個數(shù)大于 1 的,按形式為三列,分別是用戶號,用戶點(diǎn)擊的網(wǎng)頁號,點(diǎn)擊網(wǎng)頁的次序號的格式寫入 文本文件。 int i=0,count=0。//保存無重復(fù)數(shù)據(jù)數(shù)組 fstream out。 //ios::trunc 表示在打開文件前將文件清空 ,由于是 寫入 ,文件不存在則創(chuàng)建 while(!()) { (msn,100000,39。 //將數(shù)據(jù)變?yōu)?int 型 char * p。 //將截取數(shù)字轉(zhuǎn)換為整型,賦值給數(shù) 組 p=strtok(NULL,split)。 for(i=0。 a++。i++) incount+139。i+1\n。 取部分處理好的結(jié)果如下: ID,CONTENT,TIME 1,3,1 1,2,2 1,4,3 1,2,4 1,3,5 2,6,1 2,7,2 7 2,6,3 2,8,4 3,6,1 3,9,2 3,4,3 開頭是加上的字段名。 設(shè)置過程截圖如下: 圖 1 導(dǎo)入數(shù)據(jù) 9 圖 2 數(shù)據(jù)類型設(shè)置 再點(diǎn)擊選取表節(jié)點(diǎn),連接可變文件,執(zhí)行,觀察數(shù)據(jù)是否正確導(dǎo)入了。 數(shù)據(jù)流的構(gòu)建過程截圖如下: 圖 5 數(shù)據(jù)流構(gòu)建 12 第五章 模型結(jié)果分析 結(jié)果的分析處理 首先在“序列”節(jié)點(diǎn)的模型設(shè)置中設(shè)置好合適的最小支持度,最小置信度。因?yàn)橛涗浺还灿?989818,此條結(jié)果支持度為 %,故先點(diǎn)擊 4號網(wǎng)頁,再點(diǎn)擊 7 號網(wǎng)頁的記錄一共有約 40000 多條,點(diǎn)擊了 4 號和 7 號網(wǎng)頁后,在點(diǎn)擊 4 號的可能性為%,即為其置信度。 重新設(shè)置相關(guān)參數(shù),最小支持度設(shè)置為 %,最小置信度設(shè)置為 60%,則前項(xiàng)必須出現(xiàn)的次數(shù)達(dá)到 5000 次左右結(jié)果才會被保留。從有效事務(wù)數(shù),規(guī)則條數(shù)上看,這個結(jié)果還是很合理的。 16 第六章 應(yīng)用系統(tǒng)設(shè)計 模型接口 經(jīng)討論分析我們決定,運(yùn)用 軟件實(shí)現(xiàn)對本系統(tǒng)的應(yīng)用設(shè)計。//定義數(shù)組,保存訪問數(shù)據(jù) var i:integer。具體 label 中代碼如下: procedure (Sender: TObject)。 :=+1。將數(shù)據(jù)逐個轉(zhuǎn)換為 int 型,賦值給 msnint 數(shù)組 ,數(shù)據(jù)最后一個編號不寫如數(shù)組。則將推薦的數(shù)據(jù) SEE賦值給 。 S: string。 //保存所有推薦 Slist:Tstringlist。 temp:integer。//定義數(shù)組,保存 int 型數(shù)據(jù) begin temp:=0。39。 //綁定文件到文件類型變量 Reset(F)。 39。 end。//取最大值 while msnint[i]=[alli] do begin 18 i:=i1。 end。 case inn of 1:SEE:=39。 3:SEE:=39。 5:SEE:=39。 7:SEE:=39。 9:SEE:=39。 11:SEE:=39。 13:SEE:=39。
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1