freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于知識庫的禮品推薦系統(tǒng)的設(shè)計與實現(xiàn)碩士研究生學(xué)位論文-文庫吧

2025-06-05 11:53 本頁面


【正文】 過濾的推薦 和 協(xié)同 過濾推薦的優(yōu)點,同時支持兩種類型的推薦服務(wù) 。 Google News是一個 為新聞領(lǐng)域 開發(fā)的個性化資訊平臺。該平臺采用基于MinHash聚類的協(xié)同 過濾、統(tǒng)計隱含語義標(biāo)引 (Probabilistic Latent Semantic Indexing, PLSI)和訪問計數(shù)三種方法來產(chǎn)生推薦,使用一個線性模型將不同算法產(chǎn)生的推薦結(jié)合起來 [12]。 北京郵電大學(xué)研究生畢業(yè)論文 3 Gift Ideas()是一個專業(yè)的個性化禮品推薦網(wǎng)站, 網(wǎng)站的禮品知識庫非常專業(yè),推薦頁面用戶體驗性非常好。網(wǎng)站從 收禮人信息,送禮場合, 個性化定制,禮品分類等多方面向用戶進行禮品推薦。 國內(nèi) 研究現(xiàn)狀 復(fù)旦大學(xué)的鄧愛林等 針對用戶評分?jǐn)?shù)據(jù)極端稀疏情況下傳統(tǒng)相似性度量方法的不足 ,提出了一種基于項目評分預(yù)測的協(xié)同過濾推薦算法 ,根據(jù)項目之間的相似性初步預(yù)測用戶對未評分項目的評分 ,在此基礎(chǔ)上 ,采用一種新穎的相似性度量方法計算目標(biāo)用戶的最近鄰居 [13]。 浙江大學(xué)的孫小華針 對協(xié)同過濾 在無法得 到項目的內(nèi)容信息和用戶個人信息的情況下,在數(shù)據(jù) 稀疏和冷啟動情況下提高預(yù)測準(zhǔn)確性方面采用了 屬于特征遞增型的 Pear After_SVD 方法和屬于轉(zhuǎn)換型的 LCM STI 方法。 針對新用戶和新項目的冷啟動問題 采用了基于統(tǒng)計的眾數(shù)法阻及信息熵法來解決 [14]。 清華大學(xué)的邢春曉和高鳳榮等人針對傳統(tǒng)協(xié)同 過濾算法不能及時反映用戶興趣變化的問題,提出了兩種改進度量 :基于時間的數(shù)據(jù)權(quán)重和基于資源相似度的數(shù)據(jù)權(quán)重,在此基礎(chǔ)上將它們有機結(jié)合,將這兩種權(quán)重引入基于資源的協(xié)作過濾算法的生成推薦過程中,通過實驗證明改進后的算法比傳統(tǒng)協(xié)作過濾算法在推薦準(zhǔn)確度上有明顯提高 [15]。 北京航空航天大學(xué)的張光衛(wèi)等人 針 對傳統(tǒng)相似度 度量方法存在的不足 ,利用云模型在定性知識表示以及定性、定量知識 轉(zhuǎn)換時的橋梁作用 , 提出一種在知識層面比較用戶相似度的方法 , 克服了傳統(tǒng)基于向量的相似度比較方法嚴(yán)格匹配對象屬性的不足 。 以該方法為核心 , 在全面分析傳統(tǒng)方法的基礎(chǔ)上 , 提出一種新的協(xié)同過濾推薦算法 。 實驗結(jié)果表明 , 算法在用戶評分?jǐn)?shù)據(jù)極端稀疏的情況下 , 仍能取得較理想的推薦質(zhì)量 [16]。 國內(nèi)推薦系統(tǒng)的應(yīng)用現(xiàn)狀如下: 豆瓣網(wǎng)( 是一個 以圖書,影視和音樂 數(shù)字產(chǎn)品 推薦為目的的網(wǎng)站。 注冊用戶可以對 所喜歡的 數(shù)字產(chǎn)品進行 15 分的評分,豆瓣后臺通過一定的 推薦 算法 向用戶進行推薦, 同時, 用 戶可以對數(shù)字產(chǎn)品進行評論, 并可以參考 其他用戶的評論作為推薦依據(jù)。 最后 用戶還可以加入豆瓣的興趣小組,這樣同興趣小組成員的推薦更加精準(zhǔn),更加符合用戶的興趣。 淘寶禮物 (于淘寶巨大的消費平臺。淘寶禮物將收禮人細(xì)分為男人,女人,青少年,兒童和嬰兒五種類型,并且每種類型的人都有若干種送禮主題。另外還 有送禮場景包括生日送禮,嬰兒誕生,喬遷新居,愛意表達(dá)等。 最后推薦個性化禮物 。 北京郵電大學(xué)研究生畢業(yè)論文 4 研究意義 電子商務(wù)網(wǎng)站是推薦系統(tǒng)應(yīng)用 最 廣泛的地方。 根據(jù)電子商務(wù)網(wǎng)站的運營 特征中國的電子商務(wù)網(wǎng)站可分為三類:平臺性質(zhì)的電子商務(wù)網(wǎng)站,以淘寶為典型代表,不存在倉儲、物流等服務(wù),僅僅提供一個平臺讓更多的人在其中開店;服務(wù)型的電子商務(wù)網(wǎng)站,以當(dāng)當(dāng)、京東商城為典型代表,有自己的倉 儲、物流等;品牌型電子商務(wù)網(wǎng)站,銷售自己品牌旗下產(chǎn)品,一般為企業(yè)官網(wǎng)建立的電子商務(wù)網(wǎng)站,例如凡客誠品。 20xx年電子商務(wù)在中國發(fā)展如火如荼。 根據(jù) 國內(nèi)著名互聯(lián)網(wǎng)分析機構(gòu)艾瑞咨詢調(diào)查顯示,淘寶網(wǎng)占據(jù)國內(nèi)電子商務(wù) 80%以上的市場份額 。 20xx年淘寶網(wǎng)銷售額達(dá)到了 20xx億人民幣,預(yù)計 20xx年淘寶網(wǎng)銷售額將翻一番達(dá)到 4000億人民幣。由此可計算出 20xx年中國的電子商務(wù)總銷售額將達(dá)到 5000億人民幣。 當(dāng)當(dāng)網(wǎng) 已經(jīng)形成以圖書、化妝 品、家居、母嬰等為主的核心品類,并 于 美國東部時間 12月 8日在美國紐約證券交易所正式掛牌上市 。京東商城 增長速度每年都在 300%以上,成了互聯(lián)網(wǎng)和零售業(yè)的又一個奇跡制造者。 凡客誠品 20xx年銷售的衣服達(dá)到了4000萬件。 由上面的數(shù)據(jù)可以說明電子商務(wù)已經(jīng)在中國開始全面發(fā)展,隨著電子商務(wù)的發(fā)展,電子商 務(wù)網(wǎng)站的用戶和銷售的商品急劇增加,如何為每個用戶提供個性化的推薦 服務(wù) 成為電子商務(wù)發(fā)展的重要問題。禮品作為電子商務(wù) 網(wǎng)站 中的特殊商品最具 個性化的需求。每個送禮人都希望送出一份個性化的禮品,每個收禮人都希望收到一份適合自己的禮品。 因此,基于知識庫的禮品推薦系統(tǒng)的研究具有很高的經(jīng)濟價值和社會價值。 基于知識庫的禮品推薦系統(tǒng)有其優(yōu)點也有其缺點。優(yōu)點是可以全面形象地描述用戶的送禮需求,通過禮品知識庫進行推理向用戶推薦準(zhǔn)確的個性化的禮品。缺點是禮品知識庫需要禮品專家進行人工初始化,而且禮品知識庫容易受到 禮品專家喜好的影響 。 本文工作 研究路線和方法 本文從淘寶網(wǎng) 上抓取數(shù)千禮品信息, 然后采用正則表達(dá)式進行文本提取,將提取的文本信息保存到數(shù)據(jù)庫形成禮品庫。 同時調(diào)研禮品領(lǐng)域知識,如禮品分類,送禮節(jié)日場合等知識 并根據(jù)這些知識構(gòu)建禮品知識庫 。然后對 其中 一部分禮品的北京郵電大學(xué)研究生畢業(yè)論文 5 知識庫進行人工初始化,并結(jié)合根據(jù)禮品基本信息計算出的禮品 綜合 相似度對禮品知識庫進行完善 。設(shè)計良好 用戶體驗的推薦交互界面準(zhǔn)確全面地表達(dá)用戶的需求,從 節(jié)日場合 ,收禮人興趣愛好和收禮人描述 向 用戶進行推薦。 最后根據(jù)用戶對推薦禮品的反饋信息對知識庫進一步 調(diào)整和 完善。 本文在搜索 技術(shù) 上采用 開源的全文搜索引擎 Lucene 對禮品基本信息構(gòu)建索引, 同時結(jié)合 用戶的 瀏覽 日志分析用戶偏好 為用戶的 禮品 搜索提供個性化 的 禮品推薦。 主要研究內(nèi)容 本文的主要研究內(nèi)容為推薦系統(tǒng)在禮品推薦領(lǐng)域的應(yīng)用研究,本文采用了知識 庫推薦的方法,并結(jié)合禮品個性化搜索,最后根據(jù)知識庫的特點設(shè)計具有良好用戶體驗的推薦交互界面更好地 描述用戶的需求向用戶提供個性化的禮品推薦服務(wù)。 研究任務(wù) 本文的研究任務(wù)有如下三個方面: 禮品知識庫的構(gòu)建: 調(diào)研具有中國 文化 特色的禮品贈送 知識 , 并 根據(jù) 這些知識 構(gòu)建禮品知識庫 。 禮品知識庫的初始化和完善:用禮品專家的禮品知識 對禮品知識庫進行初始化 , 然后采用 一定的算法 對禮品知識庫進行完善 。 禮品個性化搜索的設(shè)計: 構(gòu)建禮品索引 ,并結(jié)合 用戶 瀏覽 日志 向用 戶提 供 個性化的禮品搜索。 推薦交互界面的設(shè)計: 根據(jù)知識庫設(shè)計 具有 良好用戶體驗的 推薦 交互界面準(zhǔn)確 全面地 描述用戶的需求。 第二章 個性化推薦算法 及系統(tǒng) 實現(xiàn) 關(guān)鍵 技術(shù)介紹 北京郵電大學(xué)研究生畢業(yè)論文 6 協(xié)同過濾 (Collaborative FilteringCF) 協(xié)同過濾 (Collaborative FilteringCF)技術(shù) 是基于一組興趣相同的用戶進行推薦。協(xié)同過濾 基于這樣的假設(shè):為用戶找到他真正感興趣的內(nèi)容的好方法是,首先找 到 與他興趣相似的用戶,然后將這些用戶感興趣的內(nèi)容推薦給此用戶。協(xié)同過濾技術(shù)可以分為 兩 類:基于用戶的協(xié)同過濾 和 基于項目 的協(xié)同過濾 [17]。 1. 基于用戶的協(xié)同過濾推薦 (CF U) 基于用戶的協(xié)同過濾 推薦技術(shù)是 目前 推薦算法實際 應(yīng)用中最為成功的個性化推薦技術(shù), 在商業(yè)推薦系統(tǒng)中得到廣泛應(yīng)用。 算法的基本思想是將具有相同愛好的用戶感興趣的項目推薦給目標(biāo)用戶。 首先利用用戶的歷史記錄如搜索記錄、瀏覽記錄、評分評 價等對用戶特征進行分析和建模。然后計算用戶之間的相似度并將相似度最高的用戶最為最近鄰居 [18]。最后向用戶推薦其最近鄰居頻繁購買的 商品 。 2. 基于產(chǎn)品的協(xié)同過濾推薦 (CF I) 基于產(chǎn)品的協(xié)同過濾技術(shù)也 是應(yīng)用比較廣泛和成功的推薦技術(shù),它與基于用戶的協(xié)同過濾推薦的不同是它計算的是產(chǎn)品之間的相似度,向用戶推薦的是于用戶已經(jīng)購買的商品相似度最高的商品。 3. 協(xié)同過濾的優(yōu)缺點 優(yōu)點: 協(xié)同過濾的最大優(yōu)勢就在于 ,系統(tǒng)與目標(biāo)產(chǎn)品在網(wǎng)絡(luò)上的呈現(xiàn)形式完全獨立 , 只需要用戶產(chǎn)品交易數(shù)據(jù) , 比較簡便易行。 缺點:第 一,協(xié)同過濾 方法 過于 依賴于歷史交易數(shù)據(jù) ,會導(dǎo)致“ 產(chǎn)品 冷啟動 ”和“用戶冷啟動” 問題 ,即無法對新產(chǎn)品與新用戶進行推薦。第二,協(xié)同過濾方法 存在計算規(guī)模問題 ,而如果降低計算復(fù)雜度 又會降低推薦質(zhì)量。第三 , 協(xié)同過濾方法 只利用用戶 產(chǎn)品交易關(guān)系 ,并未考慮用戶多偏好和產(chǎn)品多屬性的問題[19]。 內(nèi)容過濾 (Content Based FilteringCBF) 為了應(yīng)對協(xié)同過濾的稀疏性問題出現(xiàn)了內(nèi)容過濾 。內(nèi)容過濾允許系統(tǒng)發(fā)掘用戶的個性化特征而不需要將其與其他用戶進行匹配 ,待推薦的產(chǎn)品也只是基于產(chǎn)品本身的特征 信息。其本質(zhì)上是一個學(xué)習(xí)系統(tǒng)。內(nèi)容過濾分為兩種 :基于新產(chǎn)品和基于新用戶的內(nèi)容過濾 [20]。 1. 基于新產(chǎn)品的內(nèi)容過濾 新產(chǎn)品進入 系統(tǒng) 后,系統(tǒng) 將新產(chǎn)品與產(chǎn)品特征數(shù)據(jù)庫進行匹配 ,然后提取新北京郵電大學(xué)研究生畢業(yè)論文 7 產(chǎn)品的特征。再把用戶數(shù)據(jù)庫中的用戶偏好類別與產(chǎn)品特征進行相似度匹配 ,從而生成推薦列表 , 最后根據(jù)用戶反饋進行修正學(xué)習(xí)。 2. 基于新用戶的內(nèi)容過濾 新用戶進入后 ,系統(tǒng)提取用戶個性化特征 ,提取的方法一般有三種 ,一是問問題 ,二是通過注冊信息獲得 ,三是通過用戶行為進行提取。然后將用戶與系統(tǒng)用戶特征數(shù)據(jù)庫進行匹配 ,歸到一個用戶 類別中 ,再根據(jù)這個類別進行推薦 ,最后再進行修正學(xué)習(xí)。 3. 內(nèi)容過濾的優(yōu)缺點 優(yōu)點: 正如內(nèi)容過濾出現(xiàn)的原因 內(nèi)容過濾 對推薦結(jié)果的解釋更換 在 一定程度上解決了 協(xié)同過濾方法中的用戶多偏好和產(chǎn)品內(nèi)容多樣的問題, 可以讓用戶提供一定的初始化信息 ,輔助系統(tǒng)做出更好的推薦。 缺點:第一,產(chǎn)品提供商可能會有意更改產(chǎn)品特征誤導(dǎo)系統(tǒng)以獲取推薦機會。第二,商品屬性提取困難。很難定義商品 屬性和用戶特征的類別 ,那么也就很難做出精確的匹配。而且這些屬性特征成千上萬 ,隨著系統(tǒng)的不斷學(xué)習(xí) ,數(shù)據(jù)庫規(guī)模還會不斷擴大 ,對系統(tǒng)的性能也會有很大的影響 。第三, 精確度問題 ,有試驗表明內(nèi)容過濾推薦可能不如協(xié)同過濾更為精確。 知識 發(fā)現(xiàn) ( Knowledge Discovery in Database KDD) 知識發(fā)現(xiàn)是 從數(shù)據(jù)庫中提取隱含的、先前未知的、潛在有用的知識或信息模式的決策支持方法。 知識發(fā)現(xiàn)需要 提取發(fā)現(xiàn)用戶和產(chǎn)品的特征 ,所采用的方法是分類、聚類、關(guān)聯(lián)規(guī)則等數(shù)據(jù)挖掘方法。 知識發(fā)現(xiàn) 將用戶請求視作一個查詢 ,然后基于用戶需求和偏好進行推薦。這個方法需要了解產(chǎn)品用戶之間的關(guān)系和特征。這些知識的獲取有賴于知識庫的建立 ,使得數(shù)據(jù)挖掘的方法得到了巨大 的應(yīng)用 [21]。 1. 數(shù)據(jù)挖掘技術(shù)的應(yīng)用 數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中 , 提取隱含在其中的但又是潛在有用的信息和知識的過程 [22]。 隨著信息技術(shù)的高速發(fā)展 , 人們積累的數(shù)據(jù)量急劇增長,動輒以 TB計,如何從海量的數(shù)據(jù)中提取有用的知識成為當(dāng)務(wù)之急。數(shù)據(jù)挖掘就是為順應(yīng)這種需要應(yīng)運而生發(fā)展起來的數(shù)據(jù)處理技術(shù)。 數(shù)據(jù)挖掘 是知識發(fā)現(xiàn)的關(guān)鍵步驟。 電子商務(wù)推薦系統(tǒng)中的數(shù)據(jù)挖掘主要包括關(guān)聯(lián)規(guī)則挖掘和分類挖掘兩類 ,因此基于數(shù)據(jù)挖掘的 知識發(fā)現(xiàn) 方法又分為關(guān)聯(lián)規(guī)則推薦和分類挖掘推薦兩種。 關(guān)聯(lián)規(guī)則推薦方法是先根據(jù)銷售數(shù)據(jù)發(fā)現(xiàn)不同商品在銷售過程中的相關(guān)性 ,然后基北京郵電大學(xué)研究生畢業(yè)論文 8 于生成的關(guān)聯(lián)規(guī)則模型和用戶的購買行為產(chǎn)生推薦結(jié)果 。分類挖掘推薦方法是通過聚類、 Bayesia網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)等多種機器學(xué)習(xí)方法產(chǎn)生分類挖掘模型 ,再根據(jù)用戶輸入信息和產(chǎn)品的特征信息 ,預(yù)測是否向用戶推薦該產(chǎn)品 [23]。 2. 知識發(fā)現(xiàn)的優(yōu)缺點 優(yōu)點: 知識發(fā)現(xiàn)可以利用電子商務(wù)網(wǎng)站的交易數(shù)據(jù)、日志數(shù)據(jù)等信息提高推薦系統(tǒng)的推薦質(zhì)量和推薦效率。 缺點: 一種 知識發(fā)現(xiàn) 的 算法 只能適應(yīng)某一領(lǐng)域的數(shù)據(jù),而更換領(lǐng)域后知識發(fā)現(xiàn)的算法就不太適用了,因此需要重新定義 規(guī)則或算法。 系統(tǒng) 實現(xiàn) 關(guān)鍵 技術(shù)介紹 正則表達(dá)式 正則表達(dá)式 ( Regular Expression)在 計算機科學(xué) 中,是指一
點擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1