freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

信號(hào)與信息專業(yè)學(xué)位論文-處理基于協(xié)同過濾的個(gè)性化社區(qū)推薦方法研究(參考版)

2025-06-09 13:24本頁面
  

【正文】 這些豆瓣小組就是一個(gè)個(gè)的用戶自發(fā)建立的社區(qū)。這一切說明國(guó)內(nèi)的虛擬社區(qū)已有一定的影響和規(guī)模 , 有著廣闊的研究和發(fā)展空間。 目前在國(guó)內(nèi)有 一些 以興趣 愛好休閑娛樂為主 的極富 影響 力的 虛擬社區(qū) , 有豆瓣 [49]、天涯社區(qū) [50]、人人網(wǎng) [6]、開心網(wǎng) [51]等。用戶也可以根據(jù)自己的喜好自由選擇所加入的社區(qū)。 虛擬社區(qū) 打破了 地域的限制,人們 只需要一臺(tái) 聯(lián)網(wǎng)的電腦 就可以跟 全球 任 何地方的人暢所欲言。它讓 用戶可以以文字的形式表達(dá) 出 自己的思想 。 虛擬社區(qū)為每一個(gè)用戶提供了很多與其他用戶交流的功能,例如社區(qū)通信、電子郵箱,還可以即時(shí)聊天。 它 是指由網(wǎng)民在 網(wǎng)絡(luò)上 進(jìn)行社會(huì)互動(dòng) 而 形成的 由共同興趣的人集合形成的 活動(dòng)場(chǎng)所。本章首先 介紹 虛擬社區(qū)的相關(guān)背景, 從普通用戶對(duì)虛擬社區(qū)的體驗(yàn)入手,分析 個(gè)性 化社區(qū)推薦的實(shí)際意義;其次,根據(jù)現(xiàn)有的研究成果和相關(guān)應(yīng)用,總結(jié) 社區(qū)推薦算法的發(fā)展現(xiàn)狀,指出現(xiàn)有算法的不足之處;然后提出一種基于軟約束 LDA 算 法的社區(qū)推薦算法,并通過實(shí)驗(yàn)證明該算法的可行性和優(yōu)勢(shì);最后設(shè)計(jì) 一個(gè)在線系統(tǒng)框架以實(shí)現(xiàn) 實(shí)時(shí) 更新。最后,本章介紹了現(xiàn)在 已有的一些個(gè)性化社區(qū)推薦方法。目前已有一些基于模型的協(xié)同過濾社區(qū)推薦方法的相關(guān)工作,我們將在 節(jié)中詳細(xì)介紹。 以上的幾種社區(qū)推薦方法基本都是采用了基于 記憶 的協(xié)同過濾方法,但是它們具有一個(gè)共同的缺點(diǎn)就是會(huì)遇到數(shù)據(jù)稀疏 的問 題,難以處理大資料量 , 影響即時(shí)結(jié)果。 陳瓊等 [47]根據(jù)社會(huì)網(wǎng)絡(luò)的動(dòng)態(tài)變化特性,通過分析網(wǎng) 絡(luò)的動(dòng) 態(tài)演變過程、網(wǎng)絡(luò)個(gè)體的行為特征及個(gè)體間 聯(lián)系的變化,研究動(dòng)態(tài)社區(qū)及其個(gè)體的動(dòng)態(tài)特性的形式化描述方法,提出了節(jié)點(diǎn) (個(gè)體 )間的動(dòng)態(tài)屬性相似度計(jì)算方法和基于節(jié)點(diǎn) (個(gè)體 )間的動(dòng)態(tài)屬性相似度計(jì)算的社區(qū)推薦算法。 HanGyu Ko 等 [46]提出了一種算法,可以根據(jù)用戶的社會(huì)關(guān)系以及用戶的第 二 章 相關(guān)背景 第 20 頁 喜好,識(shí)別和推薦潛在的 IPTV 社區(qū)。首先提出了一種基于使用程度的網(wǎng)頁發(fā)現(xiàn)策略,然后在此基礎(chǔ)上,利用 PLSA 進(jìn)行用戶聚類,建立用戶描述文檔。 由于對(duì)網(wǎng)絡(luò)的文件和動(dòng)態(tài)網(wǎng)絡(luò)數(shù)據(jù)缺乏一個(gè)統(tǒng)一的模式,使用 傳統(tǒng)的數(shù)據(jù)管理和搜索技術(shù) 進(jìn)行 信息管理和網(wǎng)絡(luò)數(shù)據(jù)檢索的效率往往都不理想?;谶@樣的思想,Wang Fang[44]提出了一種建立多興趣社區(qū)群的方法。實(shí)驗(yàn)結(jié)果表明,前者在準(zhǔn)確率和效率上都要高于后者。 在 Vishvas Vasuki 等人的工作 [43]中,提出了一種通過現(xiàn)有的用戶和社區(qū)之間的從屬網(wǎng)絡(luò)關(guān)系,預(yù)測(cè)用戶和社區(qū)之間新的從屬關(guān)系的方法。 通過分析“ general neighborhood”問題, Li Yu[42]提出了“ munity neighborhood”的概念,并基于此提出了一種基于社區(qū)的協(xié)同推薦算法。 Liu Ji 等 [41]提出了一種基于網(wǎng)絡(luò)社區(qū)的協(xié)同過濾推薦算法,通過對(duì)用戶社會(huì)網(wǎng)絡(luò)的特征向量進(jìn)行加權(quán)來增強(qiáng)在協(xié)同推薦中社區(qū)的貢獻(xiàn)。因此,在社區(qū)推薦中,協(xié)同推薦最大限度的利用 了社會(huì)網(wǎng)絡(luò)中最有價(jià)值的信息,是最重要的推薦手段 。社會(huì)網(wǎng)絡(luò)中最有價(jià)值的數(shù)據(jù)就是結(jié)構(gòu)化的關(guān)系數(shù)據(jù)。 個(gè)性化社區(qū)推薦方法 第 二 章 相關(guān)背景 第 19 頁 社區(qū)推薦是近年來剛剛興起的研究熱點(diǎn),國(guó)內(nèi)外已有一些學(xué)者對(duì)此課題展開了相關(guān)的研究。 正因?yàn)橛腥绱硕嗟膬?yōu)點(diǎn),協(xié)同推薦逐漸成為個(gè)性化推薦中最受歡迎的技術(shù),在商業(yè) 應(yīng)用上也 成為迄今為止最成功的技術(shù) [11], 取得了不錯(cuò)的成績(jī)。 和基于內(nèi)容的 過濾 方法 相比,協(xié)同過濾 具有如下 優(yōu)點(diǎn) : (1) 解決了基于內(nèi)容的過濾方法中資源特征不易提取的問題 ; (2) 可以處理缺少用戶特征信息或者產(chǎn)品特征信息的情況, 推薦中考慮了資源質(zhì)量以及用戶觀點(diǎn)等因素 ; (3) 可以發(fā)現(xiàn)用戶的新興趣。但是基于模型的協(xié)同過濾算法也有它的不足,就是建立模型的時(shí)間復(fù)雜度過高,建模工作量大,導(dǎo)致新的模型相對(duì)于舊的模型在數(shù)據(jù)同步上有一定的延遲。這一部分的研究?jī)?nèi)容,被認(rèn)為是未來研究工作的一個(gè)可能的熱點(diǎn)。但是,其計(jì)算復(fù)雜度較高,必須使用近似的算法。當(dāng)用戶被推薦了某個(gè)項(xiàng)目后,其狀態(tài)會(huì)因此轉(zhuǎn)變,或者接受這次推薦,或者接受未推薦的,或者什么都不做。每一個(gè)馬爾科夫決策過程都可以描述為一個(gè)四元組,S A R Pr??,其中, S 是一組狀態(tài), A 是一組動(dòng)作, R 是對(duì)每組狀態(tài) 動(dòng)作對(duì)定義的獎(jiǎng)勵(lì)函數(shù), Pr 是在給定動(dòng)作下狀態(tài)間轉(zhuǎn)化的概率 [32]。 基于馬爾科夫決策過程模型的推薦算法,與普通將推薦看作預(yù)測(cè)問題的 處理第 二 章 相關(guān)背景 第 18 頁 方法不同,將整個(gè)推薦過程看作是一個(gè)連續(xù)的優(yōu)化問題 [31]。多項(xiàng)式混合模型( Multinomial Mixture Model)在多項(xiàng)式模型( Multinomial Model)的基礎(chǔ)上,假設(shè)所有的用戶可以分為若干類,并且代表評(píng)分信息的多個(gè)因子互相之間以及其與用戶的身 份信息之間都是獨(dú)立的。示像模型( Aspect Model)是由 文獻(xiàn) [29]提出的一種概率隱空間模型。從概念上進(jìn)行描述,它將用戶 的興趣 喜好 使用互相重疊的用戶群組來表示。但是,其計(jì)算開銷較普通的推薦算法有較大提升,這也成為其無法廣泛應(yīng)用的一個(gè)原因。聚類算法使用在協(xié)同過濾中時(shí),一般首先對(duì)數(shù)據(jù)樣本進(jìn)行聚類,然后在聚集成的每一個(gè)小類中,應(yīng)用基于記憶的協(xié)同過濾算法。最常用的聚類 是 衡量?jī)蓚€(gè)數(shù)據(jù)樣本間距離的度量包括 Minkowski 距離及 Pearson 相 關(guān)系數(shù)。基于 ELR 的經(jīng)典算法 NBELR( naive Bayes optimized by ELR)可以取得較 Pearson 相關(guān)系數(shù)方法更好的預(yù)測(cè)結(jié)果,但是需要更多的時(shí)間進(jìn)行模型的訓(xùn)練 [27]。針對(duì)其不足之處,擴(kuò)展邏輯回歸 ELR( Extended Logistic Regression)被引入到基于貝葉斯置信網(wǎng)的協(xié)同過濾算法中 [26]。簡(jiǎn)單貝葉斯分類器( naive Bayes)第 二 章 相關(guān)背景 第 17 頁 適用于二值分類情況,而現(xiàn)實(shí)中的推薦數(shù)據(jù),一般不存在二值化的情況。其中,每個(gè)節(jié)點(diǎn) nN? 代表 一個(gè)隨機(jī)變量,每個(gè)有向 邊 aA? 代表其鏈接的兩個(gè)變量之間存在的概率關(guān)系,同時(shí), ? 代表一個(gè)子節(jié)點(diǎn)與其父親節(jié)點(diǎn)之間的條件概率表 [24]。 在基于模型的推薦算法中,最為經(jīng)典的模型包括了貝葉斯置信網(wǎng)絡(luò)模型,聚類模型,隱參數(shù)模型以及馬爾科夫決策過程模型等等?;谀P驮O(shè)計(jì)的合理程度,可以針對(duì)基于記憶的推薦算法中的 不足,更加契合地適應(yīng)現(xiàn)實(shí)世界中的數(shù)據(jù)及推薦問題。 因此 ,在這樣情況下, 發(fā)展出 了 基于模型 的協(xié)同過濾技術(shù) (Modelbased Collaborative Filtering)。據(jù)統(tǒng)計(jì),在 Amazon 中,用戶評(píng)價(jià)的書籍占系統(tǒng)中所有書籍的比例最多也只能達(dá)到 1%2%。 基于模型的協(xié)同過濾 基于用戶 ( Userbased)的協(xié)同過濾和 基于項(xiàng)目 ( Itembased)的協(xié)同過濾統(tǒng)稱為 基于記憶 ( Memorybased)的協(xié)同過濾技術(shù),他們 具有一個(gè)共同 的缺點(diǎn) 就 是會(huì)遇到數(shù)據(jù) 稀疏 的問題,難以處理大資料量 , 影響即時(shí)結(jié)果。 Sarwar[33]和 Karypis [34]已經(jīng)證明基于項(xiàng)目 的協(xié)同過濾推薦方法比基于用戶的協(xié)同過濾推薦方法在性能上有所提升 ,而且與基于用戶的協(xié)同過濾推薦方法相比,基于項(xiàng)目的協(xié)同過濾推薦更加準(zhǔn)確。假設(shè)目標(biāo)項(xiàng)目 t 的最近鄰集合為 12{ , ,..., }kT t t t? ,則用戶 u 對(duì)目標(biāo)項(xiàng)目的預(yù)測(cè)評(píng)分的計(jì)算公式如下: 11( ) ( )()niiiniic o rr ra ting ip re d ic tion tc o rr???????? ( ) 其中, t 是所有用戶對(duì)目標(biāo)項(xiàng)目 t 的所有評(píng)分的均值, icorr 是項(xiàng)目 t 和 最近鄰集合中的 項(xiàng)目 i 之間的相似度, irating 是 u 對(duì) i 的評(píng)價(jià)值, i 是所有用戶 對(duì) 項(xiàng)目 i 的第 二 章 相關(guān)背景 第 16 頁 評(píng)價(jià)均值。選擇最近鄰的策略依然可以是“ TopN 策略”和“閾值策略”兩種。具體計(jì)算兩個(gè)項(xiàng)目相似性的方法如下: 假設(shè)要計(jì)算項(xiàng)目 i 和項(xiàng)目 j 的相似性,首先得到對(duì)項(xiàng)目 i 和項(xiàng)目 j 評(píng)論過的所有用戶,分別表示為用戶評(píng)價(jià)向量的形式,然后通過不同的相似性度量方法(見 節(jié)),計(jì)算兩者的相似 度 。 與基于用戶的協(xié)同過濾所不同的是, 基于項(xiàng)目的協(xié)同過濾 不再計(jì)算用戶之間的相似度,而是 通 過計(jì)算項(xiàng)目之間的相似度,獲得目標(biāo)項(xiàng)目的最近鄰 ,然后通過用戶對(duì)最近鄰項(xiàng)目的評(píng)分來預(yù)測(cè)用戶對(duì)目標(biāo)項(xiàng)目的評(píng)分,從而完成 推薦[37]。為了避免這個(gè)問題, 2021 年 Sarwar[33]提出了基于項(xiàng)目的協(xié)同過濾推 薦算法 (Itembased Collaborative Filtering Algorithms)。 (2) 產(chǎn)生推薦 集 合 計(jì)算 最近鄰集合中的用戶 i 對(duì)項(xiàng)目的 感興趣程度 的加權(quán)平均值,取 N 個(gè)取值最高的 且不屬于 uI 的項(xiàng)作為 TopN 推薦集 合 。 3. 產(chǎn)生推薦 得到目標(biāo)用戶的最近鄰集合之后,就可以預(yù)測(cè)用戶對(duì)某項(xiàng)目的 感 興趣 程 度,并且產(chǎn)生 TopN 形式的推薦集。 計(jì)算出用戶之間的相似度,就可以根據(jù)用戶之間的相似度來計(jì)算目標(biāo)用戶的最近鄰集合。若 0r? ,表明兩個(gè)變量間不是線性相關(guān),但有可能是其他方式的相關(guān) 。 r 的取值 范圍是 [ 1, 1]?? ,若 0r? ,表明兩個(gè)變量是正相關(guān) 的 ,即一個(gè)變量的值 增加 ,另一個(gè)變量的值也會(huì) 增加 ;若 0r? ,表明兩個(gè)變量是負(fù)相關(guān) 的 ,即一個(gè)變量的值 增加, 另一個(gè)變量的值反而會(huì) 減小 。樣本的相第 二 章 相關(guān)背景 第 14 頁 關(guān)系數(shù)一般用 r 表示,11 1 n iii XYX X Y Yr n s s?? ? ? ???? ? ? ? ??? ? ? ??, 其中 n 為樣本量 , iX , iY 分別為兩個(gè)變量的觀測(cè)值 , X , Y 分別為兩個(gè)樣本的 均值。 br 表示用戶 bu 對(duì)某個(gè)項(xiàng)目的評(píng)價(jià)分?jǐn)?shù)的均值。如果用相關(guān)相似性來計(jì)算,則可以修正這樣的錯(cuò)誤,給出比較符合實(shí)際情況的結(jié)論。 例如,某用戶 a 習(xí)慣將他認(rèn)為的最好的項(xiàng)目評(píng)為 5 分,而某用戶 b 習(xí)慣將他認(rèn)為的最好的項(xiàng)目評(píng)為 4 分。 (1) 余弦相似性 用向量來表示用戶 對(duì)項(xiàng)目的評(píng)分,如果用戶沒有項(xiàng)目評(píng)分,則把該維度設(shè)為0, 這樣可以 得到 各個(gè) 用戶 的評(píng)分向量 ,然后利用如下公式計(jì)算兩個(gè) 用戶評(píng)分 向量的余弦相似性: cos( , )xyxyxy?? ( ) 其中,“ ? ”表示向量點(diǎn)積,1nkkkx y x y????, x 是向量 x 的長(zhǎng)度, 21nkkxx?? ?。 可以看出,計(jì)算相似度是基于用戶的協(xié)同推薦中最重要的一個(gè)環(huán)節(jié),能否準(zhǔn)確的計(jì)算出用戶之間的相似度直接影響推薦的準(zhǔn)確性。 也就是說,對(duì)于 每 個(gè)用戶u 都要維護(hù)一個(gè)最近鄰集合 12{ , ,..., }sN N N N? ,其中 1N 到 sN 是 分別是與用戶 u相似度從大到小排列的鄰居。評(píng)分值也可以是 非二值的,比如將用戶對(duì)項(xiàng)目的喜愛程度分成第 二 章 相關(guān)背景 第 12 頁 0~9 十個(gè)等級(jí)。 矩陣中的每個(gè)值 ijR 表示第 i 個(gè)用戶對(duì)第 j 個(gè)項(xiàng)目的評(píng)分 值,如表 所示。 基于用戶的協(xié)同過濾 的 基本思想就是先計(jì)算用戶之間的相似度,然后找到與目標(biāo)用戶具有相 近 興趣愛好的幾個(gè)用戶,稱 之 為鄰居,然后將 這些 鄰居所喜好的資源推薦給目標(biāo)用戶。 目前已有的協(xié)同過濾方法大概分為三 種: 基于用戶的( Userbased)的協(xié)同過濾,基于項(xiàng)目的( Itembased)的協(xié)同過濾和基于模型的( Modelbased)的協(xié)同過濾。 與傳統(tǒng)的基于內(nèi)容 的 推薦不同,協(xié)同過濾 通過 分析用戶興趣,在用戶群中找到 與 指定用戶 有相似興趣的 用戶,綜合這些相似用戶對(duì)某一 資源 的評(píng)價(jià), 得到 系統(tǒng)對(duì)該 用戶對(duì)此 資源 的喜好程度 的 預(yù)測(cè)。 基于協(xié)同過濾的推薦方法 基于 協(xié)同 過濾的 推薦算法 [22][23][63][64]是 利用 這樣的 途徑來進(jìn)行推薦 : 在為用戶進(jìn)行個(gè)性化推薦 之前,先找到與這個(gè)用戶興趣相似的其他用戶,然后再根據(jù)這些相似用戶的瀏覽記錄,來推薦給目標(biāo)用戶。 因此 這種方法通常被限制在容易分析內(nèi)容的 產(chǎn)品 推薦,而對(duì)于一些 比 較難提取出內(nèi)容的 產(chǎn)品 往往 就不能產(chǎn)生 令人 滿意的推薦效果。NewsWeeder 是一個(gè)網(wǎng)頁新聞推薦系統(tǒng),它根據(jù)用戶對(duì)新聞的評(píng)論來 為用戶的興趣建模,進(jìn)而 給用戶 推薦他所 感興趣的網(wǎng)頁新聞。 WebWatcher 是互聯(lián)網(wǎng) 上 的一個(gè)檢索助理, 它可以 用來幫助用戶在一個(gè)網(wǎng)站內(nèi)找到 他所 需要的信息。 目前,基于內(nèi)容的推薦系統(tǒng)有 WebWatcher、 InforFinder、 CiteSeer、 Letizia、NewsWeeder 和 Syskillamp。 每個(gè)屬性特征作為向量的一個(gè)維度,每個(gè)維度的值表示用戶對(duì)該屬性特征的感興趣程度。 人工神經(jīng) 網(wǎng)絡(luò)依靠
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1