【正文】
的方法是隱含語義索引 ? Sarwar等學(xué)者將 LSI引入?yún)f(xié)作過濾領(lǐng)域 ? 關(guān)系矩陣由活動用戶和項(xiàng)目組成;語義關(guān)系由用戶與用戶之間、項(xiàng)目與項(xiàng)目之間、用戶與項(xiàng)目之間的相關(guān)性組成 LSI協(xié)作過濾的流程 ? 建立用戶 項(xiàng)目關(guān)系矩陣 R ; ? 采用奇異值分解技術(shù)將矩陣 R 分解為 U ,S 和 V ? 將 V 降維成維數(shù)為 k的矩陣 VK k r),并采用相同方法簡化矩陣 U和 S 為 Uk 和 Sk ; ? 計(jì)算矩陣 Vk 的平方根 ,并相應(yīng)計(jì)算 和 ? 預(yù)測用戶 a 對項(xiàng)目 i 的評分,公式如下: )()(, iVSaSURP TkkTkkaia ???kk SU ? Tkk VS ?優(yōu)缺點(diǎn) ? 重要的用戶 項(xiàng)目關(guān)系結(jié)構(gòu)被映射到低維空間中,消除了關(guān)系上的細(xì)微差別而保留了重要的潛在關(guān)聯(lián)性 ? K值太大會導(dǎo)致結(jié)果趨近于原始矩陣而失去挖掘潛在關(guān)聯(lián)的能力 ? K值太小則會使得關(guān)聯(lián)信息丟失太多,以至于對于用戶和項(xiàng)目的分辨能力不足 基于項(xiàng)目的協(xié)作過濾 ? 基于用戶的協(xié)作過濾系統(tǒng)通過遍歷整個(gè)用戶群建立用戶之間的相似關(guān)系,并推薦項(xiàng)目,對用戶規(guī)模龐大的過濾系統(tǒng)而言,這種方法極大影響推薦效率 ? 基于項(xiàng)目的協(xié)作過濾系統(tǒng)只針對目標(biāo)項(xiàng)目和活動用戶已有項(xiàng)目之間進(jìn)行協(xié)作性檢測,從而在保證過濾效果的同時(shí),大大提高了系統(tǒng)效率 ? 基于項(xiàng)目的協(xié)作過濾系統(tǒng)的核心問題是檢測兩個(gè)項(xiàng)目之間的協(xié)作相似性 ? 區(qū)別于基于內(nèi)容的過濾,描述項(xiàng)目的特征空間不是由項(xiàng)目本身包含的詞、短語或句子構(gòu)成,而是用戶群對其進(jìn)行的綜合評分 項(xiàng)目打分 ? 用戶群對項(xiàng)目綜合評分 ? 基于這種定義,項(xiàng)目之間的相關(guān)性仍然可以采納余弦相似度和相關(guān)相似度等算法進(jìn)行度量 ? 用戶是否對項(xiàng)目 ti 感興趣,需要計(jì)算已知的相關(guān)項(xiàng)目與項(xiàng)目 ti 的綜合相似度 ? 項(xiàng)目之間的相似度不僅來源于共有相關(guān)用戶的數(shù)量,也來源于這些用戶對其喜好程度評分的相似性 ],[ ,2,1, nikiiii s c o rs c o rs c o rs c o rt ???用戶對項(xiàng)目的評價(jià) ? 用戶 u 對目標(biāo)項(xiàng)目 ti評分的估計(jì)方法有兩種 ? 權(quán)相加方法 Pu,i代表用戶 u對目標(biāo)項(xiàng)目 ti的評分估計(jì) Si,k代表用戶偏愛的已知項(xiàng)目 tk與項(xiàng)目 ti的協(xié)作相似性 Ru,k代表用戶 u對項(xiàng)目 tk的偏愛程度評分 ? 回歸方法 ???? ??i t e m ss i m i l ara l lk kii t e m ss i m i l ara l lk kukiiu SRSP , ,)(??? ??? ik RR改進(jìn)方法 ? 由于在大多數(shù)協(xié)作過濾系統(tǒng)中項(xiàng)目的更新比較慢,因此可以預(yù)先計(jì)算項(xiàng)目之間的相似性,從而提高推薦系統(tǒng)的效率 ? 一種方法是計(jì)算所有項(xiàng)目之間的相似性并進(jìn)行索引,這種方法的缺陷在于系統(tǒng)需要 的存儲空間 ? 一種方法是對每個(gè)項(xiàng)目 ,只保存最相似的 j個(gè)項(xiàng)目及其協(xié)作相關(guān)性, j 稱為模型尺寸 ? 模型尺寸的選擇對于過濾系統(tǒng)的性能有較大影響 ? 過大,則系統(tǒng)的預(yù)測能力很強(qiáng),但空間復(fù)雜度增大 ? 過小,則一些于目標(biāo)項(xiàng)目相似的項(xiàng)目可能沒有被考慮其中,從而降低過濾系統(tǒng)的預(yù)測性能 小結(jié) ? 基于內(nèi)容的信息過濾策略重點(diǎn)在于分析信息內(nèi)在的本質(zhì)規(guī)律,通過自然語言處理技術(shù)對知識的表示進(jìn)行深層理解,從而提高信息服務(wù)的精確性; ? 基于協(xié)作的信息過濾策略重點(diǎn)在于挖掘用戶的社會關(guān)系網(wǎng)絡(luò),探尋知識背景和信息需求相似的用戶,并在此基礎(chǔ)上實(shí)施信息多元化的交互,從而實(shí)現(xiàn)信息服務(wù)的拓展性和新穎性 ? 目前信息過濾領(lǐng)域的另一研究熱點(diǎn)是內(nèi)容與協(xié)作策略的融合,使信息過濾系統(tǒng)既能延續(xù)用戶指定的信息查詢路線精準(zhǔn)地獲取知識,又能挖掘相關(guān)于用戶的其它興趣偏好拓展知識獲取的領(lǐng)域。 本章小結(jié) ? 介紹了信息過濾的概念和需求 ? 介紹了信息過濾的體系結(jié)構(gòu) ? 介紹了信息過濾的方法