【正文】
表 55 禮品表( gifts) 字段名稱 字段類型 字段長度 可否為空 備注 ID NUMBER(20) 20 否 自增 ID,主鍵 NAME VARCHAR2(200) 200 否 禮品名稱 PICTURE VARCHAR2(200) 200 否 禮品圖片 地址 CLASSID NUMBER(20) 20 否 禮品所屬類別ID,外鍵依賴 禮品類別 表的 ID NUM NUMBER(12) 12 是 禮品數(shù)目 FLAG NUMBER(1) 1 否 是否處理標志, 0表示未處理, 1北京郵電大學(xué)研究生畢業(yè)論文 。 北京郵電大學(xué)研究生畢業(yè)論文 28 表 53 年齡表 (age) 字段名稱 字段類型 字段長度 可否為空 備注 ID NUMBER(20) 20 否 自增 ID,主鍵 VALUE VARCHAR2(20) 20 否 年齡段區(qū)間 NAME VARCHAR2(10) 10 否 年齡段名稱 節(jié)日場合表:表示贈送禮品的節(jié)日場合。 表 51 關(guān)系表 (relation) 字段名稱 字段類型 字段長度 可否為空 備注 ID NUMBER(20) 20 否 自增 ID,主鍵 NAME VARCHAR2(30) 30 否 關(guān)系名稱 興趣愛好表:表示收禮人的興趣愛好。 北京郵電大學(xué)研究生畢業(yè)論文 27 節(jié) 日 場 合 禮 品 表P K I DF K 2 O C C A T I O N I DF K 1 G I F T I D V A L U E收 禮 對 象 禮 品 表P K I DF K 2 R E C I P I E N T I DF K 1 G I F T I D V A L U E年 齡 表P K I D V A L U E N A M E禮 品 表P K I D N A M E P I C T U R E C L A S S I D F L A G L P I C T U R E W P I C T U R E V A L U E收 禮 人 類 型 表P K I D G E N D E R I DF K 1 A G E I DF K 3 R E L A T I O N I DF K 2 I N T E R E S T I D關(guān) 系 表P K I D N A M E興 趣 愛 好 表P K I D N A M E節(jié) 日 場 合 表P K I D N A M E T I M E 圖 51 禮品知識庫 ER 圖 如上圖所示,禮品知識庫 ER 圖。 通過調(diào)研將興趣劃分為:運動,旅游,書畫,音樂,閱讀,棋牌,居家,烹飪,營養(yǎng)品,探險,宅,影視,交際,游戲,時尚,購物,美容,舞蹈 等。針對年齡和興趣愛好新建表。 ( 2) 收禮人 /送禮人 收禮人 /送禮人個人信息包括年齡,性別和興趣愛好。 ( 1) 節(jié)日場合 節(jié)日場合表包括節(jié)日場合名稱和節(jié)日場合日期。收禮人指的是收禮人的個人信息,如年齡,性別,興趣愛好等。節(jié)日場合指的是送禮的節(jié)日和場合,如中秋節(jié),情人節(jié),結(jié)婚,喬遷新居等。 到此,已經(jīng)將結(jié)構(gòu)化的禮品信息存儲到了數(shù)據(jù)庫中。 3) 對淘寶頁面的 HTML 進行分析, 設(shè)計正則表達式進行抽取 由于淘寶的搜索結(jié)果的頁面布局是相同的, 設(shè)計 正則表達式對 頁面的內(nèi)容進行 抽取。 并將這些分類放到設(shè)計好的數(shù)據(jù)庫分類表中 。 禮品信息的 抓取按照如下步驟進行。 系統(tǒng)整體架構(gòu)描述了系統(tǒng)整體架構(gòu)設(shè)計圖,系統(tǒng)整體架構(gòu)設(shè)計圖從系統(tǒng)架構(gòu)和流程對系統(tǒng)進行了描述。系統(tǒng)整體模塊圖從系統(tǒng)整體方面對系統(tǒng)的功能模塊進行劃分和描述。 小結(jié) 本章 主要從系統(tǒng)整體功能和系統(tǒng)整體架構(gòu)兩方面 對系統(tǒng)設(shè)計進行了闡述。清單中只列出了 POJO 對象,每個 POJO 對象都有一個對應(yīng)的 DAO 對象, DAO 對象不再贅述。 表 52 包類結(jié)構(gòu)清單 類名 描述 BehaviorService 用戶行為記錄 業(yè)務(wù)邏輯 類,用于記錄用戶的行為 GiftInfoService 查看禮品詳細信息 業(yè)務(wù)邏輯 類,用戶查看禮品的詳細信息 GiftSimilarityService 禮品相似度推薦 業(yè)務(wù)邏輯 類,用戶禮品相似度推薦的業(yè)務(wù)邏輯實現(xiàn) OccationService 節(jié)日場合推薦 業(yè)務(wù)邏輯 類, 節(jié)日場合推薦的業(yè) 務(wù)邏輯實現(xiàn) PersonalService 收禮人描述推薦業(yè)務(wù)邏輯類,收禮人描述推薦的業(yè)務(wù)邏輯實現(xiàn) RecipientService 收禮人信息推薦業(yè)務(wù)邏輯類,收禮人信息推薦的業(yè)務(wù)邏輯實現(xiàn) SimilarityService 禮品關(guān)聯(lián)度推薦業(yè)務(wù)邏輯類,禮品關(guān)聯(lián)度推薦的業(yè)務(wù)邏輯實現(xiàn) ? 包 北京郵電大學(xué)研究生畢業(yè)論文 24 包中的類的描述如表 53。 系統(tǒng)類結(jié)構(gòu)說明 ? 包 包中的類的描述如表 51。 ? 包 存放系統(tǒng)的數(shù)據(jù)訪問邏輯。 ? 存放系統(tǒng)的表單。 ? 包 存放業(yè)務(wù)流程的控制邏輯。 ? 包 存放系統(tǒng)推薦的業(yè)務(wù)邏輯。 系統(tǒng)包結(jié)構(gòu)設(shè)計 圖 54 系統(tǒng)包組織結(jié)構(gòu)圖 如上圖所示,系統(tǒng)包組織結(jié)構(gòu)圖。禮品推薦要準確清晰地表達用戶的需求,因此需要設(shè)計 具有良好交互性的推薦 界面從不同方面描述用戶的需求,推薦模塊根據(jù)從用戶交互模塊采集的用戶需求查詢禮品知識庫,最終向用戶返回推薦結(jié)果。 利用 Lucene 全文檢索引擎工具包 將禮品庫中的禮品信息建立索引,與用戶日志一起為 禮品搜索提供個性化的搜索數(shù)據(jù)。 (2) 知識庫 與搜索 子系統(tǒng) 調(diào)研禮品贈送知識并構(gòu)建知識庫模型,禮品專家對禮品知識庫進行初始化。由于只抓取禮品信息,所以傳統(tǒng)的爬蟲已不太適用。系統(tǒng)共包括三個子系統(tǒng):網(wǎng)頁抓取子系統(tǒng)、知識庫與搜索子系統(tǒng)和推薦子系統(tǒng)。 5) 禮品瀏覽推薦 用戶瀏覽某個禮品的詳細信息時,系統(tǒng)同時向用戶推薦與此禮品基本信息最相似的禮品和瀏覽過此禮品的用戶瀏覽其它禮品次數(shù)中最多的禮品。 3) 收禮人描述推薦 系統(tǒng)根據(jù)收禮人的年齡,性別,愛好,職業(yè)等信息進行分類,并對每一類別從服飾特征,周末活動,個人偶像等方面進行描述,用戶根據(jù)對收禮 人的了解與描述進行匹配然后選擇,最后系統(tǒng)向用戶進行禮品推薦。 2) 收禮對象 推薦 用戶選擇收禮人的類別(如:老年人,中年人,男青年,女青年等),系統(tǒng)向用戶推薦適合該年齡段的禮品。 用戶交互模塊直接與用戶交互獲得用戶的需求并將用戶的需求量化成參數(shù)傳給推薦推理模塊,最后將推薦推理模塊返回的推薦結(jié)果展示給用戶。禮品搜索接受用戶交互模塊傳來的搜索關(guān)鍵字,然后 結(jié)合用戶的搜索日志分析用戶的偏好,最后將搜索的結(jié)果返回給用戶交互模塊。這四種推理方式分別接受用戶交互模塊傳來的參數(shù),經(jīng)過推理計算后將結(jié)果返回到用戶交互模塊。完善的知識庫為推薦推理模塊提供了推理和數(shù)據(jù)北京郵電大學(xué)研究生畢業(yè)論文 20 支持。 運行環(huán)境規(guī)定 設(shè)備支持 運行本系統(tǒng)的硬件設(shè)備建議滿足以下條件: 1. 處理器為奔三及以上 2. 內(nèi)存容量大于等于 512M 軟件 系統(tǒng) 支持 操作系統(tǒng): Windows , Linux 數(shù)據(jù)庫: Oracle 10g JDK 版本 : JDK 及以上版本 搜索開源包: Lucene 小結(jié) 本章主要 介紹個性化禮品推薦系統(tǒng)的需求分析 , 說明了 本 推薦 系統(tǒng)最終要實現(xiàn)的功能目標 和設(shè)計意圖 以及實現(xiàn)這些功能目標 對數(shù)據(jù)和用戶做的 一些約束與限制 , 詳細描述了系統(tǒng) 對功能 的需求 規(guī)定和對性能的需求規(guī)定,最后聲明 了系統(tǒng)的性能要求及運行環(huán)境要求 。 ? 其他性能要求 1) 保證系統(tǒng)的 可擴展性 北京郵電大學(xué)研究生畢業(yè)論文 18 系統(tǒng)采用流行框架,代碼和頁面分離,業(yè)務(wù)邏輯和數(shù)據(jù)庫操作分離,便于以后的數(shù)據(jù)庫更換和系統(tǒng)維護升級。 ? 故障處理要求 如果大量用戶同時 頻繁訪問數(shù)據(jù)庫,導(dǎo)致數(shù)據(jù)庫服務(wù)器癱瘓 ,需要 進一步 優(yōu)化數(shù)據(jù)庫緩存機制和索引。 ? 數(shù)據(jù)管理能力要求 所有禮品信息均從淘寶網(wǎng)上抓取,禮品 信息 要 隨時 進行更新 。 輸出 3: 該禮品的詳細信息,包括禮品圖片,禮品名稱,禮品商家,禮品價格等 。 輸出 2:匹配搜索關(guān)鍵字和用戶個性化需求的禮品信息搜索列表, 包括禮品圖片 ,禮品名稱,禮品 URL 等,每頁顯示 40個禮品,超過 40 個禮品進行分頁顯示 。如選擇節(jié)日場合,選擇收禮人的信息等 輸出 1: 滿足用戶需求的禮品信息推薦列表,包括禮品圖片 ,禮品名稱,禮品 URL 等 , 每頁顯示 40 個禮品,超過 40 個禮品進行分頁顯示 。 ? 時間特性要求 本系統(tǒng) 不僅 需要處理大量的知識庫數(shù)據(jù) ,還要保證禮品推薦的實時性, 因此從用戶選擇需求 并發(fā)送請求后 500ms 內(nèi)要 返回 用戶的推薦 結(jié)果 , 從用戶輸入搜索關(guān)鍵字并發(fā)送請求后 200ms 內(nèi)要返回用戶的搜索結(jié)果。 系統(tǒng)性能的需求規(guī)定 ? 精度要求 本系統(tǒng)要求 用戶根據(jù)自己的需求選擇節(jié)日場合,收禮人信息,搜索關(guān)鍵字等信息。例如,如果用戶多次用北京郵電大學(xué)研究生畢業(yè)論文 17 價格排序,說明禮品價格對用戶的購買行為影響較大,則系統(tǒng)搜索的時候優(yōu)先以價格排序。 6) 個性化 搜索 系統(tǒng) 根據(jù) 用戶的搜索日志 分析用戶的 偏好。 計 算 禮 品 類 別 相 似 度計 算 禮 品 商 家 相 似 度 計 算 禮 品 綜 合 相 似 度計 算 禮 品 價 格 相 似 度 e x t e n d s e x t e n d s e x t e n d s 完 善 禮 品 知 識 庫 e x t e n d s 圖 35 禮品知識庫完善 用例圖 如上圖所示,禮品知識庫完善 用例圖。 禮 品 專 家選 擇 適 宜 贈 送 的 節(jié) 日 場 合選 擇 適 宜 贈 送 的 收 禮 對 象 u s e s u s e s 保 存 節(jié) 日 場 合 知 識 庫保 存 收 禮 對 象 知 識 庫 e x t e n d s e x t e n d s 圖 34 禮品知識庫人工初始化用例圖 如上圖所示,人工初始化用例圖。調(diào)研禮品領(lǐng)域的知識并據(jù)此構(gòu)建禮品知識庫,將禮品知識庫以數(shù)據(jù)庫的形式來保存。每種人根據(jù)其特點對其類型進行劃分,并對該類型的收禮人 從圖片、服飾特點、周末活動、性格特征、興趣愛好和個人偶像來進行描述,用戶根據(jù)這些特征描述來選擇收禮人并獲得系統(tǒng)的推薦。 表 32 收禮人興趣愛好劃分 類別 興趣劃分 老人 運動,旅游,書畫,音樂,閱讀,棋牌,居家,烹飪,營養(yǎng)品 男人 運動,旅游,探險,宅男,音樂,書畫,影視,閱讀,交際,游戲 女人 時尚,購物,美容,運動,旅游,居家,烹飪,宅女,音樂,舞蹈,書畫,影視,閱讀 ,交際,探險 青年 運動,購物,時尚,影視,閱讀,交際,音樂,舞蹈,書畫,游北京郵電大學(xué)研究生畢業(yè)論文 15 戲 少年 運動,動畫,閱讀,舞蹈,書畫,游戲,玩具 嬰兒 玩耍,睡覺,洗澡,營養(yǎng)品 3) 基于收禮人描述的 推薦 當用戶對收禮人的個人信息無法完整的描述時可以通過基于收禮人描述的方法來獲得 禮品 推薦。如,贈送男人宜送領(lǐng)帶,錢包,商務(wù)包等;贈送女人宜送口紅,廚房用品等;贈送孩童宜送文具,卡通玩具等。 北京郵電大學(xué)研究生畢業(yè)論文 14 用 戶選 擇 收 禮 人 性 別 年 齡獲 得 收 禮 對 象 推 薦 u s e s u s e s e x t e n d s 選 擇 收 禮 人 興 趣 愛 好 e x t e n d s u s e s 獲 得 興 趣 愛 好 推 薦 e x t e n d s u s e s 圖 32 基