freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于分層的個性化推薦軟件系統(tǒng)項目可行性研究報告(留存版)

2025-06-26 23:36上一頁面

下一頁面
  

【正文】 plens,PHOAKS, Fab, Referral Web, CiteSeer等。 Webert,CiteSeer,WebMate,WebPersonalizer 等,它們根據(jù)資源與用戶興趣的相似性來過濾信息。個性化推薦系統(tǒng)的主要研究內(nèi)容和研究方向主要包括如下幾個方面:推薦技術(shù)研究:目前主要的推薦技術(shù)主要包括基于內(nèi)容的過濾和協(xié)同過濾兩種。還有兩項專利已通過實(shí)質(zhì)審查程序。承擔(dān)省部級的各類科技計劃項目有:序號科技計劃名稱項目名稱起 止年 月本人在項目組中的名次完 成情 況1江西省教委科技課題學(xué)生課程學(xué)習(xí)及素質(zhì)自適應(yīng)測評系統(tǒng)主持己完成2江西省自然科學(xué)基金并行(并發(fā))算法程序形式化開發(fā)方法研究主持完成(優(yōu))3國家自然科學(xué)基金實(shí)用的軟件形式化方法及其開發(fā)工具的研究第三結(jié)題4國家自然科學(xué)基金分劃遞推法應(yīng)用于高可靠Java程序開發(fā)方法研究第二結(jié)題5國家科技部社會公益研究項目鄱陽湖區(qū)洪澇災(zāi)害遙感動態(tài)監(jiān)測系統(tǒng) —與江西省氣象科學(xué)研究所合作省氣象局創(chuàng)新一等獎,國家氣象局科技二等獎6國家自然科學(xué)基金部分計值理論和應(yīng)用研究與上海交通大學(xué)合作主持結(jié)題7教育部科技重點(diǎn)項目程序優(yōu)化技術(shù)及其應(yīng)用研究主持結(jié)題8江西省自然科學(xué)基金并行(并發(fā))程序優(yōu)化理論研究主持結(jié)題9教育廳科技課題參數(shù)化智能搜索引擎主持結(jié)題陸旭,男,漢族,1962年12月出生,研究生學(xué)歷,博士研究生,高級工程師,江西財經(jīng)大學(xué)現(xiàn)代教育技術(shù)中心主任。 本系統(tǒng)J2EE架構(gòu)和Java語言實(shí)現(xiàn),支持多種軟硬件平臺,具有跨平臺無關(guān)性,具有良好的兼容性。(2) 在線部分:根據(jù)后臺得到的用戶興趣描述和層次文本分類器學(xué)習(xí)的參數(shù),由推薦引擎把已有的頁面和新增的頁面建立各用戶的推薦集,該推薦集的內(nèi)容具有層次結(jié)構(gòu)??梢哉f預(yù)處理過程是Web日志挖掘質(zhì)量保證的關(guān)鍵。如果cookie不可用,可以使用啟發(fā)式搜索的方法去識別用戶會話。但是,這些方法嚴(yán)重依賴用戶的合作和涉及到隱私法律的問題。所以,更多的情況是使用IP地址和Agent(瀏覽器)兩者作為用戶標(biāo)識,輔助一些啟發(fā)式規(guī)則。比如,在網(wǎng)上書店,一個用戶非??赡苓B續(xù)瀏覽幾種類型的書籍;或者用戶瀏覽新聞門戶網(wǎng)站時,連續(xù)瀏覽不同類型的新聞內(nèi)容。常用的模式發(fā)現(xiàn)的算法有:統(tǒng)計分析方法、關(guān)聯(lián)規(guī)則挖掘、路徑分析、序列模式發(fā)現(xiàn)、聚類和分類算法等。 聚類技術(shù)在Web使用挖掘中,主要是對具有相似特征的項進(jìn)行聚類,存在兩種類型的聚類:使用(用戶)聚類和頁面聚類。這些信息有助于對設(shè)計增加網(wǎng)上產(chǎn)品銷售的策略以及改進(jìn)用戶導(dǎo)航的便利性。文檔的特征項應(yīng)該具有以下特點(diǎn):特征項是能夠?qū)ξ臋n進(jìn)行充分表示的語言單位;文檔在特征項集合上的分布具有較為明顯的統(tǒng)計規(guī)律;特征項分離比較容易實(shí)現(xiàn),計算復(fù)雜度不太大。由于中文的詞條總數(shù)超過二十萬, 因此原始特征空間的維數(shù)將十分巨大,這種特征空間的高維性將直接帶來數(shù)據(jù)稀疏的問題。反之,如果對不同層次和不同類別分支建立不同的分類器,這種方法稱為局部法。在數(shù)據(jù)庫、文件服務(wù)器和各應(yīng)用系統(tǒng)如人事系統(tǒng)、財務(wù)系統(tǒng)等部署相關(guān)的系統(tǒng)安全代理服務(wù),實(shí)現(xiàn)基于多層安全代理的網(wǎng)絡(luò)資源訪問控制。組件開發(fā)商可以在方法級別上指定某個組件的安全要求,從而確保只有擁有合法權(quán)益的用戶能夠訪問特定的數(shù)據(jù)操作。在JSP文件被傳送到客戶端之前,其語法在服務(wù)器端被解析,腳本程序被轉(zhuǎn)換為Servlet進(jìn)行處理,所產(chǎn)生的Servlet將生成動態(tài)的HTML數(shù)據(jù)并發(fā)送到客戶端顯示。它提供了一個多層次的分布式應(yīng)用模型和一系列開發(fā)技術(shù)規(guī)范。重要的是,基于對系統(tǒng)的跨平臺運(yùn)行特性、整個系統(tǒng)合理的架構(gòu)要求、后臺數(shù)據(jù)庫需要提供數(shù)據(jù)管理和控制服務(wù)、數(shù)據(jù)的標(biāo)準(zhǔn)化安全訪問、系統(tǒng)的安全和可靠等多方面的考慮,我們運(yùn)用分層體系結(jié)構(gòu)的設(shè)計思想,采用當(dāng)今流行的J2EE結(jié)構(gòu)作為本系統(tǒng)體系結(jié)構(gòu)的基礎(chǔ)。它將數(shù)據(jù)庫的API從標(biāo)準(zhǔn)JDBC調(diào)用轉(zhuǎn)換為本地調(diào)用,影響了JDBC的平臺獨(dú)立性。所選用的驅(qū)動程序?qū)⒂绊懴到y(tǒng)的性能與功能。在基于J2EE的軟件系統(tǒng)中,用戶使用客戶端的瀏覽器或直接從客戶端應(yīng)用程序發(fā)出一個請求,通過Internet傳送到中間層的Web容器或EJB容器上進(jìn)行預(yù)處理,由中間層的EJB容器轉(zhuǎn)換為數(shù)據(jù)庫請求格式后再交由EIS層的數(shù)據(jù)庫系統(tǒng)或應(yīng)用系統(tǒng)處理。正是由于J2EE的開放性,使得有的廠商能夠以一種和EJB平行的方式來達(dá)到同樣的目的。多層次分布式應(yīng)用模型是指根據(jù)功能把應(yīng)用邏輯分成多個層次,每個層次支持相應(yīng)的服務(wù)器和組件,組件在分布式服務(wù)器的組件容器中運(yùn)行(如Servlet組件在Servlet容器上運(yùn)行,EJB組件在EJB容器上運(yùn)行),容器間通過相關(guān)的協(xié)議進(jìn)行通信,實(shí)現(xiàn)組件間的相互調(diào)用。與其它的開發(fā)平臺相比,J2EE具有明顯的優(yōu)勢,它支持一個簡化的基于組件的開發(fā)模型和對組件化開發(fā)的支持。在我們的推薦系統(tǒng)中,把收集到的網(wǎng)頁隨機(jī)抽取一部分網(wǎng)頁為訓(xùn)練集,這些網(wǎng)頁用于分類器訓(xùn)練參數(shù),同時需要不斷更新訓(xùn)練集的網(wǎng)頁,網(wǎng)頁的訓(xùn)練在系統(tǒng)離線進(jìn)行。下面的內(nèi)容我們將重點(diǎn)闡述國內(nèi)外的層次文本分類器現(xiàn)狀。 特征降維特征降維也稱維數(shù)約簡。分類器測試網(wǎng)頁分類器學(xué)習(xí)網(wǎng)頁預(yù)處理特征降維文本表示圖 網(wǎng)頁分類器總體結(jié)構(gòu)圖 網(wǎng)頁預(yù)處理為保證網(wǎng)頁分類任務(wù)能夠快速有效地執(zhí)行,必須進(jìn)行網(wǎng)頁預(yù)處理,其主要是指將網(wǎng)頁轉(zhuǎn)化為適合網(wǎng)頁分類系統(tǒng)處理的中間形式并濾除與任務(wù)不相關(guān)的冗余特征。 依賴性建模依賴性建模是另一種數(shù)據(jù)挖掘中有用的模式發(fā)現(xiàn)方法,其目標(biāo)是開發(fā)出一種能表達(dá)Web領(lǐng)域中各種變量之間的顯著依賴性的模型。目前存在兩種用于提取序列模式的方法:基于關(guān)聯(lián)規(guī)則的挖掘方法;樹結(jié)構(gòu)的使用和Markov鏈表示的瀏覽模式。最為著名的是WAPtree(Web Access Pattern Tree)結(jié)構(gòu)來記錄訪問序列。解決的辦法類似于用戶識別的方法。l 多服務(wù)器會話/單用戶:某用戶在同一機(jī)器上打開多個瀏覽器窗口,同時訪問Web站點(diǎn)的不同部分,或打開不同的瀏覽器進(jìn)行訪問,將產(chǎn)生單個用戶的多個服務(wù)器會話。在一些情況下,代理服務(wù)器端的瀏覽數(shù)據(jù)收集十分類似于服務(wù)器端的收集。服務(wù)器日志文件描述了多用戶/單站點(diǎn)的瀏覽行為,客戶日志文件通常給出了單用戶/多站點(diǎn)的用戶瀏覽行為,代理服務(wù)器日志文件跟蹤多用戶/多站點(diǎn)的使用行為。在Web使用挖掘中,數(shù)據(jù)預(yù)處理的目標(biāo)是將包含在多種數(shù)據(jù)源中的信息轉(zhuǎn)化為適合數(shù)據(jù)挖掘和模式發(fā)現(xiàn)所必需的數(shù)據(jù)抽象概念,然后在事務(wù)數(shù)據(jù)庫上實(shí)施挖掘算法,以期最終獲得有價值的規(guī)律。采用struts顯示/邏輯/數(shù)據(jù)處理分離的三層技術(shù)架構(gòu)模型,應(yīng)用Java語言,結(jié)合Jsp、servlet、Javabean、XML等技術(shù)構(gòu)建整個個性化推薦系統(tǒng)。 本系統(tǒng)的用戶行為模式的分析機(jī)制是基于具有偏序關(guān)系的層次結(jié)構(gòu)圖來設(shè)計的,可以有效地刻畫用戶的類別屬性。獲得省部級科技進(jìn)步三等獎以上3項。公司有一支由總經(jīng)理帶隊,各專業(yè)協(xié)作的科研隊伍。中國國家數(shù)字圖書館和超星數(shù)字圖書館推出了針對讀者的個性化推薦系統(tǒng)?;谝?guī)則的系統(tǒng)如:IBM的WebSphere (),BroadVision(),ILOG()等,它們允許系統(tǒng)管理員根據(jù)用戶的靜態(tài)特征和動態(tài)屬性來制定規(guī)則,一個規(guī)則本質(zhì)上是一個IfThen語句,規(guī)則決定了在不同的情況下如何提供不同的服務(wù)。于是David Goldberg等人定義了用于這種目的的過濾器。我們運(yùn)用層次分類的思想來反映用戶的興趣和愛好,這樣更加符合客觀世界中事物的聯(lián)系、人們的思維習(xí)慣和分類學(xué)的科學(xué)原理。從應(yīng)用的角度來看,希望基于上述的理論研究,構(gòu)建分層的個性化推薦系統(tǒng),該系統(tǒng)具有以下特點(diǎn):(1) 能夠較為客觀反映用戶瀏覽網(wǎng)頁的行為模式,用分層的思想來刻畫各種類別用戶群的興趣和愛好;(2) 能夠提供基于層次化用戶個人興趣的、具有層次類別的內(nèi)容的個性化推薦系統(tǒng)。建模基于超鏈的拓?fù)浣Y(jié)構(gòu),這些結(jié)構(gòu)具有或者沒有鏈接描述。個性化推薦系統(tǒng)的關(guān)鍵是建立用戶模型。推薦系統(tǒng)不但根據(jù)用戶以往的歷史紀(jì)錄,更需要結(jié)合當(dāng)前一段時間的行為動作做出實(shí)時地反應(yīng),并根據(jù)與用戶交互的反饋結(jié)果修正和優(yōu)化其推薦結(jié)果。多媒體信息挖掘,主要是指通過對Web上的圖像、音頻和視頻進(jìn)行處理,應(yīng)用存儲和搜索技術(shù)與標(biāo)準(zhǔn)的數(shù)據(jù)挖掘方法的集成,對其中潛在的、有意義的信息和模式進(jìn)行發(fā)掘的過程。然而,因特網(wǎng)中分布傳播的海量電子化文本所顯現(xiàn)出的種類多樣、分布不均勻、關(guān)系復(fù)雜、更新頻繁及標(biāo)注困難等新的特征,給近年來面向互聯(lián)網(wǎng)海量信息處理需求的文本分類帶來了巨大挑戰(zhàn),非線性、數(shù)據(jù)集分布不均、標(biāo)注瓶頸、多層分類、算法的擴(kuò)展性及Web頁分類等問題是目前文本分類研究的關(guān)鍵問題。(4) 建立基于本項目理論基礎(chǔ)的個性化推薦產(chǎn)品,以此為契機(jī),可以大力推進(jìn)我省、我市基于電子商務(wù)和電子政務(wù)平臺的個性化信息服務(wù)軟件產(chǎn)業(yè)的進(jìn)步與發(fā)展。一種改進(jìn)方案是由用戶指定一個過濾器,然后郵件系統(tǒng)根據(jù)每個用戶指定的過濾器來搜索整個郵件列表,提供用戶感興趣的郵件。很多網(wǎng)站,如Microsoft、AOL、Yahoo、CNN、IBM等,均推出了個性化功能;很多電子商務(wù)網(wǎng)站也注意到了個性化服務(wù)的巨大商機(jī),如Amazon、Ebay、Best Buy都推出了個性化服務(wù)功能。門戶網(wǎng)站新浪網(wǎng)推出了個性化的推薦系統(tǒng)。在電子政務(wù)領(lǐng)域?yàn)榭蛻籼峁┚哂懈叨劝踩?、?shí)用性以及滿足海量數(shù)據(jù)應(yīng)用的電子政務(wù)信息平臺;為企業(yè)客戶提供ERP、CRM、網(wǎng)絡(luò)辦公自動化、企業(yè)電子商務(wù)門戶建設(shè)等方面在內(nèi)的多行業(yè)企業(yè)信息化解決方案。擁有一支由計算機(jī)軟件碩士十余人組成的專業(yè)軟件研究開發(fā)團(tuán)隊。主持212現(xiàn)代服務(wù)業(yè)科技發(fā)展專項規(guī)劃戰(zhàn)略研究報告,省科技廳軟科學(xué)項目,2005年主要成員213基于WEB的學(xué)分制綜合管理信息系統(tǒng),江西省教育廳科技項目,2006年主持14基于多層安全代理的集成訪問控制系統(tǒng),南昌市科技計劃項目,2006年9月立項?;诜謱拥钠钚《藗€性化內(nèi)容推送偏最小二乘回歸方法主要的研究焦點(diǎn)是多因變量對多自變量的回歸建模,它與普通多元回歸方法在思路上的主要區(qū)別是它在回歸建模過程中采用了信息綜合與篩選技術(shù)。Web日志的格式一般有通用日志格式(Common Log Format)、擴(kuò)展日志格式(Extended Log Format)。 數(shù)據(jù)源分析Web使用挖掘使用的數(shù)據(jù)主要來自Web服務(wù)器(Web Server)、代理服務(wù)器(Proxy Server)和Web客戶端(Web Client)。因?yàn)樯婕胺?wù)器應(yīng)用的版權(quán)等一系列問題,這種方法也并不可行。因此,在同一時間段內(nèi)可能有許多不同用戶通過同一代理服務(wù)器存取同一網(wǎng)站。規(guī)定了兩個連續(xù)點(diǎn)擊間的最大時間間隔??梢园秧撁鎯?nèi)容的分類作為一個附加步驟,從而加強(qiáng)Web日志的信息。 序列模式挖掘技術(shù)序列模式挖掘目的是從大量的序列數(shù)據(jù)中發(fā)現(xiàn)頻繁的子序列。其它各式各樣的圖都是建立在頁面和頁面之間的聯(lián)系或一定數(shù)量的用戶瀏覽頁面順序基礎(chǔ)之上的。因特網(wǎng)中分布傳播的海量電子化文本所顯現(xiàn)出的種類多樣、分布不均勻、關(guān)系復(fù)雜、更新頻繁及標(biāo)注困難等新的特征,給近年來面向互聯(lián)網(wǎng)海量信息處理需求的文本分類帶來了巨大挑戰(zhàn),非線性、數(shù)據(jù)集分布不均、標(biāo)注瓶頸、多層分類、算法的擴(kuò)展性及Web頁分類等問題是目前文本分類研究的關(guān)鍵問題。這樣,一個文檔就映射到一個N維的空間。常用的特征選擇和特征抽取算法在不同的情況下互有高低或者相當(dāng),不同的分類器也傾向于接受不同的算法,對于刻畫維數(shù)約簡還有沒有標(biāo)準(zhǔn)的評價標(biāo)準(zhǔn)。測試集是為了微調(diào)分類器的參數(shù);用分類器對測試集進(jìn)行分類,得到分類的結(jié)果。實(shí)踐證明,SUN公司推出的J2EE技術(shù)規(guī)范,以其“先進(jìn)、安全、穩(wěn)定、可靠”的特點(diǎn)迅速成為了實(shí)施電子政務(wù)和電子商務(wù)的行業(yè)標(biāo)準(zhǔn)。所以,利用Java獨(dú)立于硬件配置和操作系統(tǒng)的特點(diǎn)使得我們的信息發(fā)布系統(tǒng)具有更好的系統(tǒng)兼容性,用戶也可以經(jīng)任意操作平臺上便捷訪問信息發(fā)布系統(tǒng),極大地方便了系統(tǒng)開發(fā)設(shè)計人員、系統(tǒng)維護(hù)人員和用戶。EJB規(guī)范定義了EJB組件在何時如何與它們的容器進(jìn)行交互作用。J2EE提供了一個多層結(jié)構(gòu)的、分布式的應(yīng)用程序模型,具有重用組件的能力、基于擴(kuò)展標(biāo)記語言(XML)的數(shù)據(jù)交換能力、統(tǒng)一的安全模式和靈活的事務(wù)控制能力。J2EE核心技術(shù)主要包括JDBC、分布通信技術(shù)、Java Bean、JSP、EJB、Servlet和XML等,JSP、EJB和Servlet在前面我們已經(jīng)介紹,以下為我們簡單介紹系統(tǒng)其它四種技術(shù)。(3)JDBCnetwork bridge:不需要客戶端數(shù)據(jù)庫驅(qū)動程序,它使用網(wǎng)絡(luò)上的中間服務(wù)器來存取數(shù)據(jù)庫。J2EE定義了一個典型的四層結(jié)構(gòu),分別是客戶層、Web層、商業(yè)邏輯層和企業(yè)信息系統(tǒng)層。Web容器為應(yīng)用系統(tǒng)的表示層邏輯組件Servlet/JSP提供了運(yùn)行環(huán)境:EJB容器為應(yīng)用系統(tǒng)的業(yè)務(wù)邏輯組件EJB提供了運(yùn)行環(huán)境。一般來說Servlet是一種小型的Java程序,它擴(kuò)展了Web服務(wù)器的功能。Java以其完全面向?qū)ο蟮脑O(shè)計風(fēng)格和良好的平臺無關(guān)性,已經(jīng)超越了語言木身的功能,成為了開發(fā)Web應(yīng)用的理想平臺。 在推薦系統(tǒng)的推薦引擎中,如何運(yùn)用偏最小二乘原理,在參照多類文本分類模型MPLC模型的基礎(chǔ)上,構(gòu)建新的模型來解決大規(guī)模數(shù)據(jù)集的層次文本分類問題是我們突破的關(guān)鍵。兩種方法各有利弊。特征選擇又稱獨(dú)立評估法,依據(jù)某個評價函數(shù)從原始特征集中選擇一部分最能反映類別的統(tǒng)計特性的相關(guān)特征,評價函數(shù)用來度量文本分類中詞的重要程度,目的是濾除攜帶信息量較少的詞,只保留對分類貢獻(xiàn)大的詞,其理論大多數(shù)建立在統(tǒng)計和信息論基礎(chǔ)上。網(wǎng)頁分類中文檔的表示方法大多數(shù)是從信息檢索(IR)領(lǐng)域借鑒過來的,其中最為著名的就是向量空間模型(Vector Space Model, VSM)。自動文本分類技術(shù)的研究目標(biāo)就是實(shí)現(xiàn)文本分類的自動化,以達(dá)到降低分類成本、提高分類效率和改善分類性能等目的。上述兩類應(yīng)用都能根據(jù)用戶的詢問或過去所需信息的歷史生成靜態(tài)或動態(tài)HTML,從而向用戶推薦相關(guān)的超鏈接。這方面的內(nèi)容有對頻繁訪問頁、單位時間訪問頁、網(wǎng)站時間訪問分布、用戶興趣、頁面訪問瀏覽時間、平均瀏覽路
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1