freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

web信息自動(dòng)推薦系統(tǒng)設(shè)計(jì)畢業(yè)論文(編輯修改稿)

2025-07-17 12:58 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 JDBC不但提供了標(biāo)準(zhǔn)的API連接數(shù)據(jù)源,而且還為數(shù)據(jù)庫(kù)互生產(chǎn)廠家提供了標(biāo)準(zhǔn)的驅(qū)動(dòng)程序,使得用戶可方便地使自己的Java應(yīng)用程序與數(shù)據(jù)庫(kù)互相通信。JDBC最大的特點(diǎn)是:對(duì)下,JDBC封裝了各種底層數(shù)據(jù)源之間的差異;對(duì)上,JDBC提供標(biāo)準(zhǔn)的SQL界面。這使得上層應(yīng)用對(duì)底層數(shù)據(jù)源的訪問完全透明,大大地簡(jiǎn)化了訪問底層數(shù)據(jù)源的復(fù)雜性,真正做到了無障礙溝通。 JDBC數(shù)據(jù)訪問模型Sun公司定義了4種數(shù)據(jù)庫(kù)驅(qū)動(dòng)程序類型,它們分別是:(1) 本地API部分Java驅(qū)動(dòng)程序(2) JDBCNet純Java驅(qū)動(dòng)程序(3) 本地協(xié)議Java驅(qū)動(dòng)程序(4) JDBCODBC橋驅(qū)動(dòng)程序在本論只介紹使用廣泛的模型即本地API部分Java驅(qū)動(dòng)程序,這種驅(qū)動(dòng)程序?qū)DBC的命令轉(zhuǎn)換成數(shù)據(jù)管理系統(tǒng)指定的本地調(diào)用,然后由本地調(diào)用直接操作數(shù)據(jù)庫(kù)(如圖3所示)。這種兩層模型比JDBCODBC橋驅(qū)動(dòng)程序要快,但是每個(gè)客戶端需要裝載必要的文件。現(xiàn)在大多數(shù)的數(shù)據(jù)庫(kù)廠商都在其數(shù)據(jù)庫(kù)中提供該驅(qū)動(dòng)程序。本系統(tǒng)使用的是MySQL數(shù)據(jù)庫(kù)。 MySQL提供的驅(qū)動(dòng)程序稱為Connect/J,:。[10] 基于B/S模型的Web應(yīng)用程序(1) 定義:動(dòng)態(tài)的網(wǎng)頁(yè)有著網(wǎng)頁(yè)的外觀,而實(shí)質(zhì)上是建立在B/S模型上的服務(wù)器Web應(yīng)用程序。也就是說,一幅瀏覽器端的顯示的網(wǎng)頁(yè),是一段服務(wù)器程序運(yùn)行的結(jié)果。所以應(yīng)該從編程的角度理解、構(gòu)思網(wǎng)頁(yè)的結(jié)構(gòu)和功能。Java運(yùn)行環(huán)境廠商專用API數(shù)據(jù)庫(kù)Data baseJava應(yīng)用程序JDBC驅(qū)動(dòng)程序圖3 本地API部分Java驅(qū)動(dòng)程序(2) 工作原理:WWW(World Wide Web)技術(shù)作為Internet 上信息資源共享的解決方案,它是構(gòu)建在瀏覽器/服務(wù)器(B/S)模型以及HTTP的基礎(chǔ)上的,其運(yùn)作模式可以描述為:請(qǐng)求處理應(yīng)答。B/S模型的構(gòu)成及關(guān)系示意圖,如圖4所示。從瀏覽器提交的請(qǐng)求通過Web服務(wù)器給應(yīng)用程序服務(wù)器,由它調(diào)用相關(guān)的網(wǎng)頁(yè)應(yīng)用程序進(jìn)行處理,處理結(jié)果——網(wǎng)頁(yè)交給Web服務(wù)器,Web服務(wù)器把這個(gè)網(wǎng)頁(yè)作為請(qǐng)求的應(yīng)答發(fā)送給瀏覽器。至于對(duì)提交的信息如何處理,就交由網(wǎng)站的開發(fā)人員編寫相關(guān)的網(wǎng)頁(yè)應(yīng)用程序來決定反饋到瀏覽器的內(nèi)容;如果需要對(duì)數(shù)據(jù)庫(kù)進(jìn)行訪問,開發(fā)人員還可以利用應(yīng)用程序服務(wù)器所提供的接口對(duì)其進(jìn)行操作。如前所示,網(wǎng)頁(yè)內(nèi)容的動(dòng)態(tài)發(fā)布是Web應(yīng)用程序的主要實(shí)現(xiàn)方法,通常這種方法同服務(wù)器端提供的WWW服務(wù)技術(shù)密不可分。一般來說,在Internet服務(wù)器上可以通過多種途徑實(shí)現(xiàn)動(dòng)態(tài)發(fā)布,最常見的技術(shù)包括JSP、CGI、ISAPI和ASP等。JSP的運(yùn)行模式,如何在B/S模型上動(dòng)作的?圖5所示即為JSP運(yùn)作原理模型。,觸發(fā)JSP引擎。JSP引擎首先檢查JSP文件是否修改過,如果是則將其轉(zhuǎn)換成Java Servlet源程序,再由Servlet引擎運(yùn)行該文件,最后將運(yùn)行結(jié)果返回Web服務(wù)器,Web服務(wù)器將其返回瀏覽如果沒修改,則直接運(yùn)行。Web服務(wù)器Web應(yīng)用程序1Web應(yīng)用程序2數(shù)據(jù)庫(kù)URL地址及參數(shù)表單提交的請(qǐng)求請(qǐng)求交由應(yīng)用程序服務(wù)器分析處理處理的結(jié)果Web頁(yè)返回Web服務(wù)器應(yīng)用程序服務(wù)器如需訪問數(shù)據(jù)庫(kù)則由DBMS處理將Web頁(yè)反饋至瀏覽器返回訪問結(jié)果服務(wù)器端圖4 B/S模型示意圖瀏覽器1瀏覽器2瀏覽器端……Web服務(wù)器Web應(yīng)用程序1Web應(yīng)用程序2數(shù)據(jù)庫(kù)URL地址及參數(shù)表單提交的請(qǐng)求請(qǐng)求交由應(yīng)用程序服務(wù)器分析處理處理的結(jié)果Web頁(yè)返回Web服務(wù)器應(yīng)用程序服務(wù)器如需訪問數(shù)據(jù)庫(kù)則由DBMS處理將Web頁(yè)反饋至瀏覽器返回訪問結(jié)果服務(wù)器端瀏覽器1瀏覽器2瀏覽器端……圖5 JSP的運(yùn)作模式 Google Web APIGoogle Web API 是Google公司推出Web搜索引擎專用的API。該API能使開發(fā)者通過自己的電腦程序從Google搜索引擎查詢20多億份Web文檔。開發(fā)者可以在他們最熟悉的環(huán)境編程,包括Java、Perl或VisualStudio.Net等將Google的搜索功能嵌入到他們的應(yīng)用程序當(dāng)中。目前,Google的API還是處于Beta測(cè)試階段,因此,在API的使用上還有一些限制。例如,使用這些API需要申請(qǐng)一個(gè)帳號(hào)。對(duì)于免費(fèi)申請(qǐng)的帳號(hào),為了防止開發(fā)人員不正當(dāng)?shù)氖褂茫拗泼總€(gè)帳號(hào)、每天最多只能查詢1000次。目前,Google還沒有提出正式的運(yùn)營(yíng)模式和收費(fèi)方式。 Google Web API目前主要提供三種服務(wù),分別如下: (1) 搜索服務(wù)。用戶提交一個(gè)搜索內(nèi)容請(qǐng)求,Google服務(wù)器將查找超過20億的網(wǎng)頁(yè)內(nèi)容,并且將滿足用戶需求的目標(biāo)返回給用戶,一般來說這種處理只需要幾秒的時(shí)間。 (2) 緩存服務(wù)(Cache)。用戶提交一個(gè)URL,Google服務(wù)器將返回搜索器訪問該URL的最新記錄。這樣,用戶很容易復(fù)用Google的搜索成果。(3) 拼寫檢查。該功能用于檢查用戶的查詢請(qǐng)求是否有效。用戶提交一個(gè)檢查內(nèi)容,Google服務(wù)器將返回有效的、最接近該內(nèi)容的查詢請(qǐng)求,返回的查詢請(qǐng)求將符合Google的查詢規(guī)則。Google為了提高開發(fā)人員的開發(fā)效率,提供了一套基于Java的API,用于直接訪問Google服務(wù)器。該API 包主要包括如下幾個(gè)類: GoogleSearch :該類封裝了對(duì)于Google服務(wù)器的訪問,支持搜索和緩存(cache)功能。 GoogleSearchDirectoryCategory :表示Google中的一個(gè)分類目錄 GoogleSearchFault :該類為Exception的一個(gè)子類,用于表示API使用的錯(cuò)誤。 GoogleSearchResult :該類封裝了搜索的結(jié)果。 GoogleSearchResultElement:該類表示搜索結(jié)果中的每一條記錄。 如下是一個(gè)例子的源代碼,用于一個(gè)簡(jiǎn)單查詢,查詢請(qǐng)求為” 信息搜索、系統(tǒng)開發(fā)”,查詢的帳號(hào)為”k3Cvh5FQFHJMaD5rwwgIwYSNhpNaQ/tz ”。該例子將把查詢結(jié)果打印出來。如果用戶需要近一步解析查詢結(jié)果,可以使用 GoogleSearchResult和GoogleSearchResultElement類。//利用Google Web API的“搜索服務(wù)”功能來實(shí)現(xiàn)的import .*。 import .*。 public class GoogleAPITest { public static void main(String[] args) { String clientKey= k3Cvh5FQFHJMaD5rwwgIwYSNhpNaQ/tz 。 //注冊(cè)的API查詢帳號(hào)String query=信息搜索、系統(tǒng)開發(fā)。 // 創(chuàng)一個(gè)查詢關(guān)鍵字GoogleSearch s = new GoogleSearch()。 (clientKey)。 try { (query)。 GoogleSearchResult r = ()。 (查詢結(jié)果顯示如下:+())。 } catch (GoogleSearchFault f) { (訪問Google Web APIs 失敗:+())。 } } }//程序結(jié)束Google 搜索引擎提供了搜索、緩存和拼寫簡(jiǎn)單功能, Google還提供了Java API,這也大大提高了Java程序員的開發(fā)效率。隨著搜索內(nèi)容、形式的豐富,更多的開發(fā)人員可以將這種技術(shù)運(yùn)用在自己應(yīng)用程序中,擴(kuò)展應(yīng)用程度的功能。 3 要解決的幾個(gè)關(guān)鍵問題 研究設(shè)計(jì)中要解決的問題(1) 理解向量空間模型的原理,掌握向量空間模型的實(shí)現(xiàn)方法。向量空間模型(Vector Space Model,簡(jiǎn)稱VSM)是將用戶特征信息也作文檔。一篇文檔被定義一系列的組合,每個(gè)詞被賦與一個(gè)權(quán)值以表明它對(duì)這篇文檔的重要性。采用學(xué)習(xí)方法判斷文檔和用戶特征的相似度,將文檔信息匹配轉(zhuǎn)化為向量空間中的向量相配問題。向量空間模型具有自然語言界面,易于使用,已被人們普遍認(rèn)為是一種非常有效的檢索模型。其實(shí)現(xiàn)原理在下一章介紹。(2) 根據(jù)用戶興趣信息的內(nèi)容(注冊(cè)、修改、刪除等方式)。通過Web網(wǎng)站給用戶注冊(cè)、修改、刪除,來獲得用戶的興趣信息,并提取用戶特征向量值。(3) 利用搜索引擎檢索與用戶興趣相關(guān)的Web信息。通過Google Web API所提供的接口進(jìn)行搜索與用戶相關(guān)的興趣信息,并存入數(shù)據(jù)庫(kù)。(4) 建立與用戶興趣相關(guān)的向量空間模型,然后利用向量空間模型檢索出用戶比較感興趣的信息。即從數(shù)據(jù)庫(kù)中提取搜索引擎檢索的結(jié)果,然后建立向量模型,并與用戶興趣信息的向量進(jìn)行匹配,顯示出用戶比較感興趣的信息。 具體實(shí)現(xiàn)中采用的關(guān)鍵技術(shù)及復(fù)雜性分析(1) 系統(tǒng)實(shí)現(xiàn)的所用的開發(fā)語言與開發(fā)工具都是比較流行的,但同時(shí)也增加了開發(fā)難度。(2) 本系統(tǒng)中最為困難的是建立文檔向量與用戶特征向量,而建立文檔向量與用戶特征向量的基礎(chǔ)是提取關(guān)鍵詞也就是說對(duì)其進(jìn)行中文分詞,而中文分詞是一種復(fù)雜技術(shù),在本系統(tǒng)中我們采用ICTCLAS分詞系統(tǒng)。具體的我們將在下一章中介紹。 4系統(tǒng)結(jié)構(gòu)與模型 基于向量空間模型的信息自動(dòng)推薦系統(tǒng)設(shè)計(jì)向量空間模型(Vector Space Model,簡(jiǎn)稱VSM)是將用戶特征信息也作文檔。一篇文檔被定義一系列的組合,每個(gè)詞被賦與一個(gè)權(quán)值以表明它對(duì)這篇文檔的重要性。采用學(xué)習(xí)方法判斷文檔和用戶特征的相似度,將文檔信息匹配轉(zhuǎn)化為向量空間中的向量相配問題。向量空間模型具有自然語言界面,易于使用,已被人們普遍認(rèn)為是一種非常有效的檢索模型。[11] 向量空間模型在自動(dòng)推薦信息服務(wù)系統(tǒng)中的應(yīng)用基于向量空間模型的自動(dòng)推薦信息服務(wù)系統(tǒng)主要包括三個(gè)方面:(1) 文檔向量表示概念1 文檔D(Document):泛指文檔或文檔中的一個(gè)片段(如文檔中的標(biāo)題、摘要、正文等)。概念2 特征關(guān)鍵詞T(Term):指出現(xiàn)在文檔中能夠代表文檔性質(zhì)的基本語言單位(如字、詞等)。設(shè)文檔D是一個(gè)包含n篇Web文檔的集合,D={d1,…di…,dn},i=1,2,…,n,文檔集合中的任一文檔di可以表示為特征關(guān)鍵詞空間中的一個(gè)m維向量di=(ti1,…,tij…,tim), i=1,2,…,n。j=1,2,…,m。其中tij為文檔di的第j個(gè)特征關(guān)鍵詞分量。文檔向量有幾種表示:1,第j個(gè)關(guān)鍵詞屬于di1. 簡(jiǎn)單的二值向量表示0,第j個(gè)關(guān)鍵詞不屬于didij= 2. 基于詞頻的表示tij,第j個(gè)關(guān)鍵詞在文檔di中出現(xiàn)的次數(shù)0,第j個(gè)關(guān)鍵詞不屬于didij= 3. 基于tfidf的特征提取表示Dij=tijlog2(n/nj) 其中:Tij是關(guān)鍵字ti在文檔中的倒置頻次,n是文檔數(shù)據(jù)庫(kù)存中文檔總數(shù),nj是文檔數(shù)據(jù)庫(kù)中含有關(guān)鍵詞tj 的文檔數(shù)。(2) 用戶特征向量的表示在基于向量空間模型的自動(dòng)推薦系統(tǒng)中,用戶的特征文件(User profile),即對(duì)用戶興趣信息的描述,是以自然語言來表示的,采用表示文檔向量的方法來表示用戶特征向量。P=(u1,u2, …,um),其中ui 表示權(quán)值。還可以按照傳統(tǒng)的表示法,以(字項(xiàng),權(quán)值)對(duì)來表示向量。P=((y1, u1),(y2, u2), …, (ym, um))。其中(yi, ui)表示字項(xiàng)yi 的權(quán)值是ui 。例如:某一用戶的特征向量可以表示為P=((“信息系統(tǒng)”,),(“檢索”,))。(3) 文檔與用戶特征相似度系數(shù)的計(jì)算衡量一篇文檔的向量表示與用戶特征向量表示的相似度,也就是判斷某篇文檔是否滿用戶的個(gè)性興趣通常用求兩個(gè)向量的余弦值的內(nèi)積或夾角θ的余弦來表示,由于用戶特征也可以在同一空間里表示為一個(gè)用戶特征向量(見圖6)。θ文檔D(t1,…,ti…,tm)用戶特征P(p1,p2,…pm)特征項(xiàng)3特征項(xiàng)2特征項(xiàng)1圖6 文檔VSM及相似度Sim(D, P)假如D=(t1,…,ti…,tm)表示文檔向量,P=(p1,p2,…pm)表示用戶特征向量,計(jì)算這兩個(gè)向量相似度可以對(duì)兩個(gè)向量進(jìn)行余弦規(guī)范化處理,再運(yùn)用內(nèi)積公式計(jì)算兩個(gè)向量之間夾角的余弦,這種相似度的方法常被為“余弦相似度”方法來實(shí)現(xiàn)(見公式1)。當(dāng)兩向量相同時(shí),相似度1,當(dāng)向量不存在相同的項(xiàng)時(shí),相似度為0,兩向量夾角θ的余弦值越大,說明檢索的結(jié)果越是滿足用戶需求。Sim(D,P)=cosθ= (公式1)(4) 相關(guān)閾值的確定查全率和查準(zhǔn)率是衡量信息檢索系統(tǒng)的兩個(gè)重要指示,相似度系數(shù)的計(jì)算從理論上要求其值1時(shí),檢索結(jié)果與用戶系統(tǒng)完全相符,系統(tǒng)的準(zhǔn)確率達(dá)到最高。但是這樣的檢索系統(tǒng)在實(shí)際中是不可行的,首先在很多情況下用戶并不要求系統(tǒng)返回的結(jié)果有非常的準(zhǔn)確率,而是在保證一定的查準(zhǔn)率條件下盡量的提高系統(tǒng)的查全率;其次,由于用戶興趣特征的多樣化和隨機(jī)化,要找出完全符合用戶特征向量的的檢索結(jié)果是不現(xiàn)實(shí)的。 相關(guān)閾值的提出是對(duì)查全率和查準(zhǔn)率進(jìn)行綜合考慮,以求得檢索結(jié)果和用戶興趣的平衡。讓用戶設(shè)定一個(gè)相關(guān)閾值,返回的檢索結(jié)果只包含高于這個(gè)閾值的文檔,即:給定一個(gè)值用戶特征向量P和一相關(guān)閾值R,則對(duì)于任意返回的文檔D,它的相關(guān)度必為: Sim(D,P)>R (公式2) 向量空間模型(VSM)系統(tǒng)處理流程圖我們已知實(shí)現(xiàn)一個(gè)信息自動(dòng)推薦系統(tǒng)最關(guān)鍵的部分是將文檔數(shù)據(jù)庫(kù)和用戶特征庫(kù)進(jìn)行相關(guān)性分析,得出滿足用戶興趣特點(diǎn)的檢索結(jié)果。在上文向量空間模型的分析基礎(chǔ)上,我們?cè)O(shè)計(jì)了該系統(tǒng)處理的流程圖,如圖7所示。初步檢索結(jié)果特征數(shù)據(jù)庫(kù)文檔向量表示d1=(t11,…,t1j…,t1m)dn=(tn1,…,tnj…,tnm)用戶特征向量P=(p1,p2,…pm
點(diǎn)擊復(fù)制文檔內(nèi)容
電大資料相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1