freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

web信息自動推薦系統(tǒng)設(shè)計畢業(yè)論文(編輯修改稿)

2025-07-17 12:58 本頁面
 

【文章內(nèi)容簡介】 JDBC不但提供了標(biāo)準(zhǔn)的API連接數(shù)據(jù)源,而且還為數(shù)據(jù)庫互生產(chǎn)廠家提供了標(biāo)準(zhǔn)的驅(qū)動程序,使得用戶可方便地使自己的Java應(yīng)用程序與數(shù)據(jù)庫互相通信。JDBC最大的特點是:對下,JDBC封裝了各種底層數(shù)據(jù)源之間的差異;對上,JDBC提供標(biāo)準(zhǔn)的SQL界面。這使得上層應(yīng)用對底層數(shù)據(jù)源的訪問完全透明,大大地簡化了訪問底層數(shù)據(jù)源的復(fù)雜性,真正做到了無障礙溝通。 JDBC數(shù)據(jù)訪問模型Sun公司定義了4種數(shù)據(jù)庫驅(qū)動程序類型,它們分別是:(1) 本地API部分Java驅(qū)動程序(2) JDBCNet純Java驅(qū)動程序(3) 本地協(xié)議Java驅(qū)動程序(4) JDBCODBC橋驅(qū)動程序在本論只介紹使用廣泛的模型即本地API部分Java驅(qū)動程序,這種驅(qū)動程序?qū)DBC的命令轉(zhuǎn)換成數(shù)據(jù)管理系統(tǒng)指定的本地調(diào)用,然后由本地調(diào)用直接操作數(shù)據(jù)庫(如圖3所示)。這種兩層模型比JDBCODBC橋驅(qū)動程序要快,但是每個客戶端需要裝載必要的文件?,F(xiàn)在大多數(shù)的數(shù)據(jù)庫廠商都在其數(shù)據(jù)庫中提供該驅(qū)動程序。本系統(tǒng)使用的是MySQL數(shù)據(jù)庫。 MySQL提供的驅(qū)動程序稱為Connect/J,:。[10] 基于B/S模型的Web應(yīng)用程序(1) 定義:動態(tài)的網(wǎng)頁有著網(wǎng)頁的外觀,而實質(zhì)上是建立在B/S模型上的服務(wù)器Web應(yīng)用程序。也就是說,一幅瀏覽器端的顯示的網(wǎng)頁,是一段服務(wù)器程序運行的結(jié)果。所以應(yīng)該從編程的角度理解、構(gòu)思網(wǎng)頁的結(jié)構(gòu)和功能。Java運行環(huán)境廠商專用API數(shù)據(jù)庫Data baseJava應(yīng)用程序JDBC驅(qū)動程序圖3 本地API部分Java驅(qū)動程序(2) 工作原理:WWW(World Wide Web)技術(shù)作為Internet 上信息資源共享的解決方案,它是構(gòu)建在瀏覽器/服務(wù)器(B/S)模型以及HTTP的基礎(chǔ)上的,其運作模式可以描述為:請求處理應(yīng)答。B/S模型的構(gòu)成及關(guān)系示意圖,如圖4所示。從瀏覽器提交的請求通過Web服務(wù)器給應(yīng)用程序服務(wù)器,由它調(diào)用相關(guān)的網(wǎng)頁應(yīng)用程序進行處理,處理結(jié)果——網(wǎng)頁交給Web服務(wù)器,Web服務(wù)器把這個網(wǎng)頁作為請求的應(yīng)答發(fā)送給瀏覽器。至于對提交的信息如何處理,就交由網(wǎng)站的開發(fā)人員編寫相關(guān)的網(wǎng)頁應(yīng)用程序來決定反饋到瀏覽器的內(nèi)容;如果需要對數(shù)據(jù)庫進行訪問,開發(fā)人員還可以利用應(yīng)用程序服務(wù)器所提供的接口對其進行操作。如前所示,網(wǎng)頁內(nèi)容的動態(tài)發(fā)布是Web應(yīng)用程序的主要實現(xiàn)方法,通常這種方法同服務(wù)器端提供的WWW服務(wù)技術(shù)密不可分。一般來說,在Internet服務(wù)器上可以通過多種途徑實現(xiàn)動態(tài)發(fā)布,最常見的技術(shù)包括JSP、CGI、ISAPI和ASP等。JSP的運行模式,如何在B/S模型上動作的?圖5所示即為JSP運作原理模型。,觸發(fā)JSP引擎。JSP引擎首先檢查JSP文件是否修改過,如果是則將其轉(zhuǎn)換成Java Servlet源程序,再由Servlet引擎運行該文件,最后將運行結(jié)果返回Web服務(wù)器,Web服務(wù)器將其返回瀏覽如果沒修改,則直接運行。Web服務(wù)器Web應(yīng)用程序1Web應(yīng)用程序2數(shù)據(jù)庫URL地址及參數(shù)表單提交的請求請求交由應(yīng)用程序服務(wù)器分析處理處理的結(jié)果Web頁返回Web服務(wù)器應(yīng)用程序服務(wù)器如需訪問數(shù)據(jù)庫則由DBMS處理將Web頁反饋至瀏覽器返回訪問結(jié)果服務(wù)器端圖4 B/S模型示意圖瀏覽器1瀏覽器2瀏覽器端……Web服務(wù)器Web應(yīng)用程序1Web應(yīng)用程序2數(shù)據(jù)庫URL地址及參數(shù)表單提交的請求請求交由應(yīng)用程序服務(wù)器分析處理處理的結(jié)果Web頁返回Web服務(wù)器應(yīng)用程序服務(wù)器如需訪問數(shù)據(jù)庫則由DBMS處理將Web頁反饋至瀏覽器返回訪問結(jié)果服務(wù)器端瀏覽器1瀏覽器2瀏覽器端……圖5 JSP的運作模式 Google Web APIGoogle Web API 是Google公司推出Web搜索引擎專用的API。該API能使開發(fā)者通過自己的電腦程序從Google搜索引擎查詢20多億份Web文檔。開發(fā)者可以在他們最熟悉的環(huán)境編程,包括Java、Perl或VisualStudio.Net等將Google的搜索功能嵌入到他們的應(yīng)用程序當(dāng)中。目前,Google的API還是處于Beta測試階段,因此,在API的使用上還有一些限制。例如,使用這些API需要申請一個帳號。對于免費申請的帳號,為了防止開發(fā)人員不正當(dāng)?shù)氖褂?,限制每個帳號、每天最多只能查詢1000次。目前,Google還沒有提出正式的運營模式和收費方式。 Google Web API目前主要提供三種服務(wù),分別如下: (1) 搜索服務(wù)。用戶提交一個搜索內(nèi)容請求,Google服務(wù)器將查找超過20億的網(wǎng)頁內(nèi)容,并且將滿足用戶需求的目標(biāo)返回給用戶,一般來說這種處理只需要幾秒的時間。 (2) 緩存服務(wù)(Cache)。用戶提交一個URL,Google服務(wù)器將返回搜索器訪問該URL的最新記錄。這樣,用戶很容易復(fù)用Google的搜索成果。(3) 拼寫檢查。該功能用于檢查用戶的查詢請求是否有效。用戶提交一個檢查內(nèi)容,Google服務(wù)器將返回有效的、最接近該內(nèi)容的查詢請求,返回的查詢請求將符合Google的查詢規(guī)則。Google為了提高開發(fā)人員的開發(fā)效率,提供了一套基于Java的API,用于直接訪問Google服務(wù)器。該API 包主要包括如下幾個類: GoogleSearch :該類封裝了對于Google服務(wù)器的訪問,支持搜索和緩存(cache)功能。 GoogleSearchDirectoryCategory :表示Google中的一個分類目錄 GoogleSearchFault :該類為Exception的一個子類,用于表示API使用的錯誤。 GoogleSearchResult :該類封裝了搜索的結(jié)果。 GoogleSearchResultElement:該類表示搜索結(jié)果中的每一條記錄。 如下是一個例子的源代碼,用于一個簡單查詢,查詢請求為” 信息搜索、系統(tǒng)開發(fā)”,查詢的帳號為”k3Cvh5FQFHJMaD5rwwgIwYSNhpNaQ/tz ”。該例子將把查詢結(jié)果打印出來。如果用戶需要近一步解析查詢結(jié)果,可以使用 GoogleSearchResult和GoogleSearchResultElement類。//利用Google Web API的“搜索服務(wù)”功能來實現(xiàn)的import .*。 import .*。 public class GoogleAPITest { public static void main(String[] args) { String clientKey= k3Cvh5FQFHJMaD5rwwgIwYSNhpNaQ/tz 。 //注冊的API查詢帳號String query=信息搜索、系統(tǒng)開發(fā)。 // 創(chuàng)一個查詢關(guān)鍵字GoogleSearch s = new GoogleSearch()。 (clientKey)。 try { (query)。 GoogleSearchResult r = ()。 (查詢結(jié)果顯示如下:+())。 } catch (GoogleSearchFault f) { (訪問Google Web APIs 失敗:+())。 } } }//程序結(jié)束Google 搜索引擎提供了搜索、緩存和拼寫簡單功能, Google還提供了Java API,這也大大提高了Java程序員的開發(fā)效率。隨著搜索內(nèi)容、形式的豐富,更多的開發(fā)人員可以將這種技術(shù)運用在自己應(yīng)用程序中,擴展應(yīng)用程度的功能。 3 要解決的幾個關(guān)鍵問題 研究設(shè)計中要解決的問題(1) 理解向量空間模型的原理,掌握向量空間模型的實現(xiàn)方法。向量空間模型(Vector Space Model,簡稱VSM)是將用戶特征信息也作文檔。一篇文檔被定義一系列的組合,每個詞被賦與一個權(quán)值以表明它對這篇文檔的重要性。采用學(xué)習(xí)方法判斷文檔和用戶特征的相似度,將文檔信息匹配轉(zhuǎn)化為向量空間中的向量相配問題。向量空間模型具有自然語言界面,易于使用,已被人們普遍認(rèn)為是一種非常有效的檢索模型。其實現(xiàn)原理在下一章介紹。(2) 根據(jù)用戶興趣信息的內(nèi)容(注冊、修改、刪除等方式)。通過Web網(wǎng)站給用戶注冊、修改、刪除,來獲得用戶的興趣信息,并提取用戶特征向量值。(3) 利用搜索引擎檢索與用戶興趣相關(guān)的Web信息。通過Google Web API所提供的接口進行搜索與用戶相關(guān)的興趣信息,并存入數(shù)據(jù)庫。(4) 建立與用戶興趣相關(guān)的向量空間模型,然后利用向量空間模型檢索出用戶比較感興趣的信息。即從數(shù)據(jù)庫中提取搜索引擎檢索的結(jié)果,然后建立向量模型,并與用戶興趣信息的向量進行匹配,顯示出用戶比較感興趣的信息。 具體實現(xiàn)中采用的關(guān)鍵技術(shù)及復(fù)雜性分析(1) 系統(tǒng)實現(xiàn)的所用的開發(fā)語言與開發(fā)工具都是比較流行的,但同時也增加了開發(fā)難度。(2) 本系統(tǒng)中最為困難的是建立文檔向量與用戶特征向量,而建立文檔向量與用戶特征向量的基礎(chǔ)是提取關(guān)鍵詞也就是說對其進行中文分詞,而中文分詞是一種復(fù)雜技術(shù),在本系統(tǒng)中我們采用ICTCLAS分詞系統(tǒng)。具體的我們將在下一章中介紹。 4系統(tǒng)結(jié)構(gòu)與模型 基于向量空間模型的信息自動推薦系統(tǒng)設(shè)計向量空間模型(Vector Space Model,簡稱VSM)是將用戶特征信息也作文檔。一篇文檔被定義一系列的組合,每個詞被賦與一個權(quán)值以表明它對這篇文檔的重要性。采用學(xué)習(xí)方法判斷文檔和用戶特征的相似度,將文檔信息匹配轉(zhuǎn)化為向量空間中的向量相配問題。向量空間模型具有自然語言界面,易于使用,已被人們普遍認(rèn)為是一種非常有效的檢索模型。[11] 向量空間模型在自動推薦信息服務(wù)系統(tǒng)中的應(yīng)用基于向量空間模型的自動推薦信息服務(wù)系統(tǒng)主要包括三個方面:(1) 文檔向量表示概念1 文檔D(Document):泛指文檔或文檔中的一個片段(如文檔中的標(biāo)題、摘要、正文等)。概念2 特征關(guān)鍵詞T(Term):指出現(xiàn)在文檔中能夠代表文檔性質(zhì)的基本語言單位(如字、詞等)。設(shè)文檔D是一個包含n篇Web文檔的集合,D={d1,…di…,dn},i=1,2,…,n,文檔集合中的任一文檔di可以表示為特征關(guān)鍵詞空間中的一個m維向量di=(ti1,…,tij…,tim), i=1,2,…,n。j=1,2,…,m。其中tij為文檔di的第j個特征關(guān)鍵詞分量。文檔向量有幾種表示:1,第j個關(guān)鍵詞屬于di1. 簡單的二值向量表示0,第j個關(guān)鍵詞不屬于didij= 2. 基于詞頻的表示tij,第j個關(guān)鍵詞在文檔di中出現(xiàn)的次數(shù)0,第j個關(guān)鍵詞不屬于didij= 3. 基于tfidf的特征提取表示Dij=tijlog2(n/nj) 其中:Tij是關(guān)鍵字ti在文檔中的倒置頻次,n是文檔數(shù)據(jù)庫存中文檔總數(shù),nj是文檔數(shù)據(jù)庫中含有關(guān)鍵詞tj 的文檔數(shù)。(2) 用戶特征向量的表示在基于向量空間模型的自動推薦系統(tǒng)中,用戶的特征文件(User profile),即對用戶興趣信息的描述,是以自然語言來表示的,采用表示文檔向量的方法來表示用戶特征向量。P=(u1,u2, …,um),其中ui 表示權(quán)值。還可以按照傳統(tǒng)的表示法,以(字項,權(quán)值)對來表示向量。P=((y1, u1),(y2, u2), …, (ym, um))。其中(yi, ui)表示字項yi 的權(quán)值是ui 。例如:某一用戶的特征向量可以表示為P=((“信息系統(tǒng)”,),(“檢索”,))。(3) 文檔與用戶特征相似度系數(shù)的計算衡量一篇文檔的向量表示與用戶特征向量表示的相似度,也就是判斷某篇文檔是否滿用戶的個性興趣通常用求兩個向量的余弦值的內(nèi)積或夾角θ的余弦來表示,由于用戶特征也可以在同一空間里表示為一個用戶特征向量(見圖6)。θ文檔D(t1,…,ti…,tm)用戶特征P(p1,p2,…pm)特征項3特征項2特征項1圖6 文檔VSM及相似度Sim(D, P)假如D=(t1,…,ti…,tm)表示文檔向量,P=(p1,p2,…pm)表示用戶特征向量,計算這兩個向量相似度可以對兩個向量進行余弦規(guī)范化處理,再運用內(nèi)積公式計算兩個向量之間夾角的余弦,這種相似度的方法常被為“余弦相似度”方法來實現(xiàn)(見公式1)。當(dāng)兩向量相同時,相似度1,當(dāng)向量不存在相同的項時,相似度為0,兩向量夾角θ的余弦值越大,說明檢索的結(jié)果越是滿足用戶需求。Sim(D,P)=cosθ= (公式1)(4) 相關(guān)閾值的確定查全率和查準(zhǔn)率是衡量信息檢索系統(tǒng)的兩個重要指示,相似度系數(shù)的計算從理論上要求其值1時,檢索結(jié)果與用戶系統(tǒng)完全相符,系統(tǒng)的準(zhǔn)確率達到最高。但是這樣的檢索系統(tǒng)在實際中是不可行的,首先在很多情況下用戶并不要求系統(tǒng)返回的結(jié)果有非常的準(zhǔn)確率,而是在保證一定的查準(zhǔn)率條件下盡量的提高系統(tǒng)的查全率;其次,由于用戶興趣特征的多樣化和隨機化,要找出完全符合用戶特征向量的的檢索結(jié)果是不現(xiàn)實的。 相關(guān)閾值的提出是對查全率和查準(zhǔn)率進行綜合考慮,以求得檢索結(jié)果和用戶興趣的平衡。讓用戶設(shè)定一個相關(guān)閾值,返回的檢索結(jié)果只包含高于這個閾值的文檔,即:給定一個值用戶特征向量P和一相關(guān)閾值R,則對于任意返回的文檔D,它的相關(guān)度必為: Sim(D,P)>R (公式2) 向量空間模型(VSM)系統(tǒng)處理流程圖我們已知實現(xiàn)一個信息自動推薦系統(tǒng)最關(guān)鍵的部分是將文檔數(shù)據(jù)庫和用戶特征庫進行相關(guān)性分析,得出滿足用戶興趣特點的檢索結(jié)果。在上文向量空間模型的分析基礎(chǔ)上,我們設(shè)計了該系統(tǒng)處理的流程圖,如圖7所示。初步檢索結(jié)果特征數(shù)據(jù)庫文檔向量表示d1=(t11,…,t1j…,t1m)dn=(tn1,…,tnj…,tnm)用戶特征向量P=(p1,p2,…pm
點擊復(fù)制文檔內(nèi)容
電大資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1