freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

社會環(huán)境下網(wǎng)頁重要性的研究畢業(yè)論-免費閱讀

2025-07-07 07:01 上一頁面

下一頁面
  

【正文】 但是 循環(huán) 次數(shù)少 就 達到收斂效果不是說明我的循環(huán)次數(shù)設(shè)置那么高是 多此一舉 ,因為上面是屬于最簡單的模型,達到收斂所需的次數(shù)當然是最少的,同樣的算法對于互聯(lián)網(wǎng)數(shù)以億計的網(wǎng)頁和訪問者 ,運算量是巨大的,循環(huán)次數(shù)更 是非常巨大,上面只是簡單的模型,目的是使讀者更加理解我設(shè)計的算法,同時也驗證了我的算法的正確性。 m。 [11] Visual Basic 編程驗證算法收斂 將上面的算法結(jié)合上圖編寫相應(yīng)的 VB 程序,運行循環(huán)結(jié)構(gòu)后得出收斂后的結(jié)果 驗證算法的正確性: private Sub Command1_Click() Dim m, n, l, i, j, k, o Dim PRi(1 To 4) Dim Zi(1 To 4, 1 To 4) Dim Ki(0 To 4, 1 To 4) Dim C(0 To 4) Dim T(0 To 4) Dim PR(1 To 4, 1 To 9999) Dim P(1 To 4) Dim G(1 To 4) Zi(1, 1) = 3: Zi(1, 2) = 0: Zi(1, 3) = 1: Zi(1, 4) = 2: Zi(2, 1) = 1: Zi(2, 2) = 4: Zi(2, 3) = 0: Zi(2, 4) = 3 Zi(3, 1) = 0: Zi(3, 2) = 2: Zi(3, 3) = 2: Zi(3, 4) = 0: Zi(4, 1) = 2: Zi(4, 2) = 0: Zi(4, 3) = 0: Zi(4, 4) = 1 PRi(1) = 1 / 4: PRi(2) = 1 / 4: PRi(3) = 1 / 4: PRi(4) = 1 / 4 Ki(1, 1) = : Ki(1, 2) = : Ki(1, 3) = : Ki(1, 4) = : Ki(2, 1) = : Ki(2, 2) = : Ki(2, 3) = : Ki(2, 4) = Ki(3, 1) = : Ki(3, 2) = : Ki(3, 3) = : Ki(3, 4) = : Ki(4, 1) = : Ki(4, 2) = : Ki(4, 3) = : Ki(4, 4) = For m = 1 To 200 P(1) = 0: P(2) = 0: P(3) = 0: P(4) = 0 For j = 1 To 4 o = 0 For n = 1 To 4 C(j) = Zi(j, n) * PRi(n) * Ki(j, n) T(j) = o + C(j) o = T(j) Next n 社會環(huán)境下網(wǎng)頁重要性的研究 24 For n = 1 To 4 Ki(0, n) = 0 G(n) = Ki(j, n) * T(j) Next n For l = 1 To 4 P(l) = P(l) + G(l) Next l Next j For k = 1 To 4 PR(k, m) = P(k) Next k Print PRi(1)=。 3 表示訪問次數(shù) 3 次最終的 Kijn 為 ,其他的依次類推。 社會環(huán)境下網(wǎng)頁重要性的研究 20 上式 表示 對 i 領(lǐng)域的所有網(wǎng)頁 中 訪問者 n 被認同度的疊加得到 PRin,但是相同的認同度對于不同的網(wǎng)頁所對訪問者的 PR 值 貢獻是不同的,所以 對于不同的網(wǎng)頁有不同的權(quán)重,乘以這個 權(quán)重就比較準確反映了 j 網(wǎng)頁對 訪問者 n 的 PR 值 的貢獻 。 所以計算 PRin時首先要算出網(wǎng)頁的權(quán)重 。 為了表示投票情況,先設(shè)置一個參數(shù)Kijn,表示訪問者對網(wǎng)頁 Pij 的投票評價的被認同度。但是 PageRank 算法僅僅根據(jù)訪問量來決定網(wǎng)站的重要性,這個 有點不完善,搜索引擎不單只要返回多人關(guān)注的網(wǎng)站排位,而且還要考慮網(wǎng)站的內(nèi)容是否正確權(quán)威,這個可以從訪問者的知識水平來判斷網(wǎng)頁的權(quán)威性。例如:一個工程院院士關(guān)于 PageRank 網(wǎng)頁的投票的權(quán)重,比我對 PageRank 網(wǎng)頁的投票的社會環(huán)境下網(wǎng)頁重要性的研究 16 權(quán)重大得多,因為院士的該領(lǐng)域知識水平 (PR 值 )遠遠高于我。 權(quán)重是一個相對的概念,是針對某一指標而言。因此可以認為 傳統(tǒng) 算法的網(wǎng)頁 PR 值,反映了網(wǎng)頁的熱度 (訪問人數(shù) ), PR 值越大,則表示網(wǎng)頁越熱,越多人訪問。 (4) 查詢的分類。 算法再好 ,也無法在低質(zhì)量網(wǎng)頁集找出很多高質(zhì)量的 網(wǎng)頁。 整個網(wǎng)頁圖中的一組緊密鏈接的網(wǎng)頁如果沒有外出的鏈接就產(chǎn)生等級沉沒 , 一個獨立的網(wǎng)頁如果沒有外出的鏈接就產(chǎn)生等級泄漏 。 同樣,用迭代計算的方式,每個網(wǎng)頁的 PageRank 值之和仍然收斂于整個網(wǎng)絡(luò)的頁面數(shù)的。 對于這個只有三個頁面的簡單范例來說,通過方程組很容易求得 PageRank 值。并且,阻尼系數(shù) d減低了這個概率。 具體計算時 , 可以給每個網(wǎng)頁一個初始的 PageRank 值 , 然后反復(fù)迭代運算 , 即 : R(i+1)(v)=??uBv??R(i)(u)/Nu () 此處的 v 代表所有的網(wǎng)頁集合 ,每一個第 i+1次的 PageRank 值都是基于上次的PageRank值重新計算的。 PageRank 絕對是個很科學的小創(chuàng)意。 其中 PageRank 算法在實際使用中的效果要好于 HITS 算法 , 這主要是由于以下原因 : a. PageRank 算法可以一次性 、 脫機并且獨立于查詢地對網(wǎng)頁進行預(yù)計算 ,以 得到網(wǎng)頁重要度的估計值 , 然后在具體的用戶查詢中 , 結(jié)合其他查詢指標值再一齊對查詢結(jié)果進行相關(guān)性排序 , 從而節(jié)省了系統(tǒng)查詢時的運算開銷 ; b. PageRank 算法是利用整個網(wǎng)頁集合進行計算的 , 不像 HITS 算法易受到局部連接陷阱的影響而產(chǎn)生 “主題漂移 ”,所以現(xiàn)在這種技術(shù)廣泛地應(yīng)用在許多信息檢索系統(tǒng)和網(wǎng)絡(luò)搜索引擎中 , Google 搜索引擎的成功也表明了以超鏈分析為特征的網(wǎng)頁相關(guān)度排序算法日益成熟 ??梢钥闯觯麄€過程中在線進行的只是查詢,所有的計算都是離線進行的,因此搜索引擎能以較快的速度將結(jié)果返回給用戶。 (7)數(shù)據(jù)庫 Link 記錄了網(wǎng)頁的鏈接關(guān)系,用來計算網(wǎng)頁的 PageRank 值。 索引項根據(jù)其重要程度分為兩種: 當索引項中的關(guān)鍵詞出現(xiàn)在 URL、標題、錨文本 (Anchor Text)和標簽中時,表示該索引項比較重要,稱為特殊索引項 (Fancy Hits);其余情況則稱為普通 索引項 (Plain Hits)。 Google PageRank 一般一年更新四次 (由 crawler 程序的效率及搜索引擎的規(guī)模決定 ),所以剛上線的新網(wǎng)站不可能獲得 PR 值。 本文論述的 Google 搜索引擎就是 機器人搜索引擎 ,通過 網(wǎng)絡(luò)蜘蛛 (Crawler) 搜集和發(fā)現(xiàn) 網(wǎng)頁排序 所需要的 信息 。再次, Google 的中文搜索引擎的完美設(shè)計,體現(xiàn)了設(shè)計者的國際市場合作精神, Google 搜索引擎對中文的支持力度,使它成為目前是收集亞洲網(wǎng)站最多的搜索引擎,同時能夠取他人之長,與他人聯(lián)手,以團隊合作精神推出新技術(shù)新功能。 現(xiàn)在全球有 75%的網(wǎng)上信息搜索是靠 Google的技術(shù)完成,大大促進了人類的信息搜索的效率。社會環(huán)境下網(wǎng)頁重要性的研究 1 社會環(huán)境下網(wǎng)頁重要性的研究 指導(dǎo)老師:陳強 鄧青云 信息工程 20210003014 社會環(huán)境下網(wǎng)頁重要性的研究 2 中文摘要 近年來,隨著 inter 的不斷發(fā)展, Web 已經(jīng)成為人們的重要信息來源,為人們提供了豐富的信息資源。而作為品牌價值,僅Google這個名字的無形資產(chǎn),竟出人意料地在如此短的時間,一下子超過了蘋果、 IMB、可口可樂,真正實現(xiàn)了跳 躍性的發(fā)展。 搜索 引擎 的 分類 搜索引擎是指因特網(wǎng)上專門提供查詢服務(wù)的一類網(wǎng)站 ,它以一定的策略在互聯(lián)網(wǎng)中搜集 、 發(fā)現(xiàn)信息 , 對信息進行理解 、 提取 、 組織和 處理 ,并為用戶提供檢索服務(wù) , 從而起到信息導(dǎo)航的作用 。 目錄式搜索引擎和機器人搜索引擎 , 各有優(yōu)缺點 , 應(yīng)用都很廣泛 。你的網(wǎng)站很可能在相當長的時間里面看不到 PR 值的變化,特別是一些新的網(wǎng)站。 順排檔索引和 Hit 的存儲結(jié)構(gòu)如圖 所示。 (8)文檔索引 (Document Index)把沒有進行索引分析的網(wǎng)頁傳遞給 URL Server, URL Server 則向 Crawler 提供待遍歷的 URL,這樣,這些未被索引的網(wǎng)頁在下一次工作流程中將被索引分析。另外,查詢過程沒有考慮用戶提交的關(guān)鍵詞和 訪問者的自身情況 。 但是 PageRank 算法由于只考慮到網(wǎng)頁間的超鏈關(guān)系并僅僅以此進行網(wǎng)頁重要度的分析 , 所以不可避免地會產(chǎn)生很多問題 , 其 中 , 比較明顯的問題在于它在計算每個網(wǎng)頁具體的重要度權(quán)值的時候 , 根本沒有考慮到任何網(wǎng)頁本身內(nèi)容特征對權(quán)值 的影響,如 PageRank算法完全忽略了網(wǎng)頁具有的不同主題 , 不同的主題應(yīng)該具有不同的重要度權(quán)值,進一步說,在用戶查詢的時候,網(wǎng)頁的重要程度值的大小與查詢所表達的主題關(guān)系很大,其實,在 HITS算法 [5]中恰恰考慮了這種因素,所以它更易于表達與特定查詢主題的相關(guān) 度排序,有效地在 PageRank算法中考慮查詢主題對網(wǎng)頁權(quán)重值的影響是一個有效改進此算法的重要方法,再如, PageRank 算法也沒有考慮網(wǎng)頁的創(chuàng)建 時間 ,并不對新舊網(wǎng)頁進行有效的區(qū)分 ,相反 ,按照 PageRank 的既有算法甚至會產(chǎn)生舊網(wǎng)頁比新網(wǎng)頁具有較高重要度權(quán)值的可能性 。 說他科學,你會在我以后的文章中看到 Google是如何將數(shù)學 (具體來說多數(shù)是統(tǒng)計學 )理論淋漓盡致地發(fā)揮在搜索技術(shù)之中。具體的迭代次數(shù)在實際運算中是有限的。阻尼系數(shù) d的引入,是因為用戶不可能無限的點擊鏈接,常常因無聊而隨機跳入另一個頁面。但實際上,互聯(lián)網(wǎng)包含數(shù)以億計的文檔,是不可能解方程組的 。因此,每個頁面的平均的 PageRank 值為 1。 所以 , Page改進措施為 : 一是剔除產(chǎn)生等級泄漏的獨立網(wǎng)頁以消除其不利影響 ; 二是給產(chǎn)生等級沉沒的網(wǎng)頁添加一個指向鏈入網(wǎng)頁的返回鏈接 , 此時使得所有網(wǎng)頁 PageRank 值的計算就不完全依賴現(xiàn)有鏈接了 , 所以修正的 PageRank計算公式為 : ? ? () ( ) / ( ) ( )v B uR u C R v N v C E u???? () 其中 ,‖ R′‖ 1=1, 對應(yīng)的矩陣形式為 V’=c(AV’+E)。 (2) 錨文本的利用。每種算法都有自身的適用情況 , 對于不同的查詢 ,應(yīng)該采用不同的算法 ,以求獲得最好的結(jié)果。 在改進算法中,訪問者的 PR 值表示為 PRin, PRin越大則表示訪問者的專業(yè)知識水平越高。某一指標的權(quán)重是指該指標在整體評價中的相對重要程度。 接著是看投票情況,如果院士投了反對票,這個網(wǎng)頁的 PR 將大打折扣,如果我投了反對票,對網(wǎng)頁 PR 的影響可能不大,因為我的權(quán)重比院士的權(quán)重小很多。 我做的工作就是增加訪問者的具體情況影響 PageRank 值,首先就是訪問者的知識水平不同他對網(wǎng)站的 PR 值貢獻不同,在不同的領(lǐng)域不同的訪問者具有不同 PR(PageRank,下同 )值,這個 PR 值,首先計算每個訪問者的 PR 值,類似 PageRank 根據(jù)鏈接數(shù)量判斷網(wǎng)頁重要性的算法首先假設(shè)有 N 個訪問者每個訪問者本身有一個 PR 值 1/ N。 由于 本 論文研究的改進搜索引擎排序算法是由訪問者的知識水平及其投票情況決定網(wǎng)頁的排名,因此在計算網(wǎng)頁的 PR 值之前首先就要求出訪問者本身的 PR 值,第二步才是求網(wǎng)頁的 PR 值,下面將改進方法分兩步詳細說明。 n?Zijn PRin Kijn 式 ()中的 Zijn PRin也 是一個權(quán)重,表示訪問者 n 在計算網(wǎng)頁 j 權(quán)重中的 份 量, 乘以 Zijn 的原因是,訪問者訪問的次數(shù)越多 , 說明這個網(wǎng)頁越受訪問者 n 關(guān)注,稱為關(guān)注度,當然一個網(wǎng)頁受 訪問者 n 關(guān)注越多 , 并不表示 網(wǎng)頁 j 的權(quán)重 ()越大,還要看訪問者的被認同度 Kijn, Zijn PRin只是作為一個權(quán)重 , 還要看他的意見是否得到大家的贊同,所以乘以 Kijn, 簡單舉個例子,一個資深的學者訪問一個本專業(yè)的網(wǎng)頁,并不是訪問 次數(shù)越多對網(wǎng)頁權(quán)重的貢獻就越大,還要乘以一個系數(shù) Kijn,當沒有人同意這位資深學者的評價時,這位資深學者本身在這個領(lǐng) 域很高的 PR 值當然不可以貢獻在網(wǎng)頁 j 的權(quán)重上,相反如果很多人贊同這位資深學者的評價,即 Kijn 很大,這位資深學者本身的 PR 就會很大比例地對網(wǎng)頁 j 的權(quán)重做出貢獻。 L 的具體算法是 n?Zijn PRin(i) Kijn L 權(quán)重是由訪問者本身的
點擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1