【導(dǎo)讀】PageRank計算算法的改進。必須對每個網(wǎng)頁的關(guān)鍵詞建立索引。為每個網(wǎng)頁賦予一個“PageRank”值。的“PageRank”值大小進行排序返回。PageRank是基于「從許多優(yōu)質(zhì)的網(wǎng)頁鏈接過來。完全獨立于查詢,只依賴于網(wǎng)頁鏈接結(jié)構(gòu)。r的大小取決于三個因素:。將一個網(wǎng)頁的所有鏈入網(wǎng)頁的PageRank值。網(wǎng)頁i鏈接到網(wǎng)頁j,則Aij=1,否則Aij=0;PageRank的矩陣是將此N階矩陣A進行倒置,并。PageRank的計算,就是求屬于這個推移概率行。列最大特性值的固有矢量。采用遞歸的方法來求此特征值。遞歸結(jié)束標(biāo)志:|Ranki+1-Ranki|<閥值。搖擺網(wǎng)頁的存在將使得遞歸過程中Rank值。引入了一個新的矩陣。需要兩個數(shù)組Source和Dest分別保存上一。次遞歸的結(jié)果和本次遞歸的結(jié)果。經(jīng)驗表明,PageRank的值可用單精度浮點。全放在內(nèi)存中,則需要通過文件進行內(nèi)存映射,勢必產(chǎn)生大量的I/O操作。能夠容納在內(nèi)存中。由上面分塊的思想,由于在一次迭代過程中,中心服務(wù)器收到所有機器發(fā)來的PageRank結(jié)果文件,將結(jié)果。難點在于多臺機器的并發(fā)控制