Google等新一帶搜索引擎的優(yōu)勢之一在于不僅索引量很大,而且還將最好的結(jié)果排在搜索結(jié)果的最前面,具體的原理可以參考
Google の秘密 - PageRank ?底解?一文,PageRank簡單的說類似于科技論文中的引用機制:誰的論文被引用次數(shù)多,誰就是權(quán)威。在互聯(lián)網(wǎng)上PageRank就是基于網(wǎng)頁中相互鏈接關(guān)系的分析得出的。
此外,從計算方法角度闡述PageRank機制還有這篇文章:
http://pr.efactory.de/
里面有更詳細的PageRank算法說明和各種清晰的小型個案分析
比如:子頁中導(dǎo)航條的重要性
B <=> A => C
Vs
B <=> A <=> C (好)
頁面數(shù)量因素:
B <=> A <=> C
Vs
F <=\ /=> G
B <=> A <=> C (好)
D <=/ \=> E
一個意想不到的結(jié)論:
(B <=> A <=> C) ( E <=> D <=> F)
Vs
(B <=> A <=> C) <=> ( E <=> D <=> F)
PageRank升高的只是被鏈接的2個首頁A和D,而網(wǎng)站子頁面的PageRank平均會略有下降。同時:一個網(wǎng)站進入Google的索引量越大其受類似因素影響越小。
PageRank不對稱的頁面互鏈:
Google會用BadRank之類的算法進行糾正,而且一個網(wǎng)頁著有來自“與其自身不相稱”的高PageRank站點的鏈接,而自身又缺少足夠數(shù)量和質(zhì)量的反相鏈接的話,其PageRank會自動降低為0,A(pr=7) <=> B(pr=0)
簡單的說就是:偶爾要被權(quán)威站點反相鏈接不算數(shù),要被足夠多的權(quán)威站點引用才能提高自身網(wǎng)頁的PageRank。