skip to content

以下文字的原文:http://pr.efactory.de/e-pagerank-implementation.shtml

多数人通过Google 工具栏开始了解 PageRank。Google 工具栏是 Microsoft Internet Explorer 的一个浏览器插件,可以在 Google 网站上下载到。Google 工具栏提供的一些功能使搜索 Google 变得更为方便。

Google Toolbar

Google 工具栏以0-10的刻度显示 PageRank 值。从显示栏中绿色部分的长度可以估计出当前正在访问的页面的 PageRank 值。如果用户将鼠标放于显示栏上,就是显示 PageRank 值。

注意:显示 PageRank 值是 Google 工具栏的一个高级功能。如果高级功能被打开,Google 就会收集用户信息。另外,工具栏会自动升级,用户无需关心。所以,Google 可以访问用户的硬盘。

如果我们进行一下计算,PageRank 理论上拥有最大值**(Nd+(1-d)),这里的N为互联网网页总数,d为通常被设为0.85**,计算出的 PageRank 值和工具栏显示出的数值成一定的比例关系。普遍认同的是,它们之间的比例并非线性的,而是成对数关系。如果设阻尼系数d0.85而 PageRank 的最低值为 0.15*(*xdanger注:因为 0.15+0.85=1),并且对数的基数为 6,我们得到以下的比例关系:

Toolbar PageRankReal PageRank
0/100.15 - 0.9
1/100.9 - 5.4
2/105.4 - 32.4
3/1032.4 - 194.4
4/10194.4 - 1,166.4
5/101,166.4 - 6,998.4
6/106,998.4 - 41,990.4
7/1041,990.4 - 251,942.4
8/10251,942.4 - 1,511,654.4
9/101,511,654.4 - 9,069,926.4
10/109,069,926.4 - 0.85 × N + 0.15

现在还不确定工具栏所显示的数值和实际的 PageRank 值是否严格遵循对数关系。看上去的确像遵循了对数关系,因此 Google 工具栏仅用了一个范围的刻度值就能显示所有页面的 PageRank 值。对数的基数被定在 6-7 之间,这一点可以由一个工具栏 PageRank 值大于 4 的页面的入链数量举例演算得出,这个连接数量可以从 Google 那用指令式的链接得到。

<< PageRank 在 Google 搜索中的实现