Kros Dai's Blog • xdanger.com

December 27, 2003

Google的PageRank算法（三）

PageRank特性

　　PageRank的特性可以通过以下范例用插图表示。

　　假设一个小网站由三个页面A、B、C组成，A连接到B和C，B连接到C，C连接到A。虽然Page和Brin实际上将阻尼系数d设为0.85，但这里我们为了简便计算就将其设为0.5。尽管阻尼系数d的精确值无疑是影响到PageRank值的，可是它并不影响PageRank计算的原理。因此，我们得到以下计算PageRank值的方程：

(A) = 0.5 + 0.5 PR(C)
PR(B) = 0.5 + 0.5 (PR(A) / 2)
PR(C) = 0.5 + 0.5 (PR(A) / 2 + PR(B))

　　这些方程很容易求解，以下得到每个页面的PageRank值：

PR(A) = 14/13 = 1.07692308
PR(B) = 10/13 = 0.76923077
PR(C) = 15/13 = 1.15384615

　　很明显所有页面PageRank之和为3，等于网页的总数。就像以上所提的，此结果对于这个简单的范例来说并不特殊。

　　对于这个只有三个页面的简单范例来说，通过方程组很容易求得PageRank值。但实际上，互联网包含数以亿计的文档，是不可能解方程组的。

PageRank的迭代计算

　　由于实际的互联网网页数量，Google搜索引擎使用了一个近似的、迭代的计算方法计算PageRank值。就是说先给每个网页一个初始值，然后利用上面的公式，循环进行有限次运算得到近似的PageRank值。我们再次使用“三页面”的范例来说明迭代计算，这里设每个页面的初始值为1。

迭代次数	PR(A)	PR(B)	PR(C)
0	1	1	1
1	1	0.75	1.125
2	1.0625	0.765625	1.1484375
3	1.07421875	0.76855469	1.15283203
4	1.07641602	0.76910400	1.15365601
5	1.07682800	0.76920700	1.15381050
6	1.07690525	0.76922631	1.15383947
7	1.07691973	0.76922993	1.15384490
8	1.07692245	0.76923061	1.15384592
9	1.07692296	0.76923074	1.15384611
10	1.07692305	0.76923076	1.15384615
11	1.07692307	0.76923077	1.15384615
12	1.07692308	0.76923077	1.15384615

　　重复几次后，我们的到一个良好的接近PageRank理想值的近似值。根据Lawrence Page和Sergey Brin共开发表的文章，他们实际需要进行100次迭代才能得到整个互联网的满意的网页级别值。

　　同样，用迭代计算的方式，每个网页的PageRank值之和仍然收敛于整个网络的页面数的。因此，每个页面的平均的PageRank值为1。实际上的值在(1－d)和(dN+(1-d))之间，这里的N是互联网网页总数。如果所有页面都连接到一个页面，并且此页单独地连接自身，那么将出现理论上的最大值。

<< Google的PageRank算法（二） | PageRank在Google搜索中的实现 >>

Posted by xdanger on 2003-12-27 · Permalink · Comments

December 25, 2003

好像生病了……

　　今天的《南方周末》有价值的文章非常多，几乎断断续续看了一整天。

　　晚上开始扁桃腺狂痛，估计明天就起不来了。两年多没生病了吧，这次好像又不行了。圣诞节还是不开心，心情糟透了……还是早点吃药睡觉吧。

Posted by xdanger on 2003-12-25 · Permalink · Comments

December 24, 2003

Xmas Eve

　　虽然这两天特别不顺，学习不顺工作不顺……还是先跟自己说声圣诞快乐吧，希望明天开始能有好消息……

　　刚才找了下MSN Messenger圣诞节有关的图标，不小心把MSN的图片都整理了一下，算是我送给所有看到这篇文章的朋友的圣诞礼物吧:-)——下载

Posted by xdanger on 2003-12-24 · Permalink · Comments

December 23, 2003

又要修宪了！

　　宪法作为国家根本大法，在西方国家基本都是几十年不变的，在挪威等传统国家甚至历经200多年都不曾修改。而我们，49年以来这是第四次。

　　宪法权威性何在？官方说得好听：“非常及时、十分必要的，具有重大、深远的意义”……宪法的稳定很大程度上反映出国家的稳定，官方为前3次修宪给了冠冕堂皇的理由，什么“为‘私营经济’正名”、“为‘富强’奋斗”、“为‘法治’鼓与呼”，归根结底，每次都是政治势力对比变化所造成的！反映出的社会现象就是——中国还处于人治社会，并且仍深不可拔！

　　看看这次修宪都改了哪些内容：http://www.people.com.cn/GB/shizheng/1026/2259160.html。这14处总结来说，只表现出2个主题：1.将“三个代表”重要思想写入宪法；2.规定“公民合法私有财产不受侵犯”。

　　“在马克思列宁主义、毛泽东思想、邓小平理论指引下”修改为“在马克思列宁主义、毛泽东思想、邓小平理论和‘三个代表’重要思想指引下”。先不论“三个代表”的科学性（也没什么好论的），是不是胡锦涛任期到前再给出个什么理论还要修宪？

Posted by xdanger on 2003-12-23 · Permalink · Comments

December 21, 2003

冬天真冷

　　台湾非典一出现，学校门口又没垃圾食品好吃了。晚上熄灯后只能嗑洽洽瓜子聊天，倒霉的是现在洽洽又越来越难吃，日子难过啊。

　　今天站在路边掏手机时口袋里掉出张5块钱，一时没注意，马上被走上来的一个男子捡了。我上去理论那张RMB是我的，他说~!@#$%^&*……想大街上就不要和这种人P话了，让他缺德去吧。回来想想又有点气，当时大不了打110，最恨这种超级没素质的“人”了。

　　刚刚看了《魔戒III：国王归来》的抢版，虽然没有字幕，大致也看明白了。感觉情节不复杂，但是有些拖沓，特别是魔戒被消灭后还有大约半小时的情节，让人马上想起《无间道III：终极无间》。哎，在考虑是不是要到电影院去看看，还好场面比II还大一点，DVD版还是有观赏价值的:-)

Posted by xdanger on 2003-12-21 · Permalink · Comments

Kros Dai’ Blog No excuse, no panic