Google 是如何对 Blog 文章排名的?

这篇文章是我很早很早以前发布在百度空间中的一篇个人博客。当时的博文排版都很差,甚至很多转载的内容。

而这批博文却是我在互联网中留下最早的足迹,记录着我小学、初中的所思所想。所以我 使用了爬虫将这批珍贵的文字永远地存储在了我的个人服务器中,以防止某一天因为网络服务的下线而彻底消失。


整理了一下Google对Blog文章在其搜索结果中排名的一些规则。这些规则不是凭空杜撰,而是来自一份Google所登记的专利文件。在这份文件中,Google描述了他们评价Blog的一些标准。理所当然,他们会成为Blog在Google中排名的依据。

正面指标:
– [0038]Blog的Feed在阅读器中的订阅量;
– [0039]在Google搜索结果上的点击率;
– [0040-0042]和其它高质量Blog之间的链接;
– [0043]Blog被网络书签收藏的状况;
– [0044]Blog在电子邮件和及时通讯被引用的情况;
– [0045]Google Pagerank。

负面指标:
– [0047]Feed中文章更新频率太高;
– [0048]Blog内容和Feed内容不符;
– [0049]重复的特定内容;
– [0050]高频度使用黑名单中的单词和短语;
– [0051]大部分文章的长度都太短或者非常相似;
– [0052]Blog中包含大量指向相同的链接;
– [0053]Blog中包含大量广告;
– [0054]Blog中的广告在正文部分,而不是Metadata部分。