找回密码
 注册
搜索
热搜: 回贴

从小切口看引擎对原创文章的抓取与排名

2009-12-13 04:42| 发布者: admin| 查看: 96| 评论: 0|原作者: 柳梦璃


  昨天(12.18)在写了一个文章:<购买网站应注意的九个问题>
  文章首先发布在了落伍者,然后发布到了艾瑞网,又发布在了情缘站长教程网,最后找朋友发在了挖新闻网。
  下午五点的时候三大引擎都收录了.只是排名都不相同.
  今天由这个很小的切口来看一下.各大引擎对于原创文章的抓取入排名情况.
  以下搜索的截图时间为 12.19 上午11点.
  全部是以 "购买网站应注意的九个问题" 带冒号的方式搜索出来的结果.
  首先看一下百度.
  


  估计这个排名.多数专业人士看了之后会符之一笑.
  可以看的出来,百度对于文章的排名是按时间顺序排的.文章的开头我提到了发布顺序.
  至于为什么把那上面的不知名博客排在第一个.我想唯一的解释就是百度蜘蛛最晚一个
  抓取到了文章吧.可以从快照里又看出问题.有证证据噢...
  我在那个文章中的第二段文字中举了一个例子,原文是这样的:
  “我通过这个网站曾成功的购买了一个非常好的域名:www.99wol.com 查看其它历史在2005年的时候曾经是一个机械类网站。”
  当发布在情缘站长教程网以后,编辑可能感觉我AD了.于是把上面的域名中的.(点)刻意改成了 。(句号)
  而这个快照里的就是句号.
  可以肯定的说.此文章是在12.18号上午10点以后复制过去.或者采集过去的. (因为10点的时候,我联系编辑改了那个句话)
  所以,换句话说,排在第一个的地址.是最后发布文章的.
  而从这个小切口,我们可以看出,百度在排名上对于时间的先后非常看重.最后发布的经常能获得好排名.
  百度对于文章的抓取速度还是比较快的,但是对于是否原创,在哪里首发.好像并没有作处理.
  其实这样的例子也非常多了.如果有自己发过原创文章的朋友,你们现在在百度搜索一下你文章的名字.
  估计一般不会排在第一个,除非转载率极低的.
  再来看一下GOOGLE
  


  前两天看过小鹏的一篇文章:Google在处理内容原创性问题
  其中有句话是说:这样的做法就是说,谁先发出,即刻给排名,后面收录的不管你是权重多高的站点,都在该原创之下。
  看来GG要作到这一点,还需要一点时间...
  如果单从这个截图上来看,好像GG和百度差不多.发布最晚的那个.或者说被最晚抓取的那个.排在了第一
  上面的挖新闻是19小时前,而情缘站长教程网则是23小时前...
  情缘站长教程网的文章.排在了后面.
  如果按"谁先发出,即刻给排名" 那应该是落伍排第一...而落伍也在后面.
  原创文章的处理及排序确实是引擎急需解决的一个问题.
  但是排名中并没有出现,像百度图片当中那些不知名博客的排名..全部是有一定知名度的网站.
  看来.GG排名中更加看重的是网站的权重.
  最后来看看YAHOO
  


  说实在的,平时确实很少关注YAHOO引擎.或许是来流量实在是不大的原因吧.
  只听说有专门作GOOGLE的,有专门作百度的.很少听说有专门研究YAHOO的...
  从这截图上可以看的出.YAHOO也比较重视抓取的时间与网站的权值.
  而至于排名中没有抓取到情缘站长教程网的文章.我实在有点意外...
  从这个文章的小切口,可以看的出三大引擎对于原创文章的排名因素方面,文章的抓取时间起着非常重要的作用.
  作出这几个截图来看.基本上可以确定.
  三大引擎对于文章的排名,都是抓取最晚的排在前面.其次再看网站的权重.
  当然这只是一个小小的实验.而且这个实验是在文章发出一天之后查看的.相对来说观察时间还是比较短的.
  或者在过几天,会重新排序一下.也说不定....后面几天会怎么样.谁都不知道..
作者 方道 本文仅代表作者观点,与情缘站长教程网立场无关.


最新评论

QQ|小黑屋|最新主题|手机版|微赢网络技术论坛 ( 苏ICP备08020429号 )

GMT+8, 2024-9-29 13:29 , Processed in 0.187420 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

返回顶部