找回密码
 注册
搜索
热搜: 回贴

面对采集,我们该放弃还是坚持

2009-12-15 01:44| 发布者: admin| 查看: 69| 评论: 0|原作者: 情殇

【采集这个词语我很早就明白,但是却没有对我......



  采集这个词语我很早就明白,但是却没有对我产生过任何的影响,但是自从4年前接触了完整之后,采集似乎就和我形影不离,每次想一个新的站的时候,总是会想如何去采集到数据,如何采集到好的数据。
  采集是把双刃剑,有的人靠采集月如上万,有的人靠采集艰难度日,有的人靠采集是举步维艰啊。如何采集才是比较有效的采集了,为什么有的人好像混得好些,但从采集的角度,来分析下吧。
  先说采集的工具,现在主流的CMS可以说采集器是必备的模块,也是CMS的出现才让采集网站变得如此的风行,如此的大众化。但是CMS采集也有他的弊端,所以火车头的这样的万能采集器诞生了,但是这样的程序都是以规则定采集的模式,也就是说要写学下采集规则,才能采到数据。于是又出现了像爱聚合建站这样的智能程序,不需要写规则就可以采集到数据,可以说是站长的要求才推动了程序的发展。
  采集网站的程序靠三个因素,第一是采集工具,第二是采集源,第三是发布程序。
  采集源却是成功的一个重要环境,我认为采集的内容有三个原则:第一是,大家都才的地方我绝对不采,第二绝对不通过百度去寻找采集源,第三,采集的数据一定要做处理。为什么这样说了?比如做论文站的,大家都会去采集studa的论文,这样重复就太严重了,如果没有好的采集源,我宁愿不做这个站。寻找大家不常用的采集源,可以选择一些问答系统,论坛系统,反正就是获得数据。为什么不要通过百度去找了?有的人现在还是热衷于采集百度的知道,早期的的确是获得了很大的流量,但是现在的环境下,还可能吗?采集的数据做处理,其实很简单,最简单的方法就是截取前200个字,在文章的前面重复一遍,这个一遍的cms都可以做到的。
  采集应该放弃还是坚持了?我想热衷于此的人是不会放弃,被采集深深伤过的站长可能已经放弃。
  本文首发:www.aijuhe.net
作者 男人猫 本文仅代表作者观点,与情缘站长教程网立场无关.


最新评论

QQ|小黑屋|最新主题|手机版|微赢网络技术论坛 ( 苏ICP备08020429号 )

GMT+8, 2024-9-30 01:38 , Processed in 0.164484 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

返回顶部