找回密码
 注册
搜索
热搜: 回贴

如何采集需要验证码登录的网站

2009-12-15 01:45| 发布者: admin| 查看: 49| 评论: 0|原作者: 云天河

◎今天在用迅雷下载资源的时候突然想到一个问......



  今天在用迅雷下载资源的时候突然想到一个问题,就是采集需要验证码登录的网站的问题,普通的采集方式都不能获得cookies,所以对于此类网站普通采集方法都无效了。但是迅雷可以获取cookies,于是一个新的采集需要验证码登录的网站的方法出来了。
  首先注册登录你所需要采集的网站,比如http://www.xxxx.com/ ,然后用迅雷的批量下载需要采集的页面,批量规则为 http://www.xxxx.com/(*)a1a1.html ,然后把登录后的网页全部都下载下来,放到一个目录里面,然后把它们上传到你的网站的根目录,最后用你的采集系统来采集自己网站的这个目录里面的有规则的html文件即可。
  本方法操作起来没有一键采集那么方便就是,欢迎大家拍砖!
作者 angelboy 本文仅代表作者观点,与情缘站长教程网立场无关.


最新评论

QQ|小黑屋|最新主题|手机版|微赢网络技术论坛 ( 苏ICP备08020429号 )

GMT+8, 2024-9-29 23:22 , Processed in 0.196094 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

返回顶部