◎今天在用迅雷下载资源的时候突然想到一个问...... 今天在用迅雷下载资源的时候突然想到一个问题,就是采集需要验证码登录的网站的问题,普通的采集方式都不能获得cookies,所以对于此类网站普通采集方法都无效了。但是迅雷可以获取cookies,于是一个新的采集需要验证码登录的网站的方法出来了。 首先注册登录你所需要采集的网站,比如http://www.xxxx.com/ ,然后用迅雷的批量下载需要采集的页面,批量规则为 http://www.xxxx.com/(*)a1a1.html ,然后把登录后的网页全部都下载下来,放到一个目录里面,然后把它们上传到你的网站的根目录,最后用你的采集系统来采集自己网站的这个目录里面的有规则的html文件即可。 本方法操作起来没有一键采集那么方便就是,欢迎大家拍砖! 作者 angelboy 本文仅代表作者观点,与情缘站长教程网立场无关. |
|小黑屋|最新主题|手机版|微赢网络技术论坛 ( 苏ICP备08020429号 )
GMT+8, 2024-9-29 23:22 , Processed in 0.196094 second(s), 12 queries , Gzip On, MemCache On.
Powered by Discuz! X3.5
© 2001-2023 Discuz! Team.