全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

IP归属甄别会员请立即修改密码
查看: 2470|回复: 16
打印 上一主题 下一主题

想爬一个10亿页面的站,求大婶指点

[复制链接]
跳转到指定楼层
1#
发表于 2017-10-24 16:33:42 来自手机 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
主要是,超过三百线程就会目标就会极慢极卡各种超时,502,内部错误,(超时设置的20秒),求大婶指点怎么搞速度又快又好
推荐
发表于 2017-10-24 21:08:00 | 只看该作者
建议直接联系站长,告诉他 如果你不把数据给我 我就开300线程 爬死你
2#
发表于 2017-10-24 16:34:40 | 只看该作者
多台vps爬 然后合并
3#
 楼主| 发表于 2017-10-24 16:37:06 来自手机 | 只看该作者
robit 发表于 2017-10-24 16:34
多台vps爬 然后合并

一个vps开100线程,三个vps一起搞,跟一个vps开300线程搞,基本效果一样吧。。。
5#
发表于 2017-10-24 16:43:16 | 只看该作者
10亿页面?那得多大的站
6#
发表于 2017-10-24 16:49:22 | 只看该作者
这是在爬Google吗?线程太多,爬死了吧?
7#
发表于 2017-10-24 16:59:04 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
8#
发表于 2017-10-24 18:47:28 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
9#
发表于 2017-10-24 18:59:38 | 只看该作者
lz怎么做的反爬策略
10#
发表于 2017-10-24 19:20:23 | 只看该作者
对方都被爬死了,你还要怎么的???没秒封你IP,没有给各种图片验证已经是很给你面子了,你还不赶快买台神威系列的主机给对方送过去???对方上线新主机之后,你就可以愉快的爬了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2026-1-14 22:54 , Processed in 0.068150 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表