全球主机交流论坛

标题: 想爬一个10亿页面的站,求大婶指点 [打印本页]

作者: 总有刁民想害朕    时间: 2017-10-24 16:33
标题: 想爬一个10亿页面的站,求大婶指点
主要是,超过三百线程就会目标就会极慢极卡各种超时,502,内部错误,(超时设置的20秒),求大婶指点怎么搞速度又快又好
作者: robit    时间: 2017-10-24 16:34
多台vps爬 然后合并
作者: 总有刁民想害朕    时间: 2017-10-24 16:37
robit 发表于 2017-10-24 16:34
多台vps爬 然后合并

一个vps开100线程,三个vps一起搞,跟一个vps开300线程搞,基本效果一样吧。。。
作者: 蝴蝶    时间: 2017-10-24 16:38
爬死了
作者: magickey    时间: 2017-10-24 16:43
10亿页面?那得多大的站
作者: 小妹妹来吃鸡吧    时间: 2017-10-24 16:49
这是在爬Google吗?线程太多,爬死了吧?
作者: dream7758521    时间: 2017-10-24 16:59
提示: 作者被禁止或删除 内容自动屏蔽
作者: 大风起    时间: 2017-10-24 18:47
提示: 作者被禁止或删除 内容自动屏蔽
作者: jbiao520    时间: 2017-10-24 18:59
lz怎么做的反爬策略
作者: EIZOFANS    时间: 2017-10-24 19:20
对方都被爬死了,你还要怎么的???没秒封你IP,没有给各种图片验证已经是很给你面子了,你还不赶快买台神威系列的主机给对方送过去???对方上线新主机之后,你就可以愉快的爬了
作者: bbqbbqtt    时间: 2017-10-24 19:22
楼主是晒如何怕死一个站点吧
作者: EIZOFANS    时间: 2017-10-24 19:24
不过对于一个10个页面以上的 网站,连300个线程都扛不住的话,如果不是优化太差,就是用的10多刀那种VPS了,找出目标机房来,给管理员一点美刀,直接拷给你算了,免得浪费你挂机的电费
作者: EIZOFANS    时间: 2017-10-24 19:26
jbiao520 发表于 2017-10-24 18:59
lz怎么做的反爬策略

再牛的反爬,只要是要给观众看的,就能爬下来,无外乎代理池,cookie池再外加验证码自动识别(人肉)了
作者: 521vps    时间: 2017-10-24 19:28
降低线程数 或者 线程启动加个延迟试试
作者: 此号被封    时间: 2017-10-24 19:53
把对方爬死了这
作者: saiyadi    时间: 2017-10-24 19:57
10亿……不吹能死么老铁
作者: liceen    时间: 2017-10-24 21:08
建议直接联系站长,告诉他 如果你不把数据给我 我就开300线程 爬死你




欢迎光临 全球主机交流论坛 (https://4414.19990909.workers.dev/) Powered by Discuz! X3.4