下班前的一场暴风雨,让园子一片狼藉。顶着暴风雨,加了服务器,但无济于事。情急之中,断蛛求生立转机。
今天下班前的 17:00~17:30 左右,身份未明的爬虫暴风雨般地袭击园子,造成数据库连接过万,全站宕机,由此给您带来很大的麻烦,请您谅解。
最终我们通过给百度蜘蛛断网才恢复正常,造成暴风雨的爬虫不一定是百度蜘蛛,由于缺乏足够的数据,这次袭击园子的爬虫身份无法确认。
给百度蜘蛛断网,是为了减少服务器的总负载,在上次故障时我们只屏蔽了一个网段(255个IP)的百度蜘蛛,还有大量百度蜘蛛每天在园子里爬来爬去,虽然这些蜘蛛被关在笼子里(限制了带宽),但依然会给服务器带来不小的压力,让园子在暴风雨来袭时格外弱不禁风。
百度蜘蛛专用负载均衡 QPS 监控图:
非常抱歉!园子这段时间故障有点多。
曾经的一系列故障公告,是我们鲁莽走进云计算初期时代的痛苦代价。
现在还未成系列的故障公告,也许是 AI 时代即将到来的被代价。
不管怎么样,不管是代价还是被代价,AI 时代真的要来了。
标签:宕机,故障,爬虫,蜘蛛,园子,至园,暴风雨,百度 From: https://www.cnblogs.com/cmt/p/17270037.html