首页 > 其他分享 >【故障公告】它(变异的百度蜘蛛)又来了,雪上加霜又添恐怖的三月

【故障公告】它(变异的百度蜘蛛)又来了,雪上加霜又添恐怖的三月

时间:2023-03-25 16:22:43浏览次数:42  
标签:负载 老大 IP 雪上加霜 带宽 蜘蛛 屏蔽 园子 百度

今天12点左右,它又来了,熟悉的恐怖身影(116开头IP段、山西的某个城市),不是cc攻击,是那只让人敬畏的蜘蛛。

2022年4月3日,它的首次来访在园子里掀起狂风暴浪,数据库连接数过万,负载均衡带宽跑满,带宽扩容50%依然跑满,当时我们通过限制同一个IP每天的请求数侥幸躲过。

2022年5月4日,它如同吃了兴奋剂般变得格外疯狂,由于触发IP请求数限制被重定向到登录站点,但它龙卷风般的天量请求直接冲垮登录站点,无奈之下,我们屏蔽了这个IP网段。

它有成千上万的IP,我们屏蔽的IP网段只有255个IP,看索引量没有大的变化,我们天真地以为影响不大,却不知因此得罪了中文互联网的老大。

于是,园子遭遇2022年最悲惨的境遇——被它拉黑,在搜索结果中对园子全面降权,我们才见识了老大的厉害。

后悔自己的天真,感叹老大的厉害,我们进行了亡羊补牢——放开了屏蔽了的IP网段,期待老大的网开一面。

解除屏蔽后观察了1-2月,搜索流量并没有明显的回升,看来这次真的是惹怒了老大。

在观察期间,我们有了一个惊人的发现——每天光临园子最多的竟然是它,每天竟然访问1000多万次,园子的博文总数也就在1000万篇左右,日理万机的它竟然会每天看园子的每篇博文,难道准备以后改行当程序员?

接着,我们又有一个发现,每天千万次的访问竟然消耗了园子近一半的带宽费用,对于囊中羞涩的园子来说有点吃不消,每天让它看园子的每篇博文,还得给它倒贴带宽费,而且在搜索排名中继续被拉黑着。

于是,我们采取了一个应对之策,专门提供一个负载均衡给它访问并限制了峰值带宽,这样不仅可以控制带宽费用,而且在它发飙的时候减少宕机。

从去年到今天中午,它被我们这个对应之策通过专用负载均衡关进笼子里,即使被限制了带宽,它也会很多时候给园子带来3000-4000的QPS,所以来个cc攻击,园子就格外难以撑住。

今天中午,恐怖的事情发生了,它开始不遵守针对搜索引擎的dns解析,从笼子里跑出来了!

近一年后它依然如此彪悍,如此毫无忌惮,园子依然扛不住,除非屏蔽 IP 段,但又不敢再次得罪依然威风凛凛的老大,目前只是临时限制它所访问的负载均衡的带宽,但这会让访问这些负载均衡的正常用户受影响。

非常抱歉,这个突发问题给您带来了麻烦,我们正在进一步想办法,争取找到更好的解决方法。

标签:负载,老大,IP,雪上加霜,带宽,蜘蛛,屏蔽,园子,百度
From: https://www.cnblogs.com/cmt/p/17254793.html

相关文章

  • 与百度文心玩文字冒险游戏[寻五宝石]
    百度文心测试我:请开始一个文字冒险游戏。由你来描述游戏场景(盗墓情节),由我来决定采取的动作。请详细描述场景中所有的物品、生物。如果场景中的人物在对话或者跟主角对话,请......
  • 【K哥爬虫普法】大众点评VS百度地图,论“数据权属”对爬虫开发的罪与罚!
    我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的......
  • 百度地图API的使用
    百度地图API使用注意:1、需要引入百度地图2、需要AK(一个AK可以多个项目使用)3、有时候放大后白屏,可能是因为那个地方本来就没有东西,类似海里一样百度地图使用步骤:1、......
  • 摸着OpenAI过河,百度文心一言能否“重拳出击”?
    “文心一言”对标ChatGPT,饱含争议。文心一言作为一款语言大模型,并提出了自己在技术对就业的影响方面的理解,现阶段正处于摸着OpenAI过河的时候,路该如何走?GPT-4太惊艳,压力......
  • 使用百度UNIT搭建智能对话系统_订火车票实例
    今天我们来一个没有代码的教程,无需编程基础也能学会搭建智能对话系统,在学习之前,我们先来了解一下对话系统的专业术语:单轮对话:简单的一问一答,问题可以用一句话来描述,......
  • 百度地图地址转换
    百度坐标谷歌坐标BD-09WGS-84GCJ-02国内的地图坐标并不是实际的坐标,不解释。在实际的实现中可能会需要坐标的转换,比如以下的场景:1,原有的地图数......
  • 使用Java调用百度搜索
    自己没搜索引擎,又想要大规模的数据源,怎么办?可以对百度搜索善加利用,以小搏大,站在巨人的肩膀上。有很多的应用场景可以很巧妙地借助百度搜索来实现,比如网站的新闻采集,比如技术......
  • Qt+百度AI文字识别OCR小工具
    Qt+百度AI文字识别mOCR小工具@目录Qt+百度AI文字识别mOCR小工具介绍编译环境界面功能To-doList介绍基于百度AI开放平台的OCR文字识别小工具,用Qt5编写。实现通用识别,精......
  • 百度文心一言正式亮相
    OpenAI刚发布了GPT-4,百度预热已久的人工智能生成式对话产品也终于亮相了。昨天下午,文心一言(ERNIEBot)—— 百度全新一代知识增强大语言模型、文心大模型家族的新成......
  • 获取百度地图的某个经纬度最近的地名
    importjava.io.BufferedReader;importjava.io.InputStreamReader;importjava.net.HttpURLConnection;importjava.net.URL;importjava.net.URLEncoder;importor......