在亚马逊云的RDS中支持几乎主流的数据库,对于亚马逊云中的数据库的问题排查对于我们的日常业务的稳定运行会很有帮助。本篇将对于Amazon RDS MySQL常见故障问题的分析和排查办法。
RDS提供了强大的适配工作负载功能
对于RDS的责任共担
RDS 常见连接问题
Check:
√ 客户端IP地址是否在DB实例的security group中
√ 如果是恢复的DB instance,需要关联安全组
√ VPC之外访问,检查公共子网是否与security group关联
√ 检查 IGW是否在路由表中
√ 确保网络控制列表(ACLs)中有允许入站和出站流量的规则
RDS突然连接失败了,应该从哪几方面检查?
1.连接数是否达到上限
2.CPU利用率是否达到100%
3.可用存储是否耗尽
RDS状态正常,但是用户连接失败?
RDS在同一天内发生了两次连接中断,发生了什么?
维护窗口:
1、自动升级
2、自动安排必要的软件修补布丁
Infra issue:
1、从自动或手动备份
2、时间点恢复(PITR)
怎样判断数据库当前运行是否正常?—借助高效的Cloudwatch服务
CloudWatch的作用:
1.自动收集、统计、分析数据库各种指标与状态
2.DBA必备技能之一
3.数据库性能诊断必备工具之一
重点关注如下指标:
1.DatabaseConnections
2.CPUUtilization
3.Freeablememory
4.FreeStorageSpace
5.读写延迟:ReadLatency/WriteLatency
6.读写IOPS:ReadIOPS/ WriteIOPS
标签:常见故障,RDS,是否,数据库,排查,Amazon,自动,连接 From: https://blog.51cto.com/u_16162099/8096265