目录
3.超过时限实在定位不了问题或者定位了问题短时间解决不掉,回滚应用
问题排查思路
题外话
个人观点,仅供查看
线上问题应急的原则
1.首先第一时间恢复系统
2.尽量保留现场和数据
3.处理和决断要快速
问题排查思路梳理
1.首先确定接口
2.前后端兵分两路排查
2.1前端:
2.1.1是否有代码变更,检查变更逻辑是否正确
如果有错误变更则修改
2.1.2字段是否用错
用错则修改
2.1.3是否有缓存(应用缓存/cdn缓存)
清理缓存
2.1.4是否有写死的数据
清理写死数据
2.1.5接口是否调用正确
调用错误则修改为正确接口
2.2后端
2.2.1查看接口响应是否正确
直接进服务器查看响应;
如果没有响应日志,且接口不写入数据,可以想办法模拟调用接口(curl/postman等工具)
2.2.2检查是否有代码变更;如果变更,检查变更代码
2.2.3是否有缓存(本地缓存/分布式缓存)
清理缓存或者更新缓存
2.2.4梳理代码逻辑
有错误则修复
2.2.5其它
配置错误:修改为正确配置