情况
我们发现CDH中一个hbase的regionServer节点经常自动停止,没有明显的错误信息。
重启后又过一小段时间又自动停止
原因
这种情况一般都是需要排查相关服务的日志的,比如我们是regionServer节点的服务,则需要先看regionServer节点的日志。
很幸运的是 原因很快就找到了。
一进入日志界面就报错找不到日志文件路径。
一般这种情况有可能是读写权限的问题。
然后我们登录服务器去查看这个目录,发现dfs2目录进不去,报错 input error。
这种情况是 挂载的硬盘损坏了,出现了坏道,导致读取不了数据。
解决方式
重新更换挂载硬盘 或者 先修改配置 修改regionServer节点使用到dfs2目录的配置,指向其他目录。同时需要注意读写权限的问题。