首页 > 其他分享 >定制化JDK升级引发的离奇事件

定制化JDK升级引发的离奇事件

时间:2022-08-24 11:01:47浏览次数:64  
标签:JDK 升级 MaxHeapSize 内存 离奇 定制 异常 pod

1、背景

由于Oracle对外宣称Oracle JDK停止免费用于商用。公司法务部门评估之后担心后续会惹上光司,于是就开始了JDK升级-将所有服务Oracle修改为OpenJDK。上周开始微服务JDK升级原本只不过是一个基础组件的升级,由于没有涉及业务代码的变更觉得问题不大。但怎么也想不到开始升级之后便陆陆续续出现服务不断重启的异常想象。这到底是咋了?

 

2、问题暴露

升级镜像之后,java服务频繁重启,服务对外的接口处于半不可用状态,具体表现为接口请求失败率5-10%(该接口对应数据看板主要是内部人员使用,之所以没有第一时间进行止损)

 

3、异常排查

本次升级除了更新基础JDK镜像,既没有业务代码的变更也没有修改配置,到底是什么原因导致的呢?

带着十分困惑的心情,我和团队开启了漫长的异常排查之旅。

1) 当时出现服务重启,第一感觉是启动耗时长导致探测接口超时超过一定阈值导致重启。

于是在发生异常重启的第1个小时内,我把探测超时由30s调大为60s,发现没有效果,于是又调大到90s, 可惜还是不奏效,服务还是出现一直重启的想象。


2)
接下来是怀疑pod所在的宿主机会不会是内存不足导致的呢?于是登陆宿主机查看内存

$ free -m 

 总内存128g, 可用内存有60g以上,宿主机的物理内存是足够的。

 

3)主机内存也是正常的,不知道JVM的监控是否有明显的异常提示呢?

到这个时候,距离升级已经过去2小时了。于是打开业务jvm的heap和gc次数监控看板,发现full gc还是比较规律的,没有明细的异常信息。

 

此时距离升级已经过去将近3小时了。实在找不到任何头绪了,难道只能回滚了吗? 

 

4)最后的最后,我们想到检查系统级别日志看看是否有异常提示,结果终于发现OOM的错误日志。

dmesg -T

结论:

到这里问题已经比较明显了,pod内部的Java服务异常申请内存超过内存上限(该pod配置的的内存limit值是4g)触发了系统的killer保护进程将pod进程kill掉。

 

4、根因定位

 虽然定位到是OOM原因导致的,但是为什么升级了JDK就导致OOM呢?

经过jinfo命令查看JVM启动参数终于发现根本原因。原来服务反复OOM被kill掉是因为“-XX:MaxHeapSize”参数失效导致Java进程使用默认值32g(物理机的1/4)超出了pod分配的limit上限8g。那为什么“-XX:MaxHeapSize”参数失效呢?那是因为新镜像给JAVA_OPS进行默认赋值,覆盖了之前启动参数JAVA_OPS的值。想要解决这个问题,需要取消OpenJDK镜像对于JAVA_OPS的默认赋值。

jinfo -flags 1

 

再次确认MaxHeapSize的默认值,通过执行以下命令可以看到MaxHeapSize默认值确实是系统总内存的1/4。

java -XX:+PrintFlagsFinal -version | grep MaxHeapSize

  

5、复盘

结合本次发布引起的异常做一次复盘,主要包含问题发生和修复完成的时间点以及故障原因分析与优化措施。见如下表格:

 

 

标签:JDK,升级,MaxHeapSize,内存,离奇,定制,异常,pod
From: https://www.cnblogs.com/SeaSky0606/p/16617740.html

相关文章

  • CentOS系统安装JDK1.8 详细教程
    一步步复制执行肯定能安装成功小白无压力1.下载wgethttps://repo.huaweicloud.com/java/jdk/8u202-b08/jdk-8u202-linux-x64.tar.gz2.安装(1)创建安装目录mkdir/u......
  • jdk下载与配置环境变量
    https://blog.csdn.net/linda11111111/article/details/126481070 1:注册oracle邮箱账户2:jdk官网下载官网:Oracle|CloudApplicationsandCloudPlatform   3:下......
  • nacos指定jdk版本启动
    问题描述:nacos运行的官方jdk环境为jdk1.8+,而我们有两台服务器的jdk是1.7,因为发布着其他应用,不好升级jdk,故需要在启动nacos时指定jdk为1.8解决方案:修改nacos启动脚本,指定......
  • JDK JRE JVM
    关键字:JDK,JRE,JVM摘要:JDK是Java语言的软件开发工具包(SDK)。在JDK的安装目录下有一个jre目录,里面有两个文件夹bin和lib,在这里可以认为bin里的就是jvm,lib中则是jvm工作所......
  • JDK新特性
    1.Lambda表达式1.1体验Lambda表达式【理解】案例需求启动一个线程,在控制台输出一句话:多线程程序启动了实现方式一实现步骤定义一个类MyRunnable实现Runnable接......
  • 阿里云Linux服务器部署JDK8实战教程
    下载地址https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html文件上传把下载的文件上传到阿里云服务器/usr/local/software的......
  • IntelliJ IDEA 设置 IBM Semeru JDK
    首先需要确定的是你的系统中已经安装了JDK可以输入 java-version 命令进行查看。  然后可以通过项目的配置JDK进行查看。  更换JDK版本选择上面......
  • JDK、JRE、JVM
    JDK、JRE、JVM的区别与联系注:B站狂神说Java教程学习笔记JDK:JavaDevelopmentKitJAVA开发者工具范围最大,包含JRE和JVM,含有开发者工具,可以进行Java编程、打包、编译等......
  • 来聊聊 OpenJDK 和 JVM 虚拟机
    自从Oracle收购Sun以后,Java世界也变了不少。好在Oracle还开源了个OpenJDK,并且很多东西都变了。OpenJDK就是一个桶,什么都可以往里面装,各大公司又纷纷推出自己的......
  • Linux安装jdk
     1,导入插件JDK依赖包yuminstallglibc.i686 2,卸载系统自带的OpenJDK以及相关的java文件①在命令窗口键入:java-version②在命令窗口键入:rpm-qa|grep......