JVM探究
- 对JVM的理解?Java8虚拟机和之前的变化
- 什么是OOM,什么是栈溢出,怎么分析
- JVM的常用调优参数
- 内存快照如何抓取,怎么分析Dump文件
- JVM中的类加载
ProcessOn思维导图工具
1.JVM的位置
- 操作系统之上,与其他应用程序平行的地位
2.JVM的体系结构
详细图解网上找
class file -> Class Loader SubSystem <=> Runtime Data Areas <=> Execution Engine
^ ^
| |
> Native Method Interface < <=> Native Method Library
- Class Loader SubSystem
- Runtime Data Areas
- Method Area
- Heap Area
- Stack Area
- PC Register
- Native Method Stack
3.类加载器
-
类加载器(ClassLoader)是Java语言的一项创新,也是Java流行的一个重要原因。在类加载的第一阶段“加载”过程中,需要通过一个类的全限定名(包名+类型名)来获取定义此类的二进制字节流,完成这个动作的代码块就是类加载器。这一动作是放在Java虚拟机外部去实现的,以便让应用程序自己决定如何获取所需的类。
-
作用:加载Class文件
-
虚拟机规范并没有指明二进制字节流要从一个Class文件获取,或者说根本没有指明从哪里获取、怎样获取。这种开放使得Java在很多领域得到充分运用,例如:
- 从ZIP包中读取,这很常见,成为JAR,EAR,WAR格式的基础
- 从网络中获取,最典型的应用就是Applet
- 运行时计算生成,最典型的是动态代理技术,在java.lang.reflect.Proxy中,就是用了ProxyGenerator.generateProxyClass来为特定接口生成形式为“*$Proxy”的代理类的二进制字节流
- 有其他文件生成,最典型的JSP应用,由JSP文件生成对应的Class类
……
-
类加载器虽然只用于实现类的加载动作,但是对于任意一个类,都需要由加载它的类加载器和这个类本身共同确立其在Java虚拟机中的唯一性。
-
类是模板,对象是具体的
-
加载器分类
从Java虚拟机的角度来说,只存在两种不同的类加载器:一种是启动类加载器(Bootstrap ClassLoader),这个类加载器使用C++语言实现(HotSpot虚拟机中),是虚拟机自身的一部分;另一种就是所有其他的类加载器,这些类加载器都由Java语言实现,独立于虚拟机外部,并且全部继承自java.lang.ClassLoader。
从开发者的角度,类加载器可以细分为:
- 启动(Bootstrap)类加载器:负责将 Java_Home/lib下面的类库加载到内存中(比如rt.jar)。由于引导类加载器涉及到虚拟机本地实现细节,开发者无法直接获取到启动类加载器的引用,所以不允许直接通过引用进行操作。(程序中获取不到->null)
- 标准扩展(Extension)类加载器:是由 Sun 的 ExtClassLoader(sun.misc.Launcher$ExtClassLoader)实现的。它负责将Java_Home /lib/ext或者由系统变量 java.ext.dir指定位置中的类库加载到内存中。开发者可以直接使用标准扩展类加载器。
- 应用程序(Application)类加载器:是由 Sun 的 AppClassLoader(sun.misc.Launcher$AppClassLoader)实现的。它负责将系统类路径(CLASSPATH)中指定的类库加载到内存中。开发者可以直接使用系统类加载器。由于这个类加载器是ClassLoader中的getSystemClassLoader()方法的返回值,因此一般称为系统(System)加载器。
4.双亲委派机制
- 类加载器之间的层次关系被称为类加载器的双亲委派模型。该模型要求除了顶层的启动类加载器外,其余的类加载器都应该有自己的父类加载器,而这种父子关系一般通过组合(Composition)关系来实现,而不是通过继承(Inheritance)
- 自顶向下依次是:启动类加载器 -- 扩展类加载器 -- 应用程类加载器 -- 自定义类加载器
- 使用双亲委派模型的好处在于Java类随着它的类加载器一起具备了一种带有优先级的层次关系。例如类java.lang.Object,它存在在rt.jar中,无论哪一个类加载器要加载这个类,最终都是委派给处于模型最顶端的Bootstrap ClassLoader进行加载,因此Object类在程序的各种类加载器环境中都是同一个类。相反,如果没有双亲委派模型而是由各个类加载器自行加载的话,如果用户编写了一个java.lang.Object的同名类并放在ClassPath中,那系统中将会出现多个不同的Object类,程序将混乱。因此,如果开发者尝试编写一个与rt.jar类库中重名的Java类,可以正常编译,但是永远无法被加载运行。
- 模型工作流程
- 类加载器收到类加载的请求
- 将这个请求向上委托给父加载器去完成,一直向上委托,直到启动类加载器
- 启动类加载器检查是否能够加载当前这个类,能加载就结束,使用当前的加载器,否则抛出异常通知子加载器进行加载
- 重复上一流程
- 系统实现:在java.lang.ClassLoader的loadClass()方法中,先检查是否已经被加载过,若没有加载则调用父类加载器的loadClass()方法,若父加载器为空则默认使用启动类加载器作为父加载器。如果父加载失败,则抛出ClassNotFoundException异常后,再调用自己的findClass()方法进行加载。
5.沙箱安全机制
-
Java安全模型的核心就是Java沙箱,沙箱是一个限制程序运行的环境,将Java代码限定在虚拟机特定的运行范围中,限制对本地资源(cpu、内存、文件系统、网络)的访问,防止对本地系统的破坏。
-
jdk1.0 本地资源默认可信,远程代码依靠于沙箱限制权限
-
jdk1.1 增加安全策略,允许用户指定访问权限
-
jdk1.2 增加代码签名,由类加载器加载到不同的运行空间区分权限
-
jdk1.6到现在,引入了域domain的概念,虚拟机中不同的受保护域对应不一样的权限
-
组成沙箱的组件
- 字节码校验器bytecode verifier:确保Java类文件遵循Java语言规范-核心类不会经过字节码校验器
- 类装载器class loader
- 防止恶意代码干涉善意的代码
- 守护被信任的类库边界
- 将代码归入了保护域,确定了代码可以进行哪些操作
- 存取控制器access controller:控制核心api对操作系统的存取权限,可以由用户指定
- 安全管理器security manager:核心api和操作系统之间的主要接口
- 安全软件包security package:java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括 安全提供者、消息摘要、数字签名、加密、鉴别
6.Native
- Java无法达到的范围,底层调用c语言的库
- 会进入本地方法栈,调用本地方法接口JNI,从而可以扩展功能
- 自定义native:类似Java中的native是给出了方法的声明,定义在c中实现,然后将c编译为dll可链接库放入Java相应的目录中即可调用
- 调用其他接口除了native,还可以通过socket、webservice、http~
7.PC寄存器
每个线程都有一个程序计数器Program Counter Register,是线程私有的,就是一个指针,指向方法区的方法字节码,在执行引擎读取下一条指令
8.方法区
- 共享区间,所有定义方法的信息都保存在这里
- 静态变量、常量、类信息、运行时的常量池存在方法区中
9.栈
- 主管程序的运行、生命周期和线程同步
- 对于栈不存在垃圾回收问题
- 线程结束、栈也结束
- 一个方法:方法索引、输入输出参数、本地变量、class file引用、父帧、子帧
10.三种JVM
查看当前的版本
java -version
- Sun HotSpot
- BEA JRockit
- IBM J9 VM
11.堆Heap
-
一个JVM只有一个堆内存,堆内存的大小是可以调节的
-
类加载器读取类文件后,会将引用类型的真实对象放在堆中
-
垃圾回收:主要在伊甸园区和养老区~
- 轻量级 - 清理伊甸园区
- 重量级Full GC - 同时清理伊甸园区和幸存者区
-
堆内存中细分为三个区域
- 新生区(伊甸园区) young、new
- 伊甸园EdenSpace
- 幸存0区:经历垃圾回收未被回收
- 幸存1区
- 养老区 old
- 永生区 perm -- jdk8后改为元空间 也称为非堆
- 新生区(伊甸园区) young、new
-
假设内存满了 -- OOM
12.新生区
- 类诞生、成长的地方,甚至死亡
- 分类
- 伊甸园区 ↓
- 幸存0区1区 0和1是动态交换的
13.老年区
13.永生区 -> 元空间 Perm
-
常驻内存,存放一些自带的jdk对象,存储的一些运行时环境或类信息,这个区域不存在垃圾回收
-
关闭虚拟机时释放该内存
-
变化
- jdk1.6之前:永久代,常量池是在方法区
- jdk1.7:永久代,但是慢慢的退化了,去永久代,常量池在堆中
- jdk1.8之后:无永久代,常量池在元空间 -- 包含方法区
-
逻辑上存在、物理上不存在 -- 可能程序中输出发现并没有这部分空间的占用
14.堆内存调优
-
默认情况下,分配的总内存是电脑内存的1/4,而初始化的内存为其1/64
-
排错:内存快照分析工具、MAT(eclipse)、Jprofiler(idea)
MAT Jprofiler作用:
- 分析Dump内存文件,快速定位内存泄漏
- 获得堆中的数据
- 获得大的对象
- ...
-
demo:
-Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError # 发生内存溢出时生成dump文件
-
-Xms 设置初始内存分配大小
-
-Xmx 设置最大分配内存
-
-XX:+PrintGCDetails 打印回收信息
-
-XX:+HeapDumpOnOutOfMemoryError oom DUMP
-
15.GC | 常用算法
GC大部分时候都是在回收新生代,而不是三个地方统一回收
- 新生代区
- 幸存区-from&to
- 老年区
两种
- 轻GC/普通GC
- 重GC/全局GC
算法
- 标记清除法
- 扫描对象,对活着的对象进行标记;清除,对没有标记的对象进行清除
- 缺点:两次扫描浪费时间,会产生内存碎片 优点:不需要额外的空间
- 标记压缩/标记清除压缩算法
- 对标记清除的优化
- 标记清除 -> 压缩:防止内存碎片产生,再次扫描,向一端移动存活的对象
- 缺点:比标记清除法多了压缩的时间成本
- 优化:先标记清除若干次再进行压缩
- 复制算法
- 'from'与'to',空的为'to'
- 当一个对象受到15(default 通过
-XX:MaxTenuringThreshold=
设置)次gc还存活,那么进入老年区 - 好处:没有内存碎片 坏处:浪费内存空间,有一半幸存区总为空,极端情况下开销大
- 使用场景:对象存活率低-新生区
- 引用计数器
- 为每一个对象分配一个计数器,使用就+1,如果没有使用(为0)就回收该对象
- 计数器本身也有消耗,低效\过时
比较
- 内存效率: 复制算法>标记清除>标记清除压缩>
- 内存整齐度:复制算法=标记压缩>标记清除
- 内存利用率:标记压缩算法=标记清除>复制算法
选取合适的算法:
- 年轻代:存活率低 -- 使用复制算法
- 老年代:存活率高区域大 -- 标记清除+标记清除压缩
- ...
16.JMM-Java Memory Model
- 作用:
- 缓存一致性协议,定义数据读取的规则
- 定义了线程工作内存(Local Memory)和主内存(Main Memory)之间的抽象关系,线程之间的共享内存存储在主内存,每个线程都有一个私有本地内存
- 解决共享对象可见性 volatile
- 八种操作指令(read/load/use/assign/store/write/lock/unlock),JMM定义了对这八种操作进行限制的规则
17.单点登录
- 概念:多系统共存环境下,用户只需要登录一个系统,就可以得到所有系统的信任
- SSO:SSO (Single Sign-On) 是一种身份认证的解决方案,允许用户只需要一次登录就能够访问多个独立的应用程序或系统。
- 实现:OAuth2.0 、OpenID Connect