1、并行与并发的区别
并发是同一时间处理多件事的能力,比如多个线程轮流使用一个CPU
并行是同一时间做多件事的能力,比如4核CPU同时执行4个线程
关键区别在于是否同时执行
2、创建线程的方式有哪几种?Runnable与Callable有什么区别?run方法与start方法有什么区别
-
继承Tread类 ——直接调用start执行线程
-
实现Runnable接口——先创建MyRunnable对象,再创建Thread对象(将MyRunnable作为构造器参数),再执行start方法
-
实现Callable接口——先创建MyCallable对象,再创建futureTask对象,再创建Tread对象,再执行start方法
-
线程池创建(项目中一般使用方式)——对象要实现Runnable,然后创建线程池对象,调用线程池对象的submit方法
Runnable与Callable的区别:
-
Runnable接口的run方法没有返回值,而Callable接口的call方法有返回值,可以配合FutureTask获取返回结果
-
Runnable接口的run方法的异常只能在内部消化,而Callable接口的call方法可以将异常抛出
run方法与start方法区别:
-
start方法是开启一个线程,然后线程去调用run方法,start方法只能被调用一次
-
run方法封装了线程要执行的方法,可以调用多次
3、线程包含了几种状态,状态之间是如何转换的
线程包含了六种状态:
-
新建(New):创建线程对象时
-
可执行(Runnable):调用start方法后,有执行资格
-
阻塞(Blocked):进入可执行状态后,无法获得锁
-
等待(Waiting):执行时调用Wait方法进入(wait方法会释放锁)
-
计时等待(Timed_Waiting):执行时调用Time.sleep进入
-
死亡(Terminated):运行结束,线程死亡,变成垃圾
5、假设有t1,t2,t3三个线程,如何保证他们按顺序执行?
第一种方法:调用join方法:它使当前线程进入time_waiting状态,直到调用join方法的线程结束,比如t1.join(),就是在t1结束后才会继续运行。
具体:在t2线程的run方法中调用t1.join,在t3线程的run方法中调用t2.join
第二种方法:使用计数器countdownLatch:它需要先设定一个起始值,然后在线程中调用countdown方法让值-1,当值为0时,会解除wait状态
具体:
countDownLatch1.await(); //第一个计数器值为0时结束等待 System.out.println("拿出一瓶牛奶!"); //执行线程方法 countDownLatch2.countDown(); //让控制另一个线程的计数器值为0
篇幅限制下面就只能给大家展示小册部分内容了。整理了一份核心面试笔记包括了:Java面试、Spring、JVM、MyBatis、Redis、MySQL、并发编程、微服务、Linux、Springboot、SpringCloud、MQ、Kafka 面试专题
需要全套面试笔记【点击此处即可】免费获取
5、wait和sleep方法有哪些不同?
wait方法是Object类方法,每个对象都有,而sleep方法是Tread类静态方法
wait方法需要在同步块(synchronized)中执行,并且需要先获取锁,而sleep方法没有这个限制
wait方法执行后会释放锁,而sleep方法在拿到锁的情况下执行不会释放锁
6、为什么wait方法和notify方法要在synchronized关键字中使用?
从程序层面来说:不这样做会报IllegalMonitorStateException错误
从线程安全层面来说:如果不加同步锁,wait() 方法还没有执行完,notify() / notifyAll() 方法已经执行完,这样 notify() / notifyAll() 就进行了一次空唤醒操作,而 wait() 执行完后由于再没有notify() / notifyAll()的唤醒,会导致wait() 所在线程一直阻塞。
从底层代码层面来说:
首先,每个Java对象底层都会关联一个 Monitor 对象,在 Monitor 中维护了 两个队列 WaitSet 和 EntryList ,owner 属性。
synchronized( lock ) 被调用后会将当前线程 赋值给lock对象所关联的 monitor 对象的 owner 属性,其他线程 再想获取 lock 锁对象的话如果发现 lock对象所关联的 monitor 对象的 owner 属性不为空,就会进入 EntryList 进行阻塞,而调用了wait() 后就会将 owner 指向的线程对象放入 WaitSet 中进行等待,并将 owner 置为 null (释放掉锁),直到其他线程获取到 lock 这个对象锁以后通过 notify() / notifyAll() 方法 唤醒 WaitSet 中 的线程,这时 WaitSet中等待的线程才会进入 EntryList 参与lock 锁的竞争。( notify() / notifyAll() 并不会释放锁,只有等待 synchronized 执行完才会释放锁 )
7、Synchronized关键字底层原理
synchronized是采用互斥的方式,让同一时刻只能有一个线程能够获取对象锁
java中的Synchronized有偏向锁,轻量级锁,重量级锁三种形式,分别对应了只被一个线程所有,被多个线程交替持有,被多个线程竞争三种情况
在对象锁被多个线程竞争的情况下(重量级锁):
-
底层由Monitor实现,Monitor是JVM级别的对象,Monitor分为三个部分,owner,entryset,waitset
-
当一个线程要获取对象锁时,会先将对象与Monitor关联,然后将owner与当前线程绑定
-
如果owner已经被其他线程绑定了,当前线程就会加入到entryset中进入阻塞状态
-
另外,当对象调用wait方法时,当前线程会进入到waitset队列中进入阻塞状态
在对象锁被多个进程无竞争交替持有的情况下(轻量级锁):
这个时候不需要monitor
当线程尝试获取锁时,会创建一个栈帧,栈帧里包含一个锁记录的结构,主要内容有锁记录地址和对象指针
执行到加锁时,让锁记录中的对象指针指向对象,并尝试使用cas替换锁记录地址和对象头中的mark word,如果标记位为无锁则进行交换,如果非无锁,则有两种情况
1、其他线程已经获取了这个对象的锁,当前线程获取锁失败,线程会尝试自旋获取锁,如果自旋次数超过一定阈值,或者存在多个线程在等待同一个锁,轻量级锁会升级为重量级锁
2、当前线程已经获取了这个对象的锁(锁重入),也就是对象头的mark word指向当前线程的栈帧,此时会在栈帧中再添加一条锁记录,并设置锁记录的锁地址为null,最后在退出synchronized代码块时,如果有锁记录地址为null的锁记录,会清除锁记录,表示重入次数-1
当对象锁被一个线程持有的情况下(偏向锁):
在上文中可知,轻量级锁在没有竞争时(还是这个线程来获取锁),将会发生锁重入,要执行CAS操作,并在栈桢创建新的锁记录。这样耗费了资源。
优化方式:只有第一次使用CAS将线程ID设置到被锁对象的MarkWord中,以后再来的线程只用验证这个线程ID是自己则没有竞争,无需CAS。
加锁过程:在当前线程的栈帧中创建一个锁记录对象,然后将锁记录的Lock record地址与对象的mark word进行CAS操作,
9、synchronized与lock有什么区别?
从语法层面来说:synchronized关键字是在JVM中实现的,通过c++实现
从功能层面来说:
-
两者都属于悲观锁,都具备基本的互斥,同步,锁重入功能,
-
而lock支持更多synchronized不支持的功能:如可中断等待(lock.lockInterruptibly()),公平锁,可设置等待超时(tryLcok(time,unit)),可选择性通知(condition)
-
lock还提供了多种不同场景的实现,如ReentrantReadWriteLcok(读写锁)
从性能层面来说:synchronized提供了偏向锁,轻量级锁,在竞争不激烈的情况下性能很好,而lock在竞争激烈的时候,通常会有更好的表现,因为提供更多的功能。
10、CAS你知道吗?
CAS(compireAndSwap)比较并交换,它体现了乐观锁的一种思想,在无锁的情况下保证线程操作数据的原子性,它的内部存在3个操作数
1、变量内存值V
2、旧的预期值A
3、准备设置的新值B
当执行CAS指令时,只有当V=A时,才会去执行B更新V的值,否则不会更新
当多个线程同时使用CAS去操作一个变量时,只有一个线程会执行成功,其他线程均会失败,然后会重新尝试或将线程挂起(阻塞)
另外,CAS是一种系统原语,它的执行一定是连续不被中断的,也就不存在并发问题,这样就保证了原子性
CAS虽然能很高效的解决原子操作,但是仍然存在问题
-
ABA问题 因为CAS只是判断获取值和在操作时这个值之间的时间该没改变来进行操作,当在这个时间内如果有一个操作修改了这个内存变量的值,由A改为B再改为A,这时CAS会认为这个值从来没有变过,但是值其实已经发生了一次改变
-
循环时间长时开销大 因为底层是自旋锁,当操作迟迟无法完成的时候,会对CPU带来非常大的开销
-
只能保证一个共享变量的原子操作 当对多个共享变量进行原子操作时,循环CAS就无法保证操作的原子性
11、什么是AQS?
AQS全称abstractQueueSynchronizer,即抽象队列同步器,是一种锁机制,它是作为一个基础框架使用的,像Reentrantlock,countdownlatch都是基于AQS实现的
AQS内部维护了一个先进先出的双向队列,队列中存储了排队的线程
AQS还维护了一个state,表示锁的状态,0为无锁状态,1为有锁状态,如果一个线程将state修改为1,就相当于当前线程获得了资源
对state的修改使用cas操作,保证多线程下的原子性
12、ReentrantLock底层原理是什么
ReentrantLcok意为可重入锁,和synchronized一样,当一个线程已经获得锁,再去尝试获得锁时,不会阻塞而是直接获得
ReentrantLock的底层是基于CAS+AQS实现,AQS的底层维护了一个state和一个双向队列,当有线程来抢锁时,会使用cas的方法来对state进行修改,如果修改成功,就将ReentrantLock中的ownerTread属性指向当前线程,如果修改失败,就会插入到双向队列的队尾
ReentrantLock支持公平锁和非公平锁两种实现,如果使用无参构造器,就是非公平锁,也可以传参true设置为公平锁。
13、悲观锁、乐观锁和分布式锁的实现和细节
悲观锁:认为线程安全问题一定会发生,所以在操作数据之前先获取锁,保证线程串行执行,例如synchronized,lock
细节:
悲观锁适合插入数据
锁的粒度要尽量小,只锁住需要串行执行的代码
配合事务使用时,要先提交事务再释放锁
乐观锁:认为线程安全问题不一定会发生,因此不加锁,只是在操作数据前判断是否有其他线程对数据做了修改,如果没有被修改则说明线程安全,更新数据,反正说明出现了线程安全问题,可以重试或者返回异常,例如给表加字段version,cas操作
细节:
乐观锁适合更新数据
更新前要先查询version,更新时比较version是否相同
分布式锁:满足分布式系统或集群模式下多进程可见且互斥的锁,常见的实现有redis和zookeeper,redis通常利用setnx方法
细节:
锁的误删,比如线程1拿到锁但是出现了阻塞导致锁自动释放,在线程2拿到锁后执行业务逻辑时,线程1反应过来,继续执行,最后将本已经不属于他的锁误删了
锁的误删解决:设置锁的唯一标识,每个线程在获取锁时,设置锁的value为线程唯一标识(可以用uuid实现),释放锁时判断锁的value是否跟自身线程唯一标识一致,一致才能释放
14、什么是死锁,死锁产生的条件?如何避免死锁?
死锁就是一组互相竞争资源的线程,因为互相等待又互不相让资源,导致永久阻塞无法进行下去的情况
死锁产生的条件有四个:
-
互斥条件:资源x和y只能分别被一个线程占用
-
占有且等待:线程t1占有资源x后,等待资源y被释放,同时自己不释放资源x
-
不可抢占:其他线程不能强行抢占线程t1占有的资源
-
循环等待:线程t1等待线程t2占有的资源,线程t2等待线程t1占有的资源
避免死锁的方法(破坏对应的条件):
-
一次性申请所有资源(破坏互斥条件)
-
占有资源的线程,在申请其他资源时,如果申请失败,可以主动释放自己的资源(破坏占有且等待条件)
-
按照顺序去申请资源,然后反序释放资源,破坏循环等待条件
15、ConcurrentHashMap底层原理
ConcurrentHashMap是在HashMap的数据结构上,增加了CAS操作和Synchronized互斥锁来保证线程安全,并且使用volatile关键字修饰了node中的next和val字段来保证多线程环境下某个线程新增或修改节点对于其他线程是立即可见的。
在进行添加操作时:
-
计算hash值,定位该元素应该添加到的位置
-
如果不存在hash冲突,即该位置为null,则使用CAS操作进行添加
-
如果存在hash冲突,即该位置不为null,则使用synchronized关键字锁住该位置的头节点,然后进行添加操作
16、线程池的核心参数和执行原理?
线程池的核心参数有七个:
corePoolSize:核心线程数
maximumPoolSize:最大线程数量,核心线程+救急线程的最大数量
keepAliveTime:救急线程的存活时间,存活时间内没有新任务,该线程资源会释放
unit:救济线程的存活时间的单位
workQueue:工作队列,当没有空闲核心线程时,新来的任务会在此队列排队,当该队列已满时,会创建应急线程来处理该队列的任务
treadFactory:线程工厂,可以定制线程的创建,线程名称,是否是守护线程等
handler:拒绝策略,在线程数量达到最大线程数量时,实行拒绝策略 拒绝策略:
线程池执行原理:
17、线程池常见的阻塞队列?
常见的阻塞队列有:
ArrayBlockingQueue:基于数组结构的有界阻塞队列,FIFO
LinkedBlockingQueue:基于链表的有界阻塞队列,FIFO
两者区别(链表与数组的区别)
ArrayBlockingQueue | LinkedBlockingQueue |
底层是数组 | 底层是链表 |
强制有界 | 默认无界,传递容量参数后有界 |
初始化时即创建好node对象数组 | 插入时才创建node对象 |
两把锁(头尾) | 一把锁 |
LinkedBlockingQueue的优点是锁分离,很适合生产和消费频率差不多的场景,这样生产和消费互不干涉的执行,能达到不错的效率
18、线程池核心线程数如何确定?
没有固定答案,先设定预期,比如我期望的CPU利用率在多少,负载在多少,GC频率多少之类的指标后,再通过测试不断的调整到一个合理的线程数
公式:
分三种情况
高并发,任务处理时间短 ——》CPU核数+1,减少线程上下文切换
并发不高,任务处理时间长 IO密集型任务——》CPU核数*2+1
读写多,DB操作多,CPU占用少,并且IO数据传输时,是不占用CPU的,所以就可以多释放CPU资源,给其他线程运行,
CPU密集型任务——》CPU核数+1
CPU占用高,如计算任务,视频解码任务,这些任务线程上下文切换开销大,所以要尽量减小开销,提高CPU效率
19、线程池的种类有哪些
在JUC的Executor类中,提供了多种创建线程池的方法,主要有四种
1、固定线程数的线程池
核心线程数与最大线程数一样,没有救急线程
阻塞队列是LinkedBlockingQueue,最大容量是Integer.MaxValue
适合任务量已知,相对耗时的任务
2、单例线程的线程池
核心线程数和最大线程数都是1,没有救急线程
阻塞队列是LinkedBlockingQueue,最大容量是Integer.MaxValue
适合按顺序执行的任务,与单线程的区别是,单线程运行完了就会销毁,而线程池创建的线程运行结束不会销毁,而是等待下一个任务,可以重复使用,减少了创建线程和销毁线程的时间,提高资源利用率。
3、可缓存的线程池
核心线程数为0,最大线程数为Integer.MaxValue,救急线程存活时间为1分钟
阻塞队列为SynchronousQueue:不存储元素的阻塞队列,每一个插入操作必须等待一个移除操作
适合任务比较密集,且任务执行时间短的情况,因为使用的是救急线程,在一定时间没有新任务后就会销毁,节省资源,同时能应付任务密集的时间段。
4、可以定时执行的线程池
核心线程数自定义,最大线程数为Integer.MaxValue
适合需要定时执行任务的场景
20、线程池使用场景
1、批量将pgsql数据导入ES
计算数据总条数——》固定每页200条,计算总页数N——》将页数N设置为CountdownLatch的count——》创建N个线程批量导入,每次导入完调用countdown方法——》主线程中调用await方法,线程都执行完后,主线程结束
2、异步调用
用户搜索需要保存搜索记录,但保存功能不能影响正常搜索——》搜索时通过线程异步调用保存记录功能
关键注释:@EnableAsync加在SpringBoot启动类上,@Bean将自定义线程池注入到容器中(核心8,最大8), @Async("线程池名称")加在需要异步调用的方法上,
21、对ThreadLocal的理解,ThreadLocal内存泄漏问题
ThreadLocal是java.lang包中的一个类,它实现了线程之间的资源隔离,让每个线程都有自己的独立资源
ThreadLocal的底层实现的关键是它的静态内部类ThreadLocalMap
-
每个Thread对象都有一个成员变量threadlocals,它指向一个ThreadLocalMap,该Map以ThreadLocal为key,需要存储的线程变量为value
-
当调用ThreadLocal的set()方法时,会先拿到当前线程对象的ThreadLocalMap,然后以当前ThreadLocal为key将变量存储到map中,调用get方法和remove方法时也是通过这个key去操作。
ThreadLocal内存泄漏问题:
回答这个问题,我们首先要知道java中的四种引用
强引用:强引用是最常见的,只要把一个对象赋值给一个引用变量,那么这个对象就被强引用了,强引用的对象只要不为null,就不会被回收
软引用:软引用相对弱化一些,需要用softReference对象构造方法去创建软引用,当内存充足时,软引用的对象不会被回收,当不足时就会被回收
弱引用:弱引用又更弱了一些,需要用weakReference的构造方法创建弱引用,当发送GC时,只要是弱引用的对象就会被回收
虚引用:虚引用要配合引用队列使用,它的主要作用是跟踪对象垃圾回收的状态,当对象被回收时,通过引用队列做一些通知类工作
在ThreadLocalMap中,Key ThreadLocal是一个弱引用,但是值value是一个强引用,当垃圾回收时,弱引用ThreadLocal会被回收,而value不会,这就导致value成了一个无法被访问也无法回收的变量,造成内存泄漏
解决办法:当使用完ThreadLocal变量后,及时使用remove方法进行清除。
-
static class Entry extends WeakReference<ThreadLocal<?>> {
-
/** The value associated with this ThreadLocal. */
-
Object value;
-
Entry(ThreadLocal<?> k, Object v) {
-
super(k);
-
value = v;
-
}
-
}
篇幅限制下面就只能给大家展示小册部分内容了。整理了一份核心面试笔记包括了:Java面试、Spring、JVM、MyBatis、Redis、MySQL、并发编程、微服务、Linux、Springboot、SpringCloud、MQ、Kafka 面试专题
需要全套面试笔记【点击此处即可】免费获取
三、JVM虚拟机
1、JVM的主要组成部分及其作用
类加载器:将java字节码文件加载到内存中
运行时数据区:就是我们常说的JVM的内存,我们的所有程序都被加载到这运行
执行引擎:负责将字节码翻译成底层系统指令,然后交由系统执行
本地方法接口:与本地库交互实现一些基础功能
2、运行时数据区的组成部分及其作用
JVM运行时数据区由方法区(元空间),堆,程序计数器,虚拟机栈,本地方法栈组成
-
方法区/元空间:方法区是一个线程共享的区域,里面存储了类信息,常量,静态变量等待信息,虚拟机启动时创建,虚拟机关闭时释放,内存无法满足分配请求时,会报OOMError:Metaspace
-
堆:Java堆是一个线程共享的区域,里面存储了实例对象、数组等等,内存不够时抛出OOM异常
-
堆分为年轻代和老年代
-
年轻代被分为三块,eden区和两个严格相同的Survivor区
-
老年代主要用来保存生命周期长的对象,主要是老的对象
-
-
-
程序计数器:用来记录当前线程正在执行的字节码指令地址,是线程私有的
-
虚拟机栈:虚拟机栈是java方法执行时的内存结构,线程私有,虚拟机会在每个java方法执行时开启一个栈帧,用于存储方法参数,局部变量,返回地址,操作数栈(中间计算结果,比如i+j的值)等信息,当方法执行完毕时,该方法会从虚拟机栈中出栈。
-
本地方法栈:本地方法栈是线程私有的,为虚拟机使用的native方法提高服务
如果栈的深度超过了虚拟机允许的最大深度,就会抛出StackOverflowError异常; 如果在扩展栈时无法申请到足够的内存,就会抛出OutOfMemoryError异常。
3、垃圾回收是否涉及栈?
垃圾回收主要指的是堆内存,栈帧内存在栈帧出栈后就释放
4、栈内存越大越好吗?
每个虚拟机栈内存默认为1M
不一定,机器内存是固定的,栈内存越大,可以同时活动的栈帧就越少,效率反而降低
5、方法内部的局部变量是否线程安全?
只要局部变量没有离开方法的作用范围,就是线程安全的
如果局部变量引用了一个对象,并且逃离了方法的作用范围,就有可能线程不安全
6、什么情况下会栈溢出?
栈帧过多:比如太多层级的递归调用
栈帧过大:出现少
7、堆栈的区别是什么?
1、存放内容
堆中存放的是对象实例和数组,该区域更关注的是数据的存储,
(静态变量放在方法区,静态对象仍然放在堆中)
栈中存放的是局部变量,栈帧,操作数栈,返回结果等。该区更关注的是程序方法的执行。
然而实际上,对象并不总是在堆中进行分配的,这里就需要介绍一下JVM的逃逸分析技术了。JVM会通过逃逸分析技术,对于逃不出方法的对象,会让其在栈空间上进行分配。
2、程序的可见度
堆是线程共有的,栈是线程私有的。
3、异常错误
如果栈内存没有可用的空间存储方法调用和局部变量,JVM会抛出java.lang.StackOverFlowError。而如果是堆内存没有可用的空间存储生成的对象,JVM会抛出java.lang.OutOfMemoryError
4、物理地址
堆的物理地址是不连续的,性能相对较慢,是垃圾回收区工作的区域。在GC时,会考虑物理地址不连续,而使用不同的算法,比如复制算法,标记-整理算法,标记-清除算法等。
栈中的物理地址是连续的,LIFO原则,性能较快。
5、内存分别
堆因为是不连续的,所以分配的内存是在运行期确认的,因此大小不固定,一般堆大小远远大于栈。
栈是固定大小的,所以在编译期就确认了。
8、运行时常量池是什么?和字符串常量池的区别
运行时常量池是方法区的一部分,它可以看做是一张表,用于存放编译器生成的各种字面量和符号引用,在类被加载时,它的常量池信息就会被放入运行时常量池,并且还会保存符号引用对应的直接引用。
而字符串常量池是存放在堆里的,在HotSpot虚拟机中,它的底层是一个c++的hashtable,它将字符串的字面量作为key,实际堆中创建的String对象的引用作为value。
当创建一个String对象时,会拿着字面量尝试在字符串常量池中获取对应String对象引用,如果是首次执行,就会在堆中创建一个String对象,并保存到字符串常量池中,然后返回。
9、什么是直接内存?
直接内存不属于JVM内存,是操作系统的内存,常见于NIO操作,用于数据缓冲区,拥有较高的读写性能,且不受JVM内存回收影响
BIO(同步阻塞IO)
发送请求后线程一直阻塞,直到数据处理完并返回
NIO(同步非阻塞IO)
通过一个线程轮询大量socket,当有socket准备就绪时通知客户端,客户端调用函数接收。
AIO(异步非阻塞IO)
-
每个请求都会绑定一个Buffer;
-
通知操作系统去完成异步的读(这个时间你就可以去做其他的事情)
-
读完之后会通知客户端来读取数据
10、对象什么时候可以被垃圾回收?如何标记垃圾?
当没有任何一个强引用指向对象时,对象就可以被垃圾回收
主流的虚拟机一般通过可达性分析算法分析一个对象是否能被回收,也有系统采用引用计数法判断
可达性分析算法:
1、算法主要思想是先确定一些肯定不能被回收的对象作为GCRoot, GCRoot对象可以是:
虚拟机栈中引用的对象
本地方法栈中Native方法引用的对象
方法区中静态属性,常量引用的对象
2、然后以GCRoot为根节点,去向下搜索,找到它们直接引用或间接引用的对象
3、在遍历完之后,如果发现有一些对象不可达,那么就认为这些对象已经没用用了,需要被回收
引用计数法:
就是为每一个对象添加一个引用计数器,用来统计指向当前对象的引用次数,一旦这个引用计数器变为0,就意味着它可以被回收了。
11、垃圾回收算法有哪些?
1、标记清除算法:标记清除算法分为两个步骤,标记-清除
标记:遍历内存空间,对需要被回收的对象打上标记,通常使用可达性分析算法
清除:再次遍历空间,将被标记的内存进行回收
缺点:
遍历两次,效率低
因为清除后没有进行整理,容易形成碎片化不连续的的内存空间
2、标记整理算法:标记整理算法分为三个步骤,标记-整理-清除
标记同上
整理:将所有存活的对象压到内存的一端,并按顺序排列
清除掉其他空间
缺点:
效率低,速度慢
3、复制算法:将内存分为等大的两块,每次只使用其中一块,当触发GC时,将存活的对象全部移到另一块内存的一端,然后将当前内存空间一次性回收,如此循环往复
缺点:内存利用率低
12、什么是分代收集算法
在java8中,内存被分为两份:新生代和老年代
新生代内存使用复制算法,老年代内存使用标记整理算法
当对象在新生代内存中经历了一定的垃圾回收后,它将被晋升到老年代。
分代收集算法重复利用了对象生命周期的特点,提高了回收效率
大对象直接进入老年代
什么是大对象呢,这个是由jvm定义的参数值决定的,但是这个参数只在Serial和ParNew垃圾收集器中生效 :-XX:PretenureSizeThreshold
当我们新分配的对象大小大于等于这个值,就会直接在老年代中分配
长期存活的对象将进入老年代
在每个对象的头信息中,都包括一个年龄计数器
对象在经过一次minor gc之后,如果仍然存活,并且能够被 survior所容纳 ,那么这个年龄计数器就会加一,当计数器的值达到了默认值大小(一般默认值为15),就会进入到老年代。
对象动态年龄判断后决定是否进入老年代
当survior区域的存活对象的总大小占用了survior区域大小的50%(可以通过参数指定),那么此时将按照这些对象的存活年龄从从到大排序,然后依次累加,当累加到对象大小超过50%,则将大于等于当前对象年龄的存活对象全部挪到老年代。
详细解释:
首先要知道Minor GC 和 Full GC的区别
普通GC(minor GC):只针对新生代区域的GC,指发生在新生代的垃圾回收动作,因为大多数Java对象存活率都不高,所以Minor GC非常频繁,一般回收速度也比较快。
全局GC(major GC or FullGC) :指发生在老年代的垃圾收集动作,出现了Major GC,经常会伴随至少一次的MinorGC(不是绝对的)。Major GC的速度一般要比Minor GC慢10倍以上。
该算法将内存分为新生代、老年代、新生代中又分伊甸园、幸存区from、幸存区to,对象创建之初,会存在于伊甸园中,当伊甸园满了之后,会触发一次Minor GC,伊甸园中还存活的对象会被转入幸存区from,当伊甸园再次触发Minor GC时,GC会扫描伊甸园和幸存区from,对这两个区进行垃圾回收,垃圾回收后,幸存区from中还存活的对象利用复制清除算法复制到幸存区to(如果有对象的年龄达到了老年代区,则复制到老年代区),复制完之后把幸存区from清除掉,之后把from区和to区交换位置(from变to,to变from,保证幸存区to为空),最后把伊甸园中存活下来的对象放入幸存区from,(如果有对象的年龄达到了老年代区,则复制到老年代区),同时把这些对象的年龄+1即可。
13、垃圾收集器有哪些?
串行收集器:GC时只会有一个线程在工作,Java应用中的线程都要STW,等待垃圾回收结束
并行收集器:GC时会有多个线程参与垃圾收集,Java应用中的线程都要STW,等待垃圾回收结束,JVM默认
CMS(Concurrent Mark Sweep)收集器:并发收集器,进行垃圾回收时不会暂停Java应用线程,STW时间短,CMS收集器采用的是标记清除算法,所以不需要移动存活对象的位置,GC可以和Java应用程序同时运行
G1(Garbage-First)收集器:基于区域划分的收集器,适用于大内存应用。
14、什么是G1垃圾收集器
G1是JDK9默认的垃圾收集器,代替了CMS收集器。它的目标是达到更高的吞吐量和更短的GC停顿时间。
G1垃圾回收器将堆内存划分为多个区域,每个区域都可以充当Eden,Survivor,old,humongous(专为大对象准备)
G1垃圾回收过程可以分为几个主要阶段:
1、初始标记:标记GCRoot直接关联的对象,需要STW
2、并发标记:对GCRoot开始对堆中对象进行并发标记,需要STW
3、重新标记:解决一些漏标错标问题,需要STW
4、混合收集:将不需要回收的eden,Survivor对象放入新的Survivor区,old对象放入新的old区,如果Survior对象达到老年年龄后也会放入新old区。然后将区域内存回收
要注意的是,混合收集不会处理所有区域,而是根据停顿时间目标去筛选出回收价值高(存活对象少)的区域。
15、什么是类加载器?类加载器有哪些?
类加载器是一个负责加载类的对象,因为JVM虚拟机只能运行二进制文件,类加载器的作用就是将字节码文件加载到JVM中运行。
JVM中有三个内置的类加载器
BootStrapClassLoader(启动类加载器):最顶层的加载器,由C++实现,主要用来加载Java的核心类裤(JAVA_HOME/lib)
ExtensionClassLoader(扩展类加载器) :主要负责加载JAVA_HOME/lib/ext下的扩展类
AppClassLoader(应用程序类加载器) :主要负责加载ClassPath下的类,也就是开发者自己写的Java类
另外,还有自定义ClassLoader,通过继承ClassLoader实现。
16、什么是双亲委派模型?为什么类加载采用双亲委派?
当一个类加载器尝试加载一个类时,会先委托上一级加载器去加载,如果上一级还有上级,就会委托上一级的加载器的上级去加载,如果所有上级加载器都不能加载该类,则类加载器尝试自己加载类。
作用:
1、防止重复加载:防止已经在上级加载器中加载的类重复地被子加载器再次加载
2、为了安全,防止核心类库API被篡改
3、保证类的一致性
17、类装载的执行过程是怎样?
1、加载
加载过程需要完成三步
-
通过类的全限定名来获取类的二进制流
-
解析类的二进制流为方法区的类数据结构(Java类模型)
-
在堆中创建一个该类的Class对象,作为方法区中该类的数据访问入口。
2、验证
验证类是否符合JVM规范
①文件格式验证
②元数据验证
③字节码验证
④符号引用验证:检查符号引用对应的类或方法是否在常量池中存在
3、准备
该阶段为类的静态变量分配内存,并设置初始值,这里所说的初始值“通常情况”下是数据类型的零值
4、解析
将常量池的符号引用替换为直接引用
符号引用:以一组符号来描述所引用的目标,有时候JVM不知道引用的类或者方法内存地址在哪,于是就先用符号引用代替直接引用
直接引用:直接指向目标的指针
5、初始化
对类的静态变量,静态代码块进行初始化操作
//6、使用:使用类执行代码
//7、卸载:用户代码执行完毕后,销毁Class对象
18、用于JVM调优的参数有哪些?
1、设置堆空间大小
-Xms 512m 设置初始化大小,默认是物理内存的1/64
-Xmx 1g 设置最大大小,默认是物理内存的1/4
2、虚拟机栈大小
-Xss 256k 默认1M
3、年轻代eden区和survivor区大小比例
-XXSurvivorRatio 8 表示eden区:survivor区=8:2
4、年轻代晋升到老年代阈值
-XX:MaxTenuringThreshold=10 默认为15
5、设置垃圾回收器
-XX:+Use[垃圾回收器名]
19、JVM调优的工具有哪些?
命令:
jsp 进程状态信息
Jstack 线程内的堆栈信息
Jmap(使用较多) 查看堆的信息,堆的大小配置,堆内存各部分的使用情况
jstat 垃圾回收信息
工具:
jconsole:用于对JVM内存,线程,类的监控
visualVM:用于对JVM内存,线程,类的监控
20、Java内存泄漏的排查思路?
首先通过jmap命令或者设置JVM参数区获取dump文件
然后将dump文件放入VisualVM中去分析
通过查看堆的信息,定位到哪行代码出了问题,然后再去修改代码
21、CPU彪高排查方案与思路
1、使用top命令,查看哪个进程CPU使用率较高
2、使用ps H -eo pid,tid,%cpu | grep 进程id 命令查看进程中的线程状态
3、找到关键线程,然后使用jstack命令去查看进程中哪个线程出了问题,然后找到对应代码并修改
四、Mysql数据库
1、InnoDB和MyISAM的区别和使用场景
事务:InnoDB支持事务,而MyISAM不支持
外键:InnoDB支持外键,而MyISAM不支持
锁:InnoDB支持行级锁(并发量高)和表锁,MyISAM只支持表锁
索引:InnoDB不支持全文索引,MyISAM支持全文索引(全文索引是基于分词的索引,能更快速地在文本中检索一段信息内容)
使用场景:
InnoDB适合需要高并发或事务的场景,
MyISAM适合读操作远远大于写操作且不需要事务的场景
属性 | InnoDB | MyISAM |
事务 | 支持事务 | 不支持事务 |
---|---|---|
外键 | 支持外键 | 不支持外键 |
锁 | 支持行锁(并发更高)和表锁 | 只支持表锁(不会死锁) |
索引 | 不支持全文索引 | 支持全文索引(查询更快) |
适用场景 | 并发量高或者需要事务 | 读远多于写且不需要事务 |
2、如何防止sql注入?
在编写sql语句时,使用参数传递的方式去给变量赋值而不是直接嵌入到sql语句中
在mybatis的mapper中,我们可以用#{value}的方式去传递参数防止sql注入。