标签：专题 Java 索引面试缓存线程内存 key 数据

Java面试专题

面试题背后的逻辑->拆分问题讲解->回答方式及参考问题

Redis篇

使用场景

1、你在最近的项目中哪些场景使用了redis?

缓存：缓存击穿，缓存穿透，缓存雪崩，双写一致性，数据过期策略，数据淘汰策略
分布式锁：setnx,redission

2、什么是缓存穿透，怎么解决？

缓存穿透：查询一个 不存在 的数据，mysql查询不到数据也不会写入缓存，就会导致每次请求都查数据库，带来巨大压力。
	解决方案一：缓存空数据，mysql查询返回的数据为空，仍把这个空结果进行缓存
    	优点：简单
    	缺点：消耗内存，可能会造成数据不一致
	解决方案二：布隆过滤器
    	优点：内存占用较少，没有多余key
    	缺点：实现复杂，存在误判
    布隆过滤器主要依赖于bitmap，存储数据时，将请求的数据进行多次hash计算，分别将对应的hash值存到bitmap上，当查询时，只需要检查bitmap的对应位置上是否都有值，有则直接返回，没有也不访问数据库，减轻数据库的压力。但是会存在误判问题。（可设置误判率5%）

3、什么是缓存击穿，怎么解决？

给某一个key设置了过期时间，当key过期的时候，恰好在这个时间点对这个key有大量的并发请求过来，这些并发请求可能瞬间把DB压垮。
    解决方案一：互斥锁，强一致，性能差。
    	当缓存失效时，不立即去load DB，先使用redis的setnx去设置一个互斥锁，当操作成功返回时再进行load DB的操作并回设缓存，否则重试get缓存的方法。
    解决方案二：逻辑过期，高可用，性能优，不能保证数据强一致
    	在设置key的时候，设置一个过期时间字段一块存入缓存中，不给当前key设置过期时间，当查询的时候，从redis中取出数据后判断是否过期，如果过期则开通另外一个线程进行数据同步，当前线程正常返回数据，这个线程不是最新的。

4、什么是缓存雪崩，怎么解决？

缓存雪崩是指在同一时间端大量的缓存key同时失效或者Redis服务宕机，导致大量的请求到达数据库，带来巨大压力。
    解决方案：
    1、给不同的key的TTL添加随机值
    2、利用Redis集群提高服务的可用性（哨兵模式、集群模式）
    3、给缓存业务添加降级限流策略（nginx或spring cloud gateway）
    4、给业务添加多级缓存

缓存三兄弟：
穿透无中生有key,布隆过滤null隔离
缓存击穿过期key,锁与非期解难题
雪崩大量过期key,过期时间要随机
面试必考三兄弟，可用限流来保底

5、redis作为缓存，mysql的数据如何与redis进行同步呢？（双写一致性）

1、介绍自己简历上的业务，我们当时是把套餐的热点数据存入到了缓存中，虽然是热点数据，但是实时要求性没那么高，所以，我们当时采用的是异步的方案同步的数据。
2、我们当时是把抢劵的库存存入到了缓存中，这个需要实时进行数据同步，为了保证数据的强一致性，我们当时采用的是redisson提供的读写锁来保证数据的同步。

6、你来介绍一下异步和redission的方案

允许延时一致的业务，采用异步通知
    1、使用MQ消息中间件，更新数据后，通知缓存删除
    2、使用canal中间件，不需要修改业务代码，伪装为mysql的一个从节点，canal通过读取binlog数据更新缓存

强一致的，利用redisson提供的读写锁
    1、共享锁：读锁readLock，加锁之后，其他线程可以共享读操作
    2、排它锁：独占锁WriteLock，加锁之后，阻塞其他线程读写操作

7、redis作为缓存时，数据的持久化是如何做到？

Redis持久化：
    RDB全称Redis Database Backup file（Redis数据备份文件）,也被叫叫做Redis数据快照，简单来说就是把内存中的所有数据都记录到磁盘中。当Redis实例故障重启后，从磁盘读取快照文件，恢复数据。
    AOF全称Append Only File（追加文件）。Redis处理的每一个写命令都会记录在AOF文件，可以看做是命令日志文件。因为是记录命令，AOF文件会比RDB文件大得多。而且AOF会对同一个key执行多次写操作，但只有最后一次操作才有意义，通过执行 bgrewriteaof可以让AOF文件执行重写功能，用最少的命令达到相同效果
    
RDB的执行原理？
    bgsave开始时会fork主进程得到子进程，子进程共享主进程的主存数据，完成fork后读取内存数据并写入RDB文件。fork采用的是copy-on-write技术：
    1、当主进程执行读操作时，访问共享内存；
    2、当主进程执行写操作时，则会拷贝一份数据，执行写操作。
    
AOF默认是关闭的，主要修改redis.conf配置文件来开启AOF：
    AOF的命令记录的频率也可以通过redis.conf文件来配
    appendfsync always：可靠性高，几乎不丢数据，但性能影响大
    appendfsync everyesc:性能适中，最多丢失1s数据
    appendfsync no:（操作系统控制）性能最好，但可靠性较差，可能丢失大量数据

这两种持久化有什么区别？
	RDB是一个快照文件，它是把redis内存存储的数据写到磁盘上，当redis宕机恢复数据的时候，方便从RDB的快照文件中恢复数据；AOF的含义是追加文件，当redis操作写命令的时候，则会存储在这个文件中，当redis实例宕机恢复数据时，会从这个文件中再次执行一遍命令来恢复数据。
这两种方式，哪一种恢复的比较快呢？
	RDB因为是二进制文件，在保存的时候体积也是最小的，它恢复的比较快，但是它有可能会丢数据，我们在项目中也会使用AOF来恢复数据，虽然AOF恢复的速度慢一些，但是它丢数据的风险要小很多，在AOF文件中可以设置刷盘策略，我们当时设置的就是每秒批量写入一次命令。

8、假如Redis的key过期后，会立即删除吗？

Redis对数据设置数据的有效时间，数据过期之后，就需要将数据从内存中删除。可以按照不同的规则进行删除，这种删除规则则称之为数据的删除策略（数据过期策略）
    惰性删除：设置该key的过期时间后，我们不用去管它，当需要该key时，我们再检查该key是否过期，如果过期，我们就删除掉它，反之返回该key。该方法对CPU友好，智慧在使用该key的时候才会进行过期检查，对于很多用不到的key不用浪费时间进行过期检查；但是对内存不太友好，如果一个key已经过期，但是一直没有使用，那么该key就会一直存在内存中，内存永远不会释放。
    定期删除：每隔一段时间，我们就会对一些key进行检查，删除里面过期的key（从一定数量的数据库中取出一定数量的随机key进行检查，并删除其中过期的key）。定期删除有两种模式：slow模式是定时任务，执行频率默认10Hz,每次不超过25ms,以通过修改配置文件redis.conf的hz选项来调整这个次数；fast模式执行频率不固定，但两次间隔不低于2ms,每次耗时不超过1ms。优点：可以通过限制删除操作执行的时长和频率来减少删除操作对CPU的影响。另外定期删除，也能有效释放过期键占用的内存。缺点：难以确定删除操作执行的时长和频率。

9、假如缓存过多，内存是有限的，内存被占满了怎么办？

数据淘汰策略：当Redis中的内存不够用时，此时向Redis中添加新的key,那么Redis就会按照某一种规则将内存中的数据删除掉，这种数据的删除规则被称之为内存的淘汰策略。Redis支持的八种不同的策略来选择要删除的key:
	noeviction:不淘汰任何key,但是内存满时不允许写入新数据，默认就是这个策略；
	volatile-ttl:对设置了TTL的key,比较key的剩余TTL值，TTL越小越先淘汰；
    allkey-random:对全体key,随机进行淘汰；
    volatile-random:对设置了TTL的key,随机进行淘汰；
    allkey-lru:对全体key,基于LRU算法进行淘汰；（Least Recently Used：最近最少使用）
    allkey-lfu:对全体key,基于LFU算法进行淘汰；（Least Frequently Used：最少频率使用）
    volatile-lru:对设置了TTL的key,基于LRU算法进行淘汰
    volatile-lfu:对设置了TTL的key,基于LFU算法进行淘汰

10、redis分布式锁，是如何实现的？

Redis实现分布式锁主要利用redis的setnx命令。setnx是 SET if not exist（如果不存在，则set）的简写。
    SET lock value NX EX 10,添加锁，并设置超时时间为10，如果不设置锁。当一个线程获取锁成功后，这时业务超时或服务宕机，无法释放锁，会导致死锁，影响服务器性能。

我们当时使用的redisson实现的分布式锁，底层是setnx和lua脚本（保证原子性）

11、Redis实现分布式锁如何合理控制锁的有效时长？

解决方案：
    1、根据业务执行时间预估
    2、给锁续期（可行）

在redisson的分布式锁中，提供了一个WatchDog（看门狗）,一个线程获取锁成功后，WatchDog会给持有锁的线程续期（默认是每隔10s续期一次）

12、redisson的锁可以重入吗？

可以重入，多个锁重入需要判断是否是当前线程，在redis中进行存储的时候使用的hash结构，来存储线程信息和重入次数。

13、redisson锁能解决主从数据一致的问题吗

不能解决，但是可以使用redisson提供的红锁来解决，但是这样的话，性能就太低了，如果业务中非要保证数据的强一致性，建议采用zookeeper实现的分布式锁。

Redis的其他面试问题

1、Redis的集群有哪些方案，知道吗？

主从复制
哨兵模式
分片集群

2、介绍一下Redis的主从同步

单点Redis的并发能力是有限的，要进一步提高redis的并发能力，并需要搭建主从集群，实现读写分离，一般是一主多从，主节点负责写数据，从节点负责读数据。

3、说一下主从同步数据的流程

全量同步
1、从节点请求主节点同步数据（replication id,offset）
2、主节点判断是否是第一次请求，是第一次则与从节点同步版本信息（replication id,offset）
3、主节点执行bgsave,生成rdb文件，发送给从节点去执行
4、在rdb执行期间，主节点会以命令的方式记录到缓冲区（一个日志文件）
5、把生成之后的命令日志文件发送给从节点去执行

增量同步
1、从节点请求主节点同步数据，主节点判断是否是第一次请求，不是第一次请求则获取从节点的offset值
2、主节点从命令日志中获取offset值之后的数据，发送给从节点进行数据同步

4、怎么保证Redis的高并发高可用？

哨兵模式：实现主从集群的自动故障恢复（监控、自动故障恢复、通知）

5、redis集群脑裂，该怎么解决？

集群脑裂是由于主节点和从节点和sentinel处于不同的网络分区，使得sentinel没有能够心跳感知到主节点，所以通过选举的方式提升了一个从节点为主，这样就存在了两个master，就像大脑分裂了一样，这样还会导致redis客户端还在老的master那里写数据，新节点无法同步数据，当网络恢复后，sentinel会将老的master降为从节点，这时再从新的master同步数据就会导致数据的丢失。
    解决：我们可以修改redis的配置，可以设置最少的从节点数量以及缩短主从数据同步的时间，达不到要求就拒绝请求，就可以避免大量的数据丢失。

6、redis的分片集群有什么作用？

集群中有多个master,每个master保存不同的数据
每个master都可以有多个salve节点
master之间通过ping检测健康状态
客户端请求可以访问集群任意节点，最终都会被转发到正确节点

7、redis分片集群中数据是怎么存储和读取的？

redis分片集群引入了哈希槽的概念，redis集群有16384个哈希槽
将16384个哈希槽分配到不通的redis实例
读写数据：根据key的有效部分计算哈希值，将16384取余（有效部分，如果key前面有大括号，大括号的内容就是有效部分，如果没有，则以key本身作为有效部分）余数作为插槽，寻找插槽所在的实例。

8、redis是单线程的，为什么还那么快？

redis是纯内存操作，执行速度非常快
采用单线程，避免不必要的上下文切换可竞争条件，多线程还要考虑线程安全问题
使用I\O多路复用模型，非阻塞IO

9、能解释一下I\O多路复用模型吗？

Redis是纯内存操作，执行速度非常快，它的瓶颈是网络延迟而不是执行速度，I\O多路复用模型主要就是实现了高效的网络请求。
    
用户空间和内核空间
    Linux系统中一个进程使用内存的情况划分两部分：用户空间、内核空间
    用户空间只能执行受限的命令，而且不能直接调用系统资源，必须通过内核提供的接口访问
    内核空间可以执行特权命令，调用一切系统资源
   
    linux系统为了提高IO效率，会在用户空间和内核空间都加入缓冲区：
    写数据时，要把用户缓冲区的数据拷贝到内核缓冲区，然后写入设备
    读数据时，要从设备读取数据到内核缓冲区，然后再拷贝到用户缓冲区
    
    IO多路复用是利用单个线程来同时监听多个socket，并在某个socket可读、可写时得到通知，从而避免无效等待，充分利用了cpu资源。不过监听socket的方式、通知的方式又有多种实现，常见的有：
    select
    poll
    epoll
    
    Redis网络模型
    就是使用I\O多路复用结合事件的处理器来应对多个Socket请求
    连接应答处理器
    命令回复处理器，在redis6.0之后，为了提高性能，使用了多线程来处理回复事件
    命令请求处理器，在redis6.0之后，将命令的转换使用了多线程，增加命令转换速度，在命令执行的时候，依然是多线程。

I\O多路复用是指利用单个线程来同时监听多个Socket，并在某个Socket可读、可写时得到通知从而避免无效等待，充分利用了cpu资源。目前I\O多路复用都是采用epoll模式实现，他会在通知用户进程Socket就绪的同时，把已就绪的Socket写入用户空间，不需要挨个遍历Socket来判断是否就绪，提升了性能。

MySQL篇

优化

1、如何定位慢查询？

1、介绍一下当时产生问题的场景（我们当时的一个接口测试的时候非常的慢，压测结果大概5秒钟）
2、我们系统中当时采用了运维工具（Skywalking）,可以监测出哪个接口，最终因为是sql的问题
3、在sql中开启了慢日志查询，我们设置的值是2秒钟，一旦sql执行超过2秒就会记录到日志中（调试阶段）

候选人：
    我们当时做压测的时候有的接口非常的慢，接口的响应时间超过了2秒以上，因为我们当时的系统部署了运维的监控系统Skywalking，在展示的报表中可以看到是哪一个接口比较慢，并且可以分析这个接口的哪部分比较慢，这里可以看到sql的具体执行时间，所以可以定位是哪个sql出了问题。
    如果，项目中没有这种运维的监控系统，其实在mysql中也提供了慢日志查询的功能，可以在mysql的系统配置文件文件中开启这个慢日志的功能，并且也可以设置sql执行超过多少时间来记录到一个日志文件中，我记得上一个项目配置的是2秒，只要sql执行时间超过了2秒就会记录到日志文件中，我们就可以在日志文件找到比较慢的sql。

2、那这个sql执行很慢，如何分析呢？

可以采用MySQL自带的分析工具explan
    通过key和key_len检查是否命中了索引（索引本身存在是否失效的情况）
    通过type字段查看sql是否有进一步优化空间，是否存在全局索引扫描或全盘扫描
    通过extra建议判断，是否出现了回表的情况，如果出现了，可以尝试添加索引和修改返回字段来修复

3、了解过索引吗？（什么是索引）

索引（index）是帮助MySQL高效获取数据的数据结构（有序）
提高数据检索的效率，降低数据库的IO成本（不需要全表扫描）
通过索引列队数据进行排序，降低数据排序的成本，降低了CPU的消耗

4、索引底层的数据结构了解过吗

mysql的innoDB引擎采用的是B+树的数据结构来存储索引
    阶数更多，路径更短
    磁盘读写代价B+树更低，非叶子节点不存储数据只存储指针，叶子节点存储数据
    B+树便于扫库和区间扫描，叶子节点是一个双向链表

5、什么是聚簇索引，什么是非聚簇索引？

聚簇索引（聚集索引）：数据和索引放到一块，B+树的叶子节点保存了整行数据，有且只有一个
非聚簇索引（二级索引）：数据和索引分开存放，B+树的叶子节点保存对应的主键，可以有多个

6、知道什么是回表查询吗？

通过二级索引找到对应的主键值，到聚集索引中查找整行数据，这个过程就是回表

7、知道什么是覆盖索引吗？

覆盖索引是指：查询使用了索引，并且需要返回的列，在该索引中已经全部能够找到
    使用id查询，直接走聚集索引，一次索引扫描，直接返回数据，性能高
    如果返回的列中没有创建索引，有可能会触发回表查询，尽量避免使用select *

8、MYSQL中超大分页怎么处理？

超大分页一般是在数据量比较大时，我们使用了limit分页查询，并且需要对数据进行排序，这个时候效率就很低，我们可以采用覆盖索引和子查询来解决
    先分页查询数据的id字段，再通过子查询来过滤，只查询这个id列表中的数据就可以了，因为查询id的时候走的是覆盖索引，所以效率可以提升很多

9、索引创建原则有哪些？

1、对于数据量较大，且查询比较频繁的表建立索引
2、对于经常作为查询条件、排序、分组操作的字段建立索引
3、尽量选择区分度高的列作为索引，尽量建立唯一索引，区分度越高，使用索引的频率越高
4、如果是字符串类型的字段，字段的长度较长，可以针对于字段的特点，建立前缀索引
5、尽量使用联合索引，减少单列索引，查询时，联合索引很多时候可以覆盖索引，节省存储空间，避免回表，提高查询效率
6、要控制索引的数量，索引并不是越多越好，索引越多，维护索引的代价也越大
7、如果索引列不能存储NULL值，请在创建表时使用NOT NULL约束它，当优化器知道每列是否包含NULL值时，它可以更好地确定哪个索引最有效地用于查询

10、什么情况下索引会失效？

1、违反最左前缀法则
2、范围查询右边的列，不能使用索引
3、不要在索引上进行运算操作，否则索引将失效
4、字符串不加单引号，造成索引失效
5、以%开头的Like模糊查询，索引失效

11、谈谈你对sql优化的经验

表的设计优化
    设置合适的数值（tinyint int bigint）
    设置合适的字符串类型（char varchar）char定长，效率高，varchar可变长度，适用范围广，效率稍低
索引优化
SQL语句的优化
    select语句务必指明字段名称，避免直接使用select *
    sql语句要避免造成索引失效的写法
    尽量用union all代替union,union会自动进行一次过滤，去除重复数据，效率低
    避免在where子句中对字段进行表达式操作
    join优化：能用inner join就不用left join right join,如必须使用一定要以小表为驱动，内连接会对两个表进行优化，优化把小表放到外边，把大表放到里边。left join或right join，不会重新调整顺序
主从复制，读写分离
分库分表

其他面试题

1、事务的特性是什么？可以详细说一下吗？

什么是事务？
事务是一组操作的集合，它是一个不可分割的工作单位，事务会把所有的操作作为一个整体向系统提交或撤销操作请求，要么同时成功，要么同时失败
事务的特性：
    原子性（Atomicity）:事务是不可分割的最小单位，要么全部成功，要么全部失败
    一致性（Constancy）:事务完成时，必须使所有的数据都保持一致状态
    隔离性（Isolation）:数据库系统提供的隔离机制，使事务在不受外界环境的影响下独立运行
    持久性（Durability）:事务一旦提交或撤销，对数据库中数据的操作都是永久的
        
并发事务问题：
    脏读：一个事务读到另一个事务还没有提交的数据
    不可重复读：一个事务先后读取同一条数据，但两次读取的数据，结果不同
    幻读：一个事务按条件查询时，没有查询到数据行，但是在插入数据时，又发现该数据行已经存在

2、怎么解决并发事务的问题？

解决方案：对事务进行隔离
    读未提交
    读已提交：解决脏读的问题
    可重复读：解决脏读，不可重复读的问题，默认，性能和安全的中和选择
    串行化：解决脏读，不可重复读，幻读的问题，但性能也较差

3、undo log 和 redo log的区别？

缓冲池（buffer pool）：主内存中的一个区域，里面可以缓存磁盘上经常操作的真实数据，在执行增删改查操作时，先操作缓冲池中的数据（若缓冲池没有数据，则从磁盘加载并缓存），以一定的频率刷新到磁盘，从而减少磁盘IO，加快处理速度
数据页：是InnoDB存储引擎磁盘管理的最小单元，每个页的大小默认为16KB。页中存储的是行数据

候选人：好的，redo log日志记录的是数据页的物理变化，服务器宕机可用来同步数据，而undo log不同，它记录的是逻辑日志，当事务回滚时，通过逆操作恢复原来的数据，比如我们删除一条数据的时候，就会在undo log中新增一条对应的delete语句，如果发生回滚就执行逆操作。redo log保证了事务的持久性，undo log保证了事务的原子性和一致性

4、事务中的隔离性是如何保证的？（解释一下MVCC）?

MySQL中的多版本并发控制。指维护一个数据的多个版本，使得读写操作没有冲突
隐藏字段：
    trx_id:记录每一次操作的事务id，是自增的
    roll_pointer（回滚指针）：指向上一个版本的事务版本记录地址
uudo log
    回滚日志，存储老版本数据
    版本链：多个事务并行操作某一行记录不同事务修改数据的版本，通过roll_pointer指针形成一个链表。
readView

候选人：事务的隔离性是由mvcc和锁实现的。其中mvcc的意思是多版本并发控制。指维护一个数据的多个版本，使得读写操作没有冲突，它的底层主要分为三部分，第一个是隐藏字段，第二个是undo log,第三个是readView读视图。隐藏字段是指：在mysql中给每个表都设置隐藏字段，有一个是trx_id，记录每一次操作的事务id,是自增的；另一个是roll_pointer，指向上一个版本的书屋版本记录地址
    undo log主要的作用是记录回滚日志，存储老版本数据，在内部会形成一个版本链，在多个事务并行操作某一行记录，记录不同事务修改数据的版本，通过roller_pointer指针形成一个链表
    readView解决的是一个事务查询选择版本的问题，在内部定义了一些匹配规则和当前的一些事务id判断该访问哪个版本的数据，不同的隔离级别快照读是不一样的，最终的访问结果也不一样，如果是rc隔离级别,每一次执行快照读时生成ReadView，如果是rr隔离级别仅在第一次执行快照读时生成ReadView，后续复用。

5、主从同步原理

MySQL的主从复制的核心就是二进制文件
    二进制（BINLOG）中记录了所有的DDL（数据定义语句）语句和DML（数据操纵语句）语句，但不包括数据查询（SELECT、SHOW）语句。
    复制分三步：
    1、Master主库在数据提交时，会把数据变更记录在二进制文件binlog中
    2、salve从库中的一个线程IOThread读取二进制文件binlog，并写入到从库的中继日志Ready log中
    3、salve从库中的SQLThread重做中继文件中的日志，将数据同步到从库数据库中，主从复制完成

6、你们项目用过分库分表吗？

分库分表的时机：
    1、项目业务数据逐渐增多，业务发展比较迅速，单表的数据达1000W或20G以后
    2、优化已解决不了性能问题（主从读写分离、查询索引）
    3、IO瓶颈（磁盘IO）、CPU瓶颈（聚合查询、连接数太多）
    
拆分策略
    垂直分库：
    	垂直分库：以表为依据，根据业务将不同表拆分到不同库中，高并发下提高磁盘IO和网络连接数。特点：1、按业务对数据分级管理、维护、监控、扩展；2、在高并发下，提高磁盘IO的数据量连接数
    	垂直分表：以字段为依据，根据字段属性将不同字段拆分到不同表中，冷热数据分离，两表互不影响。1、把不常用的字段单独放在一张表中；2、把text,blob等大字段拆分出来放在附表中。
    水平分库：
    	水平分库：将一个库的数据拆分到多个库中，解决海量数据存储和高并发的问题。
    	水平分表：将一个表的数据拆分到多个表中（可以在同一个库内），解决单表存储和性能的问题。特点：优化单一表数据量过大而产生的性能问题；2、避免IO争抢并减少锁表的几率。
    
    分库会产生各种分布式事务的问题，可用mycat中间件解决。

框架篇

Spring

1、Spring框架中的单例bean是线程安全的吗？

不是线程安全的
    Spring框架中有一个@Scope注解，默认的值就是singleton,单例的
    因为一般在spring的bean中都是注入无状态的对象，没有线程安全问题，如果在bean中定义了可修改的成员变量，是要考虑线程安全问题的，可以使用多例或者加锁来解决

2、什么是AOP,你们项目中有没有使用到AOP?

面向切面编程，用于将那些与业务无关，但却对多个对象产生影响的公共行为和逻辑，抽取公共模块复用，降低耦合。常用作记录日志操作，缓存和spring实现的事务等。核心是：使用aop中的环绕通知+切点表达式（找到要记录日志的方法），通过环绕通知的参数获取请求方法的参数（类、方法、注解、请求方式等），获取到这些参数以后，保存到数据库。

3、Spring中的事务是如何实现的？

Spring支持编程式事务管理和声明式事务管理两种方式
    编程式事务管理:需要使用TransactionTemplate来进行实现，对业务代码有侵入性，项目中很少使用；
    声明式事务管理：声明式事务管理建立在AOP之上的。其本质式通过AOP功能，对方法前后进行拦截，将事务处理的功能编织到拦截的方法中，也就是在目标方法开始之前加入一个事务，在执行完目标方法之后根据执行情况提交或者回滚事务。

4、Spring中事务失效的场景有哪些？

1、异常捕获处理。自己处理了异常，没有抛出。解决：手动抛出
2、抛出检查异常。解决：配置rollbackFor属性为Exception
3、非public方法导致的事务失效。解决：改为public

5、Spring的bean的生命周期

1、通过BeanDefinition获取bean的定义信息
2、调用构造函数实例化bean
3、bean的依赖注入
4、处理Aware接口
5、Bean的前置处理器BeanPostProcessor-前置
6、初始化方法
7、Bean的后置处理器BeanPostProcessor-前置
8、销毁bean

6、Spring中的循环引用

循环引用（依赖）：循环依赖其实就是循环引用，也就是两个或两个以上的bean相互持有对方，最终形成闭环，比如A依赖于B,B依赖于A。
循环依赖在spring中是允许存在的，spring框架依据三级缓存已经解决了大部分的循环依赖
    1、一级缓存：单例池，缓存已经经历了完整的生命周期，已经初始化完成的bean对象
    2、二级缓存：缓存早期的bean对象（生命周期还没走完）
    3、三级缓存：缓存的是ObjectFactory,表示对象工厂，用来创建某个对象的

7、构造方法出现了循环依赖怎么解决？

原因：由于bean的生命周期中构造函数是第一个执行的，spring框架并不能解决构造函数的依赖注入
    解决方法：使用@Lazy进行懒加载，什么时候需要对象再进行bean对象的创建。

8、Spring框架中常用注解？

Spring:
	@Componet、@Controller、@Service、@Repository：用于实例化bean
    @Autowired：用于根据类型依赖注入
    @Qualifier：一起使用用于根据名称进行依赖注入
    @Scope：标注Bean的范围
    @Configuration：指定当前类是一个Spring配置类
    @ComponentScan：用于指定Spring在初始化容器时要扫描的包
    @Bean：标注将该方法的返回值存储到Spring容器中
    @import：使用@Import导入的类会被Spring加载到IOC容器中
    @Aspect、@Before、@After、@Around、@Pointcut：用于切面编程
SpringMVC:
	@RequestMapping：映射请求路径
    @RequestBody：接收http请求的json数据，将json转换为java对象
	@RequestParam：指定请求参数的名称
	@PathVirable：从请求路径下获取请求参数，传递给方法的形式参数
	@ResponseBody：注解实现将controller方法返回对象转化为json对象响应给客户端
	@RequestHeader：获取指定的请求数据
	@RestController：@Controller+@ResponseBody
SpringBoot:
	@SpringBootConfiguration
	@EnableAutoConfiguration
	@ComponentScan

SpringMVC

1、SpringMVC的执行流程？

视图版本与前后端开发版本前5步一致，
1、用户发送出请求到前端控制器DispatcherServlet
2、DispatcherServlet收到请求调用HandlerMapping(处理器适配器)
3、HandlerMapping找到具体的处理器，生成处理器对象及处理器拦截器（如果有），再一起返回给DispatcherServlet
4、DispatcherServlet调用HandlerAdapter(处理器适配器)
5、HandlerAdapter经过适配调用具体的处理器(Handler/Controller)
视图版本：
6、Controller执行完成返回ModelAndView对象
7、HandlerAdapter将Controller执行结果ModelAndView返回给DispatcherServlet
8、DispatcherServlet解析后返回具体的View(视图)
前后端开发：
6、方法上添加了@ResponseBody
7、通过HttpMessageConverter来返回结果转换为JSON并响应

SpringBoot

1、SpringBoot自动配置原理？

1、再spring项目中的引导类上有一个注解@SpringBootApplication，这个注解是对三个注解进行了封装，分别是：
    @SpringBootConfiguration
    @EnableAutoConfiguration
    @ComponentScan
2、其中@EnableAutoConfiguration是实现自动化配置的核心注解。该注解通过@Import注解导入对应的配置选择器。内部就是读取了该项目和该项目引用的Jar包的classpath路径下META-INF/spring.factores文件中的所配置的类的全类名。在这些配置类中所定义的bean会根据条件注解所指定的条件来决定是否需要将其导入到spring容器中。
3、条件判断会有像@ConditionalOnClass这样的注解，判断是否有对应的class文件，如果有则加载该类，把这个配置类的所有的bean放入到spring容器中使用。

Mybatis

1、Mybatis的执行流程

1、读取Mybatis配置文件:mybatis-config.xml加载运行环境和映射文件
2、构造会话工厂SqlSessionFactory
3、会话工厂创建SqlSession对象（包含了执行SQL语句的所有方法）
4、操作数据库的接口，Executor执行器，同时负责查询缓存的维护
5、Executor接口的执行方法中有一个MappedStatement类型的参数，封装了映射信息
6、输入参数映射
7、输出映射结果

2、Mybatis是否支持延迟加载?

延迟加载的意思是：在需要数据的时候才进行加载，不需要用到数据时就不加载
Mybatis支持一对一关联对象和一对多关联集合对象的延迟加载
在Mybatis配置文件中，可以配置是否启用延迟加载lazyLoadingEnabled=true|false,默认是关闭的。

3、延迟加载的底层原理知道吗？

1、使用CGLB创建目标对象的代理对象
2、当调用目标方法时，进入拦截器invoke方法，发现目标方法是null值，执行sql查询
3、获取数据以后，调用set方法设置属性值，再继续查询目标方法，值就有了

4、Mybatis的一级、二级缓存用过吗？

一级缓存：基于PerpetualCache的hashMap本地缓存，其存储作用域session。当Session进行flush或close之后，该Session的所有Cache就将清空，默认打开一级缓存。
二级缓存：是基于namespace和mapper的作用域起作用的,不是依赖于SQL session,默认也是采用PerpetualCache,HashMap存储。需要单独开启，一个是核心配置，一个是mapper映射文件。

5、mybatis的二级缓存什么时候会清理缓存中的数据？

当某一个作用域（一级缓存Session/二级缓存Namespace）进行了新增、修改、删除操作以后，默认该作用域下所有select中的缓存将被clear。

微服务篇

Spring Cloud

1、SpringCloud5大组件

通常情况下:
Euraka:注册中心
Ribbon:负载均衡
Feign:远程调用
Hystrix:服务熔断
Zuul/Gateway:网关
    
随着SpringCloudAlibaba在国内兴起，我们在项目中使用了一些阿里巴巴的组件
Nocas:注册中心/配置中心
Ribbon:负载均衡
Feign:远程调用
sentinal:服务保护
Gateway:服务网关

2、服务注册和发现是什么意思？Spring Cloud如何实现服务注册发现？

服务注册：服务提供者需要把自己的信息注册到eureka，由eureka来保存这些信息，比如服务名称、ip、端口等等
服务发现：消费者向eureka拉取服务列表信息，如果服务提供者有集群，则消费者会利用负载均衡算法，选择一个发起调用
服务监控：服务提供者会每隔30s向eureka发送心跳，报告健康状态，如果eureka服务90秒没接收到心跳，从eureka中剔除

3、Eureka和Nacos的区别？

Nacos与euraka的共同点（注册中心）
    1、都支持服务注册和服务拉取
    2、都支持服务提供者心跳方式做健康检测
Nacos与eureka的区别（注册中心）
    1、Nacos支持服务端主动检测提供者状态：临时实例采用心跳模式，非临时实例采用主动检测模式
    2、临时实例心跳不正常会被剔除，非临时实例则不会被剔除
    3、Nacos支持服务列表变更的消息推送模式，服务列表更新更及时
    4、Nacos集群默认采用AP模式（高可用），当集群中存在非临时实例时，采用CP模式（强一致）；Eureka采用AP方式
Nocas还支持了配置中心，eureka则只有注册中心，也是选择使用Nocas的一个重要原因

4、你用过的负载均衡是如何实现的？

微服务的负载均衡主要使用了一个组件Ribbon,比如，我们在使用feign远程调用的过程中，底层的负载均衡就是使用了ribbon。

5、Ribbon负载均衡策略有哪些？

1、简单轮询（RandomRobinRule）
2、权重(WeightedResponseTimeRule)
3、随机(RandomRule)
4、区域敏感策略，以区域可用的服务器为基础进行服务器的选择(默认)(ZoneAvoidanceRule)
5、忽略短路的服务器，并选择并发数较低的
6、先过滤非健康的，再选择连接数较小的实例
7、重试机制的选择逻辑

6、如果想自定义负载均衡策略该如何实现？

1、创建类实现IRule接口，可以指定负载均衡策略（全局）
2、在客户端的配置文件中，可以配置某一个服务调用的负载均衡策略（局部）

7、什么是服务雪崩，怎么解决这个问题？

服务雪崩：一个服务失效，导致整条链路的服务都失效的情形
服务降级：服务自我保护的一种方式，或者保护下游服务的一种方式，用于确保服务不会受请求突增影响变得不可用，确保服务不会崩溃，一般在实际开发中与feign接口整合，编写降级逻辑
服务熔断：默认关闭，需要手动打开，如果检测到10秒内请求的失败率超过50%，就触发熔断机制。之后每隔5秒重新尝试请求微服务，如果微服务不能响应，继续走熔断机制。如果微服务可达，则关闭熔断机制，恢复正常请求。

8、微服务监控是怎么监控的？

skywalking:一个分布式系统的应用程序性能监控工具（Application Performance Managment）,提供完善的链路追踪能力，apache的顶级项目。（问题定位，性能分析，服务关系，服务告警）
    1、skyworking主要可以监控接口、服务、物理实例的一些状态。特别是在压测的时候可以看到众多服务中哪些服务和接口比较慢，我们可以针对性的分析和优化。
    2、我们还在skyworking设置了告警规则，特别是在项目上线后，如果报错，我们分别设置了可以给相关负责人发短信和发邮件，第一时间知道了项目的bug情况，第一时间修复。

业务问题

1、你们项目中有没有做过限流？怎么做的？

常规限流，为了防止恶意攻击，保护系统正常运行。
Tomcat限流
Nginx限流
    1、控制速率（突增变量）（漏桶算法）
    2、控制并发连接数
网关限流（令牌桶）
    1、定义流量对象
    2、令牌桶每秒填充速率
    3、令牌桶容量

2、解释一下CAP和Base

分布式事务方案的知道
分布式系统设计方向
根据业务指导使用正确的技术选择

3、CAP定理

1998年，加州大学的计算机科学家Eric Brewer提出，分布式系统有三个指标：
    Consistency（一致性）：用户访问分布式系统中的任意节点，得到的数据必须一致
    Availability（可用性）：用户访问集群中的任意健康节点，必须得到响应，而不是超时或拒绝
    Partition tolerance（分区容错性）
    	Partition：因为网络故障或其他原因，导致分布式系统中的部分节点与其他节点失去连接，形成独立分区。
    	tolerance：在集群出现分区时，整个系统也要持续对外提供服务
Eric Brewer说，分布式系统无法同时满足这三个指标，这个结论就叫做CAP定理。
    
    结论：
    分布式系统节点之间肯定是需要网络连接的，分区（P）是必然存在的
    如果保证访问的高可用性（A），可以持续对外提供服务，但不能保证数据的强一致性
    如果保证访问的数据的强一致性（C），就要放弃高可用性

4、BASE理论

BASE理论是对CAP定理的一种解决思路，包含三个思想：
    Basically Available（基本可用）:分布式系统出现故障时，必须损失部分可用性，即保证核心可用
	Soft State（软状态）:在一定时间内，允许出现中间状态，比如临时的不一致状态
	Eventually Consistent（最终一致性）：虽然无法保证强一致性，但是在软状态结束后，最终达到数据一致

5、分布式事务解决方案？

Seata:
Seata事务管理中有三个重要的角色：
    TC-事务协调者：维护全局和分支事务的状态，协调全局事务提交或回滚。
    TM-事务管理器：定义全局事务的范围、开始全局事务、提交或回滚全局事务。
    RM-资源管理器：管理分支事务处理的资源，与TC交谈以注册事务和报告分支事务的状态，并驱动分支事务提交或回滚
    
seata的XA模式（CP，需要互相等待各个分支事务提交，可以保证强一致性，性能差，银行业务）：
    RM一阶段的工作：
    	1、注册分支事务到TC
    	2、执行分支业务sql但不提交
    	3、报告执行状态到TC
    TC二阶段的工作：
    	TC检测各分支事务执行状态
    	1、如果都成功，通知所有RM提交事务
    	2、如果有失败，通知所有RM回滚事务
    RM二阶段的工作：
    	接收TC指令，提交或回滚事务
    
seata的AT模式（AP,底层使用undo-log实现，性能好，互联网业务）：
    AT模式同样是分阶段提交的事务模型，不过却弥补了XA模式中资源锁定周期过长的缺陷。
   阶段一RM的工作：
    	1、注册分支事务
    	2、记录undo-log(数据快照)
    	3、执行业务sql并提交
    	4、报告事务状态
    阶段二提交时RM的工作：
    	删除undo-log
    阶段二回滚时RM的工作：
    	根据undo-log恢复数据到更新前
    
seata的TCC模式（AP,性能较好，不过需要人工编码实现）：
    1、Try:资源的检测和预留
    2、Confirm:完成资源操作业务；要求Try成功Confirm一定要能成功
    3、Cancel:预留资源释放，可以理解为try的反向操作
   
MQ模式实现分布式业务，在A服务写数据的时候，需要在同一个事务内发送消息到另外一个事务，异步，性能最好，互联网业务

6、分布式服务的接口幂等性如何设计？

幂等：多次调用方法或者接口不会改变业务状态，可以保证重复调用的结果和单次调用的结果一致。
  
需要幂等的场景：
    1、用户重复点击（网络波动）
    2、MQ消息重复
    3、应用使用失败或超时重试机制
    
解决方法：
    如果是新增数据，可以使用数据库的唯一索引
    如果是新增或更改数据
    1、token+redis
    2、分布式锁

7、你们项目中使用了什么分布式任务调度

xxl-job解决的问题：
    解决集群任务的重复执行问题
    cron表达式定义灵活
    定时任务失败了，重试和统计
    任务量大，分片执行

8、xxl-job的路由策略有哪些？

1、First:固定选择第一个实例
2、Last
3、轮询
4、随机
5、一致性hash
6、最不经常使用
7、最近最久未使用
8、故障转移
9、忙碌转移
10、分片广播（大数据量的任务同时都需要执行时选择）

9、xxl-job任务执行失败怎么办？

故障转移+失败重试，查看日志分析--->邮件告警

消息中间件篇

RabbitMQ

1、RabbitMQ如何保证数据不丢失

1、开启生产者确认机制，确保生产者的消息能到达队列
2、开启持久化功能，确保消息未消费前在队列不会丢失
3、开启消费者确认机制为auto,由spring确认消息成功后完成ack
4、开启消费者失败重试机制，多次重试失败后将消息投递到异常交换机，交由人工处理

2、RabbitMQ消息的重复消费问题如何解决的？

给每条消息设置一个唯一的标识，我们在处理消息时，先到数据库查询一下，这个数据是否存在，如果不存在，说明没有处理过，这个时候就可以正常处理这个消息了，如果已经存在这个数据了，就说明消息重复消费了，我们不需要再消费了。
    另外我们也可以通过redis分布式锁，数据库锁等方法来解决。

3、RabbitMQ中死信交换机？（RabbitMQ延迟队列有了解过吗？）

延迟队列：进入队列的消息会被延迟消费的队列
场景：超时订单、限时优惠、定时发布
    
死信交换机：
    当一个队列中的消息满足下列情况，就可能成为死信（dead letter）
    1、消费者使用basic.reject或basic.nack声明消费失败，并且消息的requeue参数设置为false
    2、消息是一个过期消息，超时无人消费
    3、要投递的队列消息堆积满了，最早的消息可能成为死信
    如果该队列配合了dead-letter-exchange属性，指定了一个交换机，那么队列中的死信就会投递到这个交换机中，而这个交换机称为死信交换机。
    
TTL:
TTL也就是Time-To-Live。如果一个队列中的消息TTL结束仍未消费，则会变为死信，ttl超时分为两种情况：
    消息所在的队列设置了存活时间
    消息本身设置了存活时间。（若都设置，以时间小的为准）

候选人：我们当时的一个XX项目有一个XX业务，需要用到延迟队列，其中就是使用RabbitMQ来实现的。延迟队列就是用死信交换机和TTL来实现的。如果消息超时未消费就会变成死信，在RabbitMQ中如果消息成为死信，队列可以绑定一个死信交换机，在死信交换机上可以绑定其他队列，在我们发消息的时候可以按照需求指定TTL的时间，这样就实现了延迟队列的功能了。
    RabbitMQ还有一种方式可以实现延迟队列，在RabbitMQ中安装一个死信插件，这样更方便一些，我们只需要在声明交互的时候，指定这个就是死信交换机，然后发送消息的时候直接指定超时时间就行了，相对于死信交换机+TTL要省略了一些步骤。

4、RabbitMQ如果有100万消息堆积在MQ,如何解决？

1、增加更多消费者，提高消费速度
2、在消费者内开启线程池加快消息处理速度
3、扩大队列容积，提高堆积上限，采用惰性队列
    惰性队列：
    1、在声明队列的时候可以设置属性x-queue-mode为lazy,即为惰性队列
    2、基于磁盘存储，消息上限高
    3、性能比较稳定，但基于磁盘存储，受限于磁盘IO，时效性会降低

5、RabbitMQ的高可用机制有了解过吗？

我们可以采用镜像模式搭建集群。镜像队列结构就是一主多从，所有操作都是主节点完成，然后同步给镜像节点。主节点宕机后，镜像节点会替代成新的主节点（如果在主从同步前，主节点就已宕机，可能出现数据丢失）
    那出现丢数据怎么解决？
    我们可以采用仲裁队列，与镜像队列一样，都是主从模式，支持主从数据同步，主从同步基于Raft协议，强一致，并且使用起来也非常简单，不需要额外配置，在声明队列的时候只要指定这个是仲裁队列即可。

6、RabbitMQ的优点

RabbitMQ是基于ErLang语言编写的，正是由于ErLang语言在数据交互方面的优越性能，才使得RabbitMQ和它的名字一样，像兔子一样快速。
1、开源，性能优秀，稳定性高；
2、提供可靠性消息投递模式，返回模式；
3、与spring AMQP完美整合，API丰富
4、集群模式丰富（简单、work、订阅、主题、路由）
保证数据不丢失的前提下做到高可靠性

Kafka

1、Kafka是如何保证数据不丢失的？

需要从三个层面去解决这个问题：
    1、生成者发送消息到Broker丢失
    	设置异步发送，发送失败使用回调进行记录或重发
    	失败重试，参数设置，可以设置重试次数
    2、消息在Brocker中存储丢失
    	发送确认acks,选择all,让所有副本都参与保存数据后确认
    3、消费者从Broker接收消息丢失
    	关闭自动提交偏移量，手动提交偏移量
    	提交方式，最好是同步+异步提交

2、kafka如何保证消费的顺序性？

一个topic的数据可能存在不同的分区中，每个分区都有一个按照顺序的存储的偏移量，如果消费者关联了多个分区不能保证顺序性
    解决方案：
    1、发送消息时指定分区号
    2、发送消息时按照相同的业务设置相同的key

3、kafka的高可用机制了解过吗？

可以从两个层面回答，第一个是集群，第二个是复制机制
    集群：一个kafka集群由多个broker实例组成，即使某一台宕机，也不耽误其他broker继续对外提供服务
    复制机制：
    	1、一个topic有多个分区，每个分区有多个副本，有一个leader，其余的是follower,副本存储在不同的broker中
    	2、所有的分区副本的内容都是相同的，如果leader发生故障时，会自动将其中一个follower提升为leader,保证系统的容错性、高可用性

4、解释一下复制机制中的ISR

ISR（in-sync replica）需要同步复制保存的follower
分区副本分为了两类，一个是ISR，与leader副本同步保存数据，另外一个普通的副本，是异步同步数据，当leader挂掉之后，会优先从ISR副本列表中选取一个作为leader

5、kafka数据清理机制了解过吗？

kafka的存储结构：
    1、kafka中topic的数据存储在分区上，文件如果过大分区会分段存储segment
    2、每个分段都在磁盘上以索引和日志文件的形式存储
    3、分段的好处是，第一能够减少单个文件内容的大小，查找数据方便，第二方便kafka清理日志
日志的清理策略有两个：
    1、根据消息的保留时间，当消息保存时间超过了指定时间，就会触发清理，默认是168个小时（7天）
    2、根据topic存储数据的大小，当topic所占的日志文件大小大于一定的阈值，则开始删除最久的消息。（默认关闭）

6、kafka实现高性能的设计，有了解过吗？

1、消息分区：不受单台服务器的限制，可以不受限的处理更多的数据
2、顺序读写：磁盘顺序读写，提升读写效率
3、页缓存：把磁盘中的数据缓存到内存中，把对磁盘的访问变为对内存的访问
4、零拷贝：减少上下文切换及数据拷贝
5、消息压缩：减少磁盘IO和网络IO
6、分批发送：将消息打包批量发送，减少网络开销

常见集合篇

算法复杂度分析

1、什么是算法时间复杂度

时间复杂度表示了算法的执行时间与数据规模之间的增长关系

2、常见的时间复杂度有哪些？

O(1)、O(n)、O(nlogn)、O(n^2)

3、什么是算法的空间复杂度

表示算法占用的额外存储空间与数据规模之间的增长关系

List相关面试题

1、数组如何获取其他元素的地址值？

通过数组下标结合寻址公式查找

2、为什么数组索引从0开始，假如从1开始不行吗？

在根据数组索引获取元素的时候，会用索引和寻址公式来计算内存所对应的元素数据，寻址公式是：数组的首地址+索引乘以存储数据的类型大小。若从1开始，则寻址公式为数组的首地址+（索引+1）乘以存储数据的类型大小，反而繁琐。

3、ArrayList底层的实现原理是什么？

Arraylist底层是用动态的数组实现的
ArrayList初始容量为0，当第一次添加数据的时候才会初始化容量为10
ArrayList在进行扩容的时候是原来的1.5倍，每次扩容都需要拷贝数组
ArrayList在添加数组的时候
    1、确保数组已使用长度加1之后足够存下下一个数据
    2、计算数组的容量，如果当前数组已使用长度+1后大于当前数组长度，则调用grow方法扩容
    3、确保新增的数据有地方存储之后，则将新元素添加到位于size的位置上
    4、返回添加成功布尔值

4、ArrayList list = new ArrayList(10)中的list扩容了几次？

该语句只是声明和实例了一个ArrayList,指定了容量为10，并未扩容。

5、如何实现数组和List之间的转换

数组转List,使用JDK中java.util.Arrays工具类的asList方法
List转数组，使用List的toArray方法。无参toArray方法返回Object数组，传入初始化长度的数组对象，返回该对象数组。
    
面试官再问：
    1、用Arrays.asList转List后，如果修改了数组内容，list受影响吗
    2、List用toArray转数组后，如果修改了List内容，数组受影响吗
再答：
    1、Arrays.asList转换list之后，如果修改了数组的内容，list会受影响，
    因为它的底层使用Arrays类中的一个内部类ArrayList来构造的集合，在这个集合的构造器中，把我们传入的这个集合进行了包装而已，最终指向的都是同一个内存地址
    2、list用了toArray转数组后，如果修改了list内容，数组不会影响，当调用了toArray以后，在底层是它进行了数组的拷贝，跟原来的元素就没啥关系了，所以即使list修改了以后，数组也不受影响。

6、ArrayList和LinkedList的区别是什么？

1、底层数据结构
    ArrayList是动态数组的数据结构实现
    LinkedList是双向链表的数据结构实现
2、操作数据效率
    ArrayList按下标查询的时间复杂度为O（1）,内存是连续的，根据寻址公式。linkedList不支持下标查询;
    查找（未知索引）：ArrayList需要遍历，LinkedList也需要遍历，时间复杂度都为O（n）;
    新增和删除：
    ArrayList尾部插入和删除，时间复杂度为O（1）;其他部分增删需要挪动数组，时间复杂度为O（n）;
	LinkedList头尾节点增删时间复杂度是O（1）;其他都需要遍历链表，时间复杂度为O（n）;
3、内存空间占用：
    ArrayList底层是数组，内存连续，节省内存
    LinkedList是双向链表需要存储数据和两个指针，更占用内存
 4、线程安全
    都不是线程安全的。可以使用线程安全的ArrayList和LinkedList，用Collections.synchronizedList包装一下。

7、什么是红黑树？

红黑树：也是一种自平衡的二叉搜索树
所有的红黑树资格都是希望红黑树能够保持平衡
红黑树的时间复杂度：增加、删除、修改都是O（logn）

HashMap相关面试题

1、说一下HashMap的实现原理？

HashMap的数据结构：底层使用hash表数据结构，即数组和链表或红黑树
    1、当我们往HashMap中put元素的时候，利用key的hashcode重新hash计算出当前元素在数组中的下标。
    2、存储时。如果出现hash值相同的key,此时有两种情况：
    	是同一个key:覆盖原先key所对value值
    	不是同一个key:（出现冲突）,将当前key-value放入链表或红黑树中（当链表的长度大于8，数组长度大于64时转换为红黑树）
    3、获取时，直接找到hash值对应的下标，再进一步判断key是否相同，从而找到对应值。

2、HashMap的jdk1.7和jdk1.8有什么区别？

1、数据结构：
    1.7之前只有链表加数组；1.8之后加入红黑树存储；在链表数大于8且数组等于64时转化为红黑树，在链表数小于等于6时转化为链表
2、插入数据：
    1.7链表是头插法，1.8则是尾插法
3、初始化过程
    1.7创建了HashMap实例之后，就对table数组初始化，1.8中，当我们创建了HashMap实例以后，底层并没有初始化table数组。当首次添加时，进行判断，如果发现table没有初始化，则对数组进行初始化。
4、1.7中HashMap底层定义了Entry内部类，1.8中替换为Node类。

3、HashMap的put方法的具体流程？

首先，会调用key所在的类的hashcode（）方法得到哈希值1，然后对哈希值1经过某种算法hash()得到哈希值2，再对哈希值2经过某种算法就可以确定该值在table中的索引值i了。若该索引值上没有元素，则添加成功。若有元素，则需要比较两个key的哈希值是否相同，若不相同，则添加成功；若相同，则需要比较两个key的equals方法是否相同，若不相同，则添加成功，若相同则替换对应的value值。

4、讲一讲HashMap的扩容机制（resize方法）？

在添加元素或初始化的时候需要调用resize方法进行扩容，第一次添加数据初始化数组长度为16，以后每次扩容都是达到了扩容的阈值（数组长度 * 0.75）
每次扩容的时候都是扩容之前容量的2倍
扩容之后会创建一个新的数组，再把老数组数据挪动到新数组中（先分裂，再迁移）。

5、HashMap的size为什么是2的整数次方？

HashMap为了存取高效，要尽量减少碰撞，要尽量把数据分配均匀，每个链表大致相同，这个实现就是计算把数据存放到哪个链表中的算法。
    这个算法就是取模，但是取模效率不高，源码中进行了优化，取模（hash % length）与按位与（hash & （length-1））相等的前提是length是2的n次方，2的n次方减一实际就是n个1,这样运算之后，数据就可以分散均匀。
    例：97 % 16 = 1
    （16 - 1） & 97 = 1

6、死锁产生的原因和解决方案？

死锁产生的四个条件：
    1、互斥
    2、占有且等待
    3、不可剥夺
    4、循环等待
针对条件1，我们无法改变，因为互斥是解决线程安全问题的必要条件
    针对条件2，我们可以一次性申请完全部的所需资源
    针对条件3，我们可以再进一步申请资源，申请不到就放弃已拥有的资源
    针对条件4，我们可以将资源改为线性顺序申请，申请资源时默认申请序号小的，这样就可以避免循环等待的问题了。

7、hashmap在1.7中多线程出现死循环的问题？

在jdk1.7的hashmap进行扩容的时候，因为是头插法，在进行数据迁移的过程中，有可能出现死循环的问题
    比如说，现在有两个线程
    线程1：读取到当前的hashmap数据，数据中一个链表，在准备扩容时，线程2介入
    线程2：也是读取hashmap,直接进行扩容，因为是头插法，在链表的顺序会进行颠倒，比如原来的顺序AB,扩容后的顺序变为BA,线程2执行结束。
    线程1：继续执行的时候会出现死循环的问题
    线程1先将A迁移到新的链表，再将B插入到链头，由于另外一个线程的原因，B的next指向了A,所以BAB,形成循环。
    JDK8采用尾插法，就避免了jdk7中的死循环问题。

8、hashMap与hashTable有什么区别？

1、线程安全性
    hashMap是线程不安全的，hashTable是线程安全的
2、是否为null
    huanMap允许键值为null,hashTable不允许键值为null
3、初始化和扩容
    hashMap的初始化容量为16，而hashTable初始化容量为11；扩容时hashMap容量翻倍，hsahTable容量翻倍+1
4、继承的类不同
5、迭代器
    hashmap的迭代器是fail-fast，hashTable不是

并发编程篇

线程基础

1、线程和进程的区别？

1、进程是正在允许程序的实例，进程中包含了线程，每个线程执行不同的任务
2、不同的进程使用不同的内存空间，在当前进程下的所有线程可以共享内存空间
3、线程更轻量，线程上下文切换成本比进程上下文切换低（上下文切换是指从一个进程切换到另一个进程）

2、并行与并发的区别？

候选人:
现在都是多核CPU,在多核CPU下：并行是同一时间动手做多件事情的能力，四核CPU同时执行四个线程；并发是同一时间应对多件事情的能力，多个线程轮流使用一个或多个CPU。

3、线程创建的方式？

1、继承Thread类
2、实现Runnable接口
3、实现Callable接口
4、线程池创建线程（ 项目中使用方式 ）

4、Runnable和Callable的区别

1、Runnable接口的run方法没有返回值
2、Callable接口call（）方法有返回值，是个泛型，和future,futureTask配合可以用来获取异步执行的结果
3、Callable接口的call（）方法允许抛出异常，而runnable的run（）方法的异常只能在内部消化，不能继续上抛

5、线程的run()和start()有什么区别？

start():用来启动线程，通过该线程调用run方法执行run方法中所定义的逻辑代码。start方法只能被调用一次。
run（）:封装了要被线程执行的代码，可以被多次调用。

6、线程包括哪些状态，状态之间是如何变化的？

新建（NEW）、可运行（RUNNABLE）、终止（TERMINATED）、阻塞（BLOCKD）、等待（WAITING）、计时等待（TIMED_WALTING）

创建线程对象是新建状态
调用了start（）方法是可运行状态
线程获取了cpu执行权，执行结束是终止状态
在执行状态的过程中，如果没有获得cpu执行权，可能会切换为其他状态

7、怎么保证线程按顺序执行？notify和notifyAll有什么区别？

可以用join（）方法实现线程顺序执行，比如现在有三个线程，在线程2中join线程1，这样线程2就必须等待线程1执行完之后再执行，同理再在线程3中join线程2,这样线程的执行顺序便为线程1，线程2，线程3。
    notifyAll:唤醒所有wait的线程
    notify:只随机唤醒一个wait线程

8、在java中的wait和sleep方法有什么不同？

共同点：wait(),wait(long)和sleep(long)的效果都是让当前线程暂时放弃CPU的使用权，进入阻塞状态
不同点：1、方法归属不同
    sleep（long）是Thread的静态方法
    而wait（）,wait(long)都是Object的成员方法，每个对象都有
    2、醒来时机不同
    执行sleep（long）和wait（long）的线程都会在等待相应毫秒后醒来
    wait（long）和wait（）还可以被notify唤醒，wait（）如果不唤醒，就会一直等下去
    它们都可以被打断唤醒
    3、锁特性不同（重点）
    wait方法的调用必须先获取wait对象的锁，而sleep则无此限制
    wait方法执行后会释放对象锁，允许其他线程获取该对象锁
    而sleep如果在synchronized代码中执行，并不会释放对象锁

9、如何停止一个正在允许的线程？

1、使用退出标志，使线程正常退出，也就是当run方法完成后线程终止
2、使用stop方法强行终止（不推荐使用，方法已作废）
3、使用interrupt方法中断线程
    打断阻塞的线程（sleep,wait,join），线程会抛出异常
    打断正常的线程，可以根据打断状态来标记是否退出线程

线程安全

1、synchronized关键字的底层原理

线程池

JVM虚拟机篇

JVM组成

1、什么是程序计数器？

作用：程序计数器（PC寄存器）的作用是存储下一条指令的地址，也就是即将要执行的指令的地址。然后会由执行引擎来执行下一条指令。
   
介绍：
    1、它是一块很小的内存空间，小到可以忽略不计，也是运行速度最快的存储区域
    2、在JVM规范中，每个线程都有自己的程序计数器，它是线程私有的。它的生命周期与线程的生命周期是一致的
    3、任何时间一个线程只有一个方法在执行，也就是所谓的当前方法。程序计数器会存储当前线程正在执行的方法的地址，如果执行的是本地方法，则其值为undefined
    4、它是程序控制流的指示器，分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这指示数器来完成
    5、字节码解释器是通过改变计数器的值来执行下一条字节码指令
    6、它是唯一一个Java虚拟机中没有规定任何OutOfMemoryError情况的区域

2、使用PC寄存器存储字节码指令地址有什么用？

因为CPU需要不停的切换线程，切换回来以后，需要知道从哪条指令开始执行。

3、PC寄存器为什么被设定为线程私有？

Java是天然的多线程程序，所以线程的执行会被经常的中断和恢复。有了PC寄存器之后，CPU可以准确的知道当前线程执行到哪里了，就可以从上次中断的地方继续执行。为了避免多线程之间的互相干扰，保证PC寄存器的准确性，所以PC寄存器需要设定为私有的。

4、介绍一下java堆？

线程共享的区域：主要用来保存对象实例，数组等，内存不够则抛出OutOfMemoryError异常
组成：年轻代+老年代
    年轻代被划分为三部分，Eden区和两个严格相同的Survivor区
    老年代主要保存生命周期长的对象，一般是一些老的对象
    在jdk1.7中，堆中还有永生代，存储的是类信息、静态变量，常量，编译后的代码，在1.8及之后版本中被移除，把数据存储到了本地内存的元空间中，防止内存溢出。

5、什么是虚拟机栈？

1、每个线程运行时所需要的内存，称为虚拟机栈，先进后出
2、每个栈由多个栈帧组成，对应着每次方法调用时占用的内存
3、每个线程只能有一个活动栈帧，对应着当前正在执行的那个方法

6、垃圾回收是否涉及栈内存？

垃圾回收主要指就是堆内存，当栈帧弹栈之后，内存就会被释放

7、栈内存分配的越大越好吗？

不是。一个栈默认的栈内存通常为1024K
栈帧过大会导致线程数变少，例如，机器总内存为512m,目前能活动的线程数为512个，如果把栈内存改为2048K,那么能活动的栈帧就会减半

8、方法内的局部变量是否线程安全？

1、如果方法内部局部变量没有逃离方法的作用范围，它是线程安全的
2、如果是局部变量引用了对象，并逃离了方法的作用范围，需要考虑线程安全

9、什么情况下会导致栈内存溢出？

1、栈帧过多导致栈内存溢出，典型问题：递归调用
2、栈帧过大导致栈内存溢出（不易出现）

10、堆栈的区别是什么？

栈内存一般会用来存储局部变量和方法调用，堆内存则用来存储java对象和数组，堆会GC垃圾回收，而栈不会
栈内存是线程私有的，而堆内存是线程共有的
两者异常错误不同
    栈空间不足：java.lang.StackOverFlowError
    堆空间不足：java.lang.OutOfMemoryError

11、能不能解释一下方法区？

1、方法区（Method Area）是各个线程共享的内存区域
2、主要存储类的信息、运行时常量池
3、虚拟机启动时创建，关闭虚拟机时释放
4、如果方法区域中的内存无法满足分配请求，则会抛出异常java.lang.OutOfMemory:MetaSpace

12、介绍一下运行时常量池

常量池：可以看作是一张表，虚拟机指令根据这张表找到要执行的类名、方法名、参数类型、字面量等信息
当类被加载，它的常量池信息就会被放入运行时常量池，并把里面的符号地址变为真实地址

13、你听过直接内存吗？

1、并不属于JVM中的内存结构，不由JVM进行管理。是虚拟机的系统内存
2、常见于NIO操作时，用于数据缓冲区，分配回收成本较高，但读写性能高，不受JVM回收管理

类加载器

1、什么是类加载器？

JVM只会运行二进制文件，类加载器的作用就是将字节码文件加载到JVM中，从而让Java程序能够启动起来。

2、类加载器有哪些？

1、启动类加载器。加载JAVA_HOME/jre/lib目录下的库
2、扩展类加载器。加载JAVA_HOME/jre/lib/ext目录下的类
3、应用类加载器。加载classPath下的类
4、自定义类加载器。自定义类继承ClassLoader,实现自定义类加载规则

3、什么是双亲委派机制？

需要加载某一个类时，先委托上一级的加载器进行加载，如果上一级加载器还有上级，则继续向上委托，如果该类委托上级没有被加载，则由子加载器尝试加载该类。

4、JVM为什么采用双亲委派机制？

1、通过双亲委派机制可以避免某一个类被重复加载，当父类已经加载后则无需重复加载，保证唯一性。
2、为了安全，保证类库API不会被修改

5、说一下类装载的执行过程？

加载：查找和导入class文件
验证：保证加载类的准确性
准备：为类变量分配内存并设置类变量初始值
解析：把类中的符号引用转换为直接引用
初始化：对静态变量、静态代码块执行初始化操作
使用：JVM开始从入口方法开始执行用户的程序代码
卸载：当用户程序代码执行完毕后，JVM便开始销毁创建的Class对象

垃圾回收

1、对象什么时候会被GC回收？

如果一个或多个对象没有任何的引用指向它了，那么这个对象现在就是垃圾，如果定位了垃圾，就有可能被垃圾回收器回收

2、定位垃圾的方式

1、引用计数法。一个对象被引用了一次，在当前的对象头上递增一次引用次数，如果这个对象的引用次数为0，代表这个对象可回收
    当对象间出现了循环引用的话，引用计数法就会失效
2、可达性分析算法（常用）
    哪些对象可以作为GC Root?
    虚拟机栈（栈帧中的本地变量表）中的对象
    方法区中的类静态属性引用的对象
    方法区中常量引用的对象
    本地方法栈中JNI（即一般说的Native方法）引用的对象

3、JVM垃圾回收算法有哪些？

1、标记清除算法
    标记清除算法分为两个阶段：标记和清除
    1、标记：根据可达性分析算法得出的垃圾进行标记
    2、清除：对这些标记为可回收的内容进行垃圾回收
    优点：标记清除速度比较快
    缺点：碎片化比较严重，内存是不连贯的

2、标记整理算法
    优点同标记清除算法，解决了标记清除算法的碎片化的问题，同时，标记压缩算法多了一步，对象移动内存位置的步骤，其效率也有一定的影响。
    
3、复制算法
	优点：
		在垃圾对象比较多的时候，效率较高
		无内存碎片化问题
	缺点：
		分配的2块内存空间，在同时刻，只能使用其中的一块，内存使用率较低

4、分代收集算法-工作机制

1、新创建的对象，会先分配到eden（伊甸园）区
2、当伊甸园区内存不足，标记伊甸园与from（现阶段没有）的存活对象
3、将存活对象复制到to,复制完成后，伊甸园和from内存得以释放
4、经一段时间伊甸园内存又不足，标记伊甸园与to中存活的对象，将存活的对象复制到from
5、当幸存区对象熬过几次回收（最多15次）,晋升到老年代（幸存区内存不足或大对象会导致提前晋升）

5、MinorGC、MixedGC、FullGC是什么？

MinorGC[YoungGC]发生在新生代的垃圾回收，暂停时间短（STW,stop-the-word,暂停所有应用程序线程，等待垃圾回收的完成）
MixedGC：新生代+老年代部分区域的垃圾回收，G1收集器特有
FullGC：新生代+老年代完整垃圾回收，暂停时间长（STW）,应尽量避免

6、常见的垃圾回收器有哪些？

1、GMS（并发）垃圾回收器
    GMS是一款并发的、使用标记-清除算法的垃圾回收器，该垃圾回收器是针对老年代垃圾回收的，是一款以获得最短回收停顿时间为目标的收集器，停顿时间短，用户体验就好。其最大的特点是在垃圾回收时，应用仍然能正常运行
2、G1垃圾回收器，作用在新生代+老年代
3、串行垃圾回收器
4、并行垃圾回收器

7、G1垃圾回收器

应用于新生代和老年代，在JDK9之后默认使用G1
划分成多个区域，每个区域都可以充当eden,survivor,old,humongous,其中humongous专为大对象准备
采用复制算法
响应时间与吞吐量兼顾
分成三个阶段：新生代回收、并发标记、混合收集
如果并发失败（即回收速度赶不上创建新对象速度），会触发Full GC

8、强引用、软引用、弱引用、虚引用的区别

强引用：只要所有的GC Root能找到，就不会被垃圾回收
软引用：仅有软引用引用该对象时，在垃圾回收多次，内存仍不足时会再次触发垃圾回收
弱引用：仅有弱引用引用该对象时，在垃圾回收时，无论内存是否充足，都会被回收弱应用对象
虚引用：必须配合引用队列使用，被引用对象回收时，会被虚引用入队，由Reference Handler线程调用虚引用相关方法释放直接内存

JVM实践

1、JVM调优参数可以在哪里设置参数值？

war包部署在tomcat中设置
    修改TOMCAT_HOME/bin/catalina.sh文件
    JAVA_OPTS="-Xms512m -XMx1024m"
jar包部署在启动参数设置
    nohup java -Xms512m -XMx1024m -jar XXX.jar --spring.profiles.active=prod &
    nohup:用于在系统后台不挂断地运行命令，退出终端不会影响程序的运行
    参数 &：让命令在后台执行，终端退出后命令仍旧执行

2、用的JVM调优的参数都有哪些？

对于JVM调优，主要就是调整年轻代，老年代，元空间的内存空间大小及使用的垃圾回收器类型
设置堆空间大小   
	-Xms:设置堆的初始化大小
	-Xmx:设置堆的最大大小
虚拟机栈的设置
    -Xss:对每个线程stack大小的调整
年轻代的eden区和两个幸存者区的大小比例
    -XXSurvivorRatio=8,表示年轻代中的分配比率：survivor:eden=2：8
    -XXSurvivorRatio=3,表示年轻代中的分配比率：survivor:eden=2：3
年轻代晋升老年代的阈值
    -XX:MaxTenuringThreshold=threshold
设置垃圾回收器
    通过增大吞吐量提高系统性能，可以通过设置并行垃圾回收收集器
    -XX:+UseG1GC

4、说一下JVM调优的工具？

命令工具
jps:进程状态信息
jstack:查看java进程内线程的堆栈信息
jmap: 显示堆的信息
jhat:堆转储快照分析工具
jstat:JVM统计检测工具
可视化工具    
jconsole:
VisualVM

5、java内存泄漏排查思路

内存泄漏通常是指堆内存，通常指一些大对象不被回收的情况
解决思路
    1、通过jmap或设置jvm参数生成一个dump文件，主要jmap生成dump文件只有当前程序在运行中才生效
    2、通过工具，VisualVM去分析dump文件，VisualVM可以加载离线的dump文件
    3、通过查看堆信息的情况，可以大概定位堆内存溢出是哪一行代码
    4、找出对应的代码，通过阅读上下文的情况，进行修复即可

6、CPU飙高排查方案与思路？

1、使用top命令查看占用CPU情况
2、通过top命令后，可以找到是哪一个进程占用cpu较高
3、使用ps命令查看进程中的线程信息
4、使用jstack查看进程中哪些线程出现了问题，最终定位

企业场景篇

设计模式

1、工厂模式

1、简单工厂
    简单工厂并不是设计模式，所有产品都共有一个工厂，如果有新增产品，则修改代码，违背了开闭原则
    是一种编码习惯，可以借鉴这种编程思路
2、工厂方法模式
    给每一个产品提供一个工厂，让工厂专门复制对应产品的生产，遵循开闭原则
    项目中用的最多
3、抽象工厂模式
    如果有多个维度的产品需要生产时，优先建议采用抽象工厂（工厂的工厂）
    一般企业开发中用的较少

标签：专题,Java,索引,面试,缓存,线程,内存,key,数据
From： https://www.cnblogs.com/clone2653/p/17790686.html