1. 什么是缓存?
简单来说,核心思路就是把一些常用的数据放到触手可及(访问速度更快)的地方,方便随时读取。
对于计算机硬件来说,往往访问速度越快的设备,成本越高,存储空间越小。
缓存是更快,但是空间上往往是不足的。因此大部分的时候,缓存只放一些热点数据(访问频繁的数据),就非常有用了。
关于 "二八定律"
20%的热点数据,能够应对80%的访问场景。
因此只需要把这少量的热点数据缓存起来,就可以应对大多数场景,从而在整体上有明显的性能提升。
2. 使用Redis作为缓存
在一个网站中,我们经常会使用关系型数据库(比如MySQL)来存储数据。
关系型数据库虽然功能强大,但是有一个很大的缺陷,就是性能不高。(换而言之,进行一次查询操作消耗的系统资源较多)。
(1)为什么说关系型数据库性能不高?
- 数据库把数据存储在硬盘上,硬盘的IO速度并不快,尤其是随机访问。
- 如果查询不能命中索引,就需要进行表的遍历,这就会大大增加硬盘IO次数。
- 关系型数据库对于SQL的执行会做一系列的解析,校验,优化工作。
- 如果是一些复杂查询,比如联合查询,需要进行笛卡尔积操作,效率更是降低很多。
如果访问数据库的并发量比较高,对于数据库的压力是很大的,很容易就会使数据库服务器岩机。
(2)为什么并发量高了会宕机
- 服务器每次处理一个请求,都是需要消耗一定的硬件资源的。所谓的硬件资源包括不限于CPU内存,硬盘,网络带宽.....
- 一个服务器的硬件资源本身是有限的。
- 一个请求消耗一份资源,请求多了,自然把资源就耗尽了。后续的请求没有资源可用,自然就无法正确处理,更严重的还会导致服务器程序的代码出现。
如何让数据库能够承担更大的并发量呢?核心思路主要是两个:
- 开源:引入更多的机器,部署更多的数据库实例,构成数据库集群。(主从复制,分库分表等...)
- 节流:引入缓存,使用其他的方式保存经常访问的热点数据,从而降低直接访问数据库的请求数量。
而Redis就是一个用来作为数据库缓存的常见方案,主要由于以下特点:
- Redis消耗的系统资源比MySQL少很多,因此Redis能支持的并发量更大。
- Redis数据在内存中,访问内存比硬盘快很多。
- Redis只是支持简单的key-value存储,不涉及复杂查询的那么多限制规则。
客户端访问业务服务器,发起查询请求。
业务服务器先查询Redis,看想要的数据是否在Redis中存在。
- 如果已经在Redis中存在了,就直接返回。
- 此时不必访问MySQL了如果在Redis中不存在,再查询MySQL。
注意:
缓存是用来加快”读操作”的速度的,如果是”写操作”还是要老老实实写数据库,缓存并不能
提高性能。
3. 缓存的更新策略
首先,到底哪些数据才是 "热点数据" 呢?
(1)定期生成
每隔一定的周期(比如一天/一周/一个月),对于访问的数据频次进行统计,挑选出访问频次最高的前N%的数据。
(2)实时生成
先给缓存设定容量上限(可以通过Redis配置文件的 maxmemory 参数设定)
接下来把用户每次查询:
- 如果在Redis查到了,就直接返回
- 如果Redis中不存在,就从数据库查,把查到的结果同时也写入Redis
如果缓存已经满了(达到上限),就触发缓存淘汰策略,把一些”相对不那么热门”的数据淘汰掉,按照上述过程,持续一段时间之后Redis内部的数据自然就是 "热门数据" 了。
通用的淘汰策略主要有以下几种:FIFO(FirstInFirstOut)先进先出 把缓存中存在时间最久的(也就是先来的数据)淘汰掉。Redis内置的淘策略如下:
LRU(LeastRecentlyUsed)淘汰最久未使用的
记录每个key的最近访问时间,把最近访问时间最老的key淘汰掉。
LFU(LeastFreguentlyUsed)淘汰访问次数最少的 记录每个key最近一段时间的访问次数。把访问次数最少的淘汰掉Random随机淘汰。
Random 随机淘汰 从所有的key中抽取幸运儿被随机淘汰掉。
- volatile-ru:当内存不足以容纳新写入数据时,从设置了过期时间的key中使用LRU(最近最少使用)算法进行淘汰。
- alkeys-ru:当内存不足以容纳新写入数据时,从所有key中使用LRU(最近最少使用)算法进行淘汰。
- volatile-lfu:4.0版本新增,当内存不足以容纳新写入数据时,在过期的key中,使用LFU算法进行删除key。
- akeys-fu:4.0版本新增,当内存不足以容纳新写入数据时,从所有key中使用LFU算法进行淘汰。
- volati le-random:当内存不足以容纳新写入数据时,从设置了过期时间的key中,随机淘汰数据。
- akeys-random:当内存不足以容纳新写入数据时,从所有key中随机淘汰数据。
- volatile-tt:在设置了过期时间的key中,根据过期时间进行淘汰,越早过期的优先被淘(相当于FIFO,只不过是局限于过期的key)。
- noeviction:默认策略,当内存不足以容纳新写入数据时,新写入操作会报错。
整体来说Redis提供的策略和我们上述介绍的通用策略是基本一致的。只不过Redis这里会针对 "过期key" 和 "全部key" 做分别处理。
4. 缓存预热,缓存穿透,缓存雪崩和缓存击穿
(1)缓存预热
什么是缓存预热?
使用Redis作为MySQL的缓存的时候,当Redis刚刚启动,或者Redis大批key失效之后,此时由于Redis自身相当于是空着的,没啥缓存数据,那么MySQL就可能直接被访问到,从而造成较大的压力。
因此就需要提前把热点数据准备好,直接写入到Redis中。使Redis可以尽快为MySQL撑起保护伞。
(2)缓存穿透
当访问的key在Redis和数据库中都不存在,此时这样的key不会被放到缓存上,后续如果仍然在访问该key,依然会访问到数据库。
这就会导致数据库承担的请求太多,压力很大。
这种情况称为缓存穿透。
如何解决?
- 针对查询的参数进行格式或合理性校验。
- 针对数据库中也不存在的key,也设置到Redis中,将value就随便设成一个 "" 。避免后续频繁访问数据库。
- 使用布隆过滤器判断key是否存在,在真正查询。
(3)缓存雪崩
短时间内大量的key在缓存上失效,导致数据库压力骤增,甚至直接岩机。
可能性主要有两种:
- Redis挂了
- Redis上大量的key同时过期了
如何解决?
- 部署高可用的Redis集群,并且完善监控报警体系。
- 不给key设置过期时间 或者 设置过期时间的时候添加随机时间因子。
(4)缓存击穿
相当于缓存雪朋的特殊情况,针对热点key,突然过期了,导致大量的请求直接访问到数据库上,甚至引起数据库宕机。
如何解决?
- 基于统计的方式发现热点key,并设置永不过期。
- 进行必要的服务降级。例如访问数据库的时候使用分布式锁,限制同时请求数据库的并发数。