缓存常见问题：缓存穿透、雪崩、击穿及解决方案分析

1. 什么是缓存穿透，怎么解决？

缓存穿透是指用户请求的数据在缓存中不存在即没有命中，同时在数据库中也不存在，导致用户每次请求该数据都要去数据库中查询一遍。如果有恶意攻击者不断请求系统中不存在的数据，会导致短时间大量请求落在数据库上，造成数据库压力过大，甚至导致数据库承受不住而宕机崩溃。

缓存穿透的关键在于在Redis中查不到key值，它和缓存击穿的根本区别在于传进来的key在Redis中是不存在的。假如有黑客传进大量的不存在的key，那么大量的请求打在数据库上是很致命的问题，所以在日常开发中要对参数做好校验，一些非法的参数，不可能存在的key就直接返回错误提示。

正常的查询流程

缓存穿透查询流程

解决方法：

方案一：缓存空数据

将无效的key存放进Redis中：

当出现Redis查不到数据，数据库也查不到数据的情况，也将其缓存起来，但设置一个较短的过期时间，这样即使后续的恶意请求再次访问相同的键，也能够从缓存中获取结果，减轻数据库压力。但这种处理方式是有问题的，假如传进来的这个不存在的Key值每次都是随机的，那存进Redis也没有意义。

优点：实现简单

缺点：消耗内存，可能会发生数据不一致的问题。

方案二：布隆过滤器

使用布隆过滤器：

在缓存之前再加一个布隆过滤器，将数据库中的所有key都存储在布隆过滤器中，在查询Redis前先去布隆过滤器查询 key 是否存在，如果不存在就直接返回，不让其访问数据库，从而避免了对底层存储系统的查询压力。

布隆过滤器的设计实现原理

如果数据比较少，可以把数据库中的数据全部放到内存的一个map中。这样能够非常快速的识别，数据在缓存中是否存在。如果存在，则让其访问缓存。如果不存在，则直接拒绝该请求。但如果数据量太大，全都放到内存中，会占用太多的内存空间。因此要使用布隆过滤器。

布隆过滤器的底层使用bit数组存储数据，该数组中的元素默认值为0。布隆过滤器第一次初始化的时候，会把数据库中所有已存在的key，经过一些列的hash算法（比如：三次hash算法）计算，每个key都会计算出多个位置，然后把这些位置上的元素值设置成1。之后，有用户key请求过来的时候，再用相同的hash算法计算位置。

如果多个位置中的元素值都是1，则说明该key在数据库中已存在。这时允许继续往后面操作。
如果有1个以上的位置上的元素值是0，则说明该key在数据库中不存在。这时可以拒绝该请求，而直接返回。

但若布隆过滤器中存储的数据量过大，会出现误判的情况，即：原本这个key在数据库中是不存在的，但布隆过滤器确认为存在。同时如果数据库中的数据更新了，需要同步更新布隆过滤器。但它跟数据库是两个数据源，就可能存在数据不一致的情况。因此需要及时同步更新修改的内容。

误判率：数组越小误判率就越大，数组越大误判率就越小，但是同时带来了更多的内存消耗。

优点：内存占用较少，没有多余key

缺点：实现复杂，存在误判

如何选择：针对一些恶意攻击，攻击带过来的大量key是随机，那么我们采用第一种方案就会缓存大量不存在key的数据。那么这种方案就不合适了，我们可以先对使用布隆过滤器方案进行过滤掉这些key。所以，针对这种key异常多、请求重复率比较低的数据，优先使用第二种方案直接过滤掉。而对于空数据的key有限的，重复率比较高的，则可优先采用第一种方式进行缓存。