击穿、穿透、雪崩经常听人说吧? 那他到底是啥呢?无非就是在有缓存层的情况下,对各种绕过缓存层从而直接落到了DB上的情况进行的分类。
概念性的东西大概如下,我是记不住,后期具体使用与规避这些问题才是大事,后面有机会更新吧。
- 击穿(Cache Penetration)
定义: 击穿是指请求的数据在缓存中永远找不到,导致请求直接落到数据库上。这种情况通常是由于某些恶意请求或者程序错误导致的,请求的 key 本身是无效的,或者根本不存在。
原因:
恶意请求:攻击者故意请求不存在的 key。
程序错误:代码逻辑错误,生成了无效的 key。
解决方案:
布隆过滤器:使用布隆过滤器预先判断 key 是否存在,如果布隆过滤器返回不存在,则直接返回空结果,不再查询数据库。
缓存空值:对于查询不到的数据,也缓存一个空值(例如 null),并设置一个较短的过期时间,防止频繁查询数据库。
验证参数:在接口层增加校验,不合法的参数直接返回。
黑名单:设定一个合理的阈值,当某个IP的请求次数超过阈值时,将其加入黑名单,限制其访问频率或直接拒绝其请求。 - 穿透(Cache Miss)
定义: 穿透是指缓存中某个 key 失效或被删除,导致请求绕过缓存层直接访问数据库。这种情况通常是正常的缓存过期或缓存被主动删除导致的。
原因:
缓存过期:缓存中的数据超过了设定的过期时间。
主动删除:缓存中的数据被主动删除,例如在更新数据库后删除缓存。
解决方案:
缓存预热:在系统启动时或定期预热缓存,提前加载常用数据。
异步加载:当缓存未命中时,可以异步加载数据并更新缓存,避免所有请求同时访问数据库。 - 雪崩(Cache Avalanche)
定义: 雪崩是指大量缓存 key 同时失效,导致大量请求同时绕过缓存层直接访问数据库,造成数据库压力剧增,甚至崩溃。这种情况通常是由于缓存过期时间设置不合理或突发的高并发请求导致的。
原因:
缓存过期时间集中:多个缓存 key 设置了相同的过期时间,导致同时失效。
突发高并发:短时间内大量请求同时访问数据库。
解决方案:
随机过期时间:为缓存 key 设置随机的过期时间,避免大量 key 同时失效。
限流降级:在高并发情况下,使用限流和降级策略,限制请求频率,保护数据库。
缓存预热:在系统启动时或定期预热缓存,提前加载常用数据。
多级缓存:使用多级缓存策略,例如本地缓存 + 分布式缓存,减少对数据库的直接访问。
个人理解