同事一个礼拜都没搞定的缓存雪崩,我半个小时就给他整明白!顺手秀了一波解决方法

举报
万猫学社 发表于 2021/07/18 09:45:39 2021/07/18
【摘要】 当数据库成为瓶颈时,比如高并发、读多写少等场景,我们首先会想到的就是利用缓存来提高整个系统的性能。缓存虽然能够大大提升整个系统的性能,但同时也引入了更多复杂性。如果没有针对缓存进行比较好的处理,某些场景下甚至会导致整个系统崩溃。这次我们要聊的就是:缓存雪崩。 缓存雪崩缓存雪崩是指当缓存失效或过期后引起系统性能急剧下降的情况。当缓存失效或过期被清除后,系统需要再次访问数据库,再次进行运算重新生...

当数据库成为瓶颈时,比如高并发、读多写少等场景,我们首先会想到的就是利用缓存来提高整个系统的性能。

缓存虽然能够大大提升整个系统的性能,但同时也引入了更多复杂性。

如果没有针对缓存进行比较好的处理,某些场景下甚至会导致整个系统崩溃。

这次我们要聊的就是:缓存雪崩。

缓存雪崩

缓存雪崩是指当缓存失效或过期后引起系统性能急剧下降的情况。

当缓存失效或过期被清除后,系统需要再次访问数据库,再次进行运算重新生成缓存,这个处理步骤耗时比较长,上百毫秒甚至更长时间。而对于一个高并发的系统来说,几百毫秒内可能会接到几百个请求。

由于旧的缓存已经被清除,新的缓存还未生成,并且处理这些请求的线程都不知道另外有一个线程正在生成缓存,所以所有的请求都会去重新生成缓存,都会去访问数据库,对数据库造成巨大的压力和不必要的性能损耗。

这些对数据库的访问压力又会拖慢整个系统,严重的会造成数据库宕机,形成一系列连锁反应,造成整个系统崩溃。

解决办法

缓存雪崩的常用解决方法有两种:更新锁机制后台更新机制。接下来我们详细了解一下这两种方法:

更新锁机制

对缓存更新操作加入锁的保护,保证只有一个线程能够进行缓存更新的操作,没有获取更新锁的线程要么等待锁释放后重新读取缓存,要么直接返回空值或者默认值。

对于采用分布式集群的系统,一个系统中可能存在几十上百台服务器,即使单台服务器只有一个线程更新缓存,但几十上百台服务器一起算下来也会有几十上百个线程同时进行缓存更新的操作,同样存在缓存雪崩的问题。

所以分布式集群的系统要实现更新锁机制,需要用到分布式锁,比如:Redis、ZooKeeper等。

后台更新机制

在系统中,由后台线程来进行缓存更新的操作,而不是由业务线程来进行缓存更新的操作,缓存本身的有效期可以设置为永久或者足够长的时间,后台线程定时进行缓存更新的操作。

后台更新机制不仅适用于单机多线程的场景,也适用于分布式集群的场景,相比更新锁机制要简单一些。

后台更新机制还适用于业务刚上线的时候进行缓存预热。

缓存预热指系统上线后,将相关的缓存数据直接加载到缓存系统,而不是等待用户访问才来触发缓存加载。

还用一种比较特殊的场景:当缓存系统内存不够时,会清除一些缓存数据,从缓存被清除到下一次定时更新缓存的这段时间内,业务线程读取缓存返回空值,而业务线程本身又不会去更新缓存,因此从用户角度看到就是数据没有了。

对应上面这种特殊场景,我们可以使用后台更新机制和更新锁机制结合使用进行避免。

总结

缓存雪崩是指当缓存失效或过期后引起系统性能急剧下降的情况。

常用的解决方法有两种:更新锁机制后台更新机制


文章持续更新,微信搜索「万猫学社」第一时间阅读。
关注后回复「电子书」,免费获取12本Java必读技术书籍。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

举报
请填写举报理由
0/200