Redis持久化机制:RDB快照

举报
芥末拌个饭吧 发表于 2022/11/11 17:25:25 2022/11/11
【摘要】 我们都知道,Redis有两大持久化机制:AOF日志和RDB快照。AOF方法每次执行只记录命令,持久化的数据量不大。但是在AOF日志恢复时,需要把日志的每条命令都执行一遍。如果日志很多,恢复过程就会变得很漫长。因此,Redis提供了另一种持久化机制,那就是RDB快照。

前言

我们都知道,Redis有两大持久化机制:AOF日志和RDB快照。AOF方法每次执行只记录命令,持久化的数据量不大。但是在AOF日志恢复时,需要把日志的每条命令都执行一遍。如果日志很多,恢复过程就会变得很漫长。因此,Redis提供了另一种持久化机制,那就是RDB快照。

RDB快照写入规则

和AOF记录命令不同,RDB记录的当前的数据。Redis有提供2个命令来生成RDB快照文件,分别是save和bgsave。

  • save: 这种方式在主线程执行,容易导致阻塞;
  • bgsave: 创建一个子进程来执行RDB写入工作。这种方式可避免主线程的阻塞(默认配置)

这里你可能有疑问,快照过程中,如果有数据做了修改,RDB是怎么做的呢?这里就要介绍下写时复制了。

写时复制技术

写时复制是操作系统提供的功能,Redis在执行RDB快照时,依然能正常处理写操作。这样说可能不够明朗,详细点说说bgsave这个过程:

bgsave子进程是由主线程fork生成的,而且可以共享主线程的所有内存数据。主线程和子进程bgsave是互不干扰的。

当主线程要修改一块数据,这块数据就会复制一份到副本上,然后主线程在这个副本上修改。同时呢,bgsave子进程可继续将原来的数据写入RDB文件。这样就能某时刻快照的完整性,也不影响redis同时对当时数据的操作。

写到这,你是否认为RDB快照这样设计就完美了呢?答案是否定的。我们仔细想想,如果每次快照都是将全量数据备份,数据量大了之后,会有什么后果:

  • 全量数据写入RDB文件,磁盘压力增大。可能存在前一个快照没执行完,后一个又开始了。
  • bgsave子进程虽不阻塞主线程,但它是由主线程fork出来的。fork的过程是会阻塞主线程的。

基于这两大问题,Redis提供了增量快照的方式。

RDB增量快照

增量快照,就是指第一次全量快照后,后续RDB快照都是只记录修改过的数据记录,这样就可以避免很多开销。实现的方法就是 第一次全量快照后,数据修改后,会记录下来。这样在下一次增量快照时就知道哪些数据被修改了。

和AOF相比,RDB快照恢复速度快。但是快照的频率设置需要注意了。如果设置的频率很高,宕机可能就会丢失较多数据;频率太低的话,开销也会很大。

AOF和RDB混用

我们在考虑持久化时,肯定希望它恢复速度快,同时开销尽量小,而且尽量丢失少一点的数据。因此,在Redis4.0之后,支持了AOF和RDB混用的方式。

这种方式就是RDB以设定的频率执行,比如每30秒执行一次。然后没有执行快照的时间内,就用AOF日志去记录这段时间内的操作命令。这样一来,就解决了上述对持久化的期望。

小结

对于RDB快照和AOF文件,我们可根据实际需要去选择。提供一下选择参考:

  • 数据可靠性要求高,少丢失: 选择RDB快照和 AOF 混用;
  • 允许分钟级别的数据丢失: 可以只使用 RDB;
  • 只用 AOF: 优先考虑 everysec 的配置(可靠性和性能之间的平衡)
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。