GeminiDB Cassandra新特性PITR发布:支持任意时间点恢复
技术背景:
当发生数据损毁、数据丢失、数据误删除等一系列故障场景时,数据库往往需要恢复到故障发生前的某一个时刻,恢复颗粒度越小越好。而传统数据库采取周期性备份的方式,当进行数据恢复时,也只能恢复到备份的时间点,由于备份点有限,无法进行更细粒度的时间点恢复,这将严重影响用户体验。
华为云数据库GeminiDB Cassandra是一款基于计算存储分离架构,兼容Cassandra生态的云原生NoSQL数据库。在综合备份成本、恢复时效和粒度,并充分验证的情况下,推出新特性PITR任意时间点恢复,可以自由选择需要恢复的时间点,保障用户数据一致性可靠性与安全性!
实现原理:
整体备份周期:
一个完整的备份周期 = 1次全量数据备份 + 定期运行的增量日志备份 + 穿插运行的差异备份(根据业务读写模型进行调整频率)
全量备份:
PITR的实现依赖一次全量的数据备份,为后续增量日志备份提供数据基础。GeminiDB Cassandra在进行备份时,会对数据进行秒级快照并充分利用集群中各节点来进行数据切分、上传,因此做到了业务无感知,不影响实例运行的效果。
增量日志备份:
PITR的实现离不开增量日志备份,增量日志备份是一种基于日志文件WAL(Write-ahead log)的备份方法,相比较传统的增量数据备份具有备份任务量轻,上传速率快,节省空间等特点。GeminiDB Cassandra会定期备份已归档WAL,上传完毕后及时清理回收。
差异备份:
PITR实例恢复时会进行日志回放,当全量备份周期设置较长,业务写入量较大时,会导致回放时日志过多,引起回放时间的增加,而差异备份可以缓解避免这个问题。差异备份本质上是一种数据备份,其基于上一次全量备份或差异备份进行数据差异对比上传,有效减少日志回放量,提升恢复速率。
恢复流程:
a. 下载全量备份数据到新实例
b. 下载增量WAL文件至新实例
c. 以恢复模式打开数据库进行WAL日志回放
d. 恢复到新实例流程结束
总结:
华为云数据库GeminiDB Cassandra新特性PITR实现了任意时间点恢复,填补了传统NoSQL引擎只能做指定时间点恢复的短板,将恢复精度精确到任意时间点,极大地提升了用户体验,为数据的安全性和可靠性提供更好的保障。
附录
本文作者:华为云Cassandra团队
杭州西安深圳简历投递:mamingdi@huawei.com
更多技术文章,请关注GeminiDB Cassandra官方博客:
https://bbs.huaweicloud.com/community/usersnew/id_1563519101830986
华为云Cassandra官方首页:https://www.huaweicloud.com/product/geminidb.html
- 点赞
- 收藏
- 关注作者
评论(0)