GaussDB(DWS) 云端运维系列第十一期:容灾
【摘要】 容灾,即在另一个可用区(跨AZ)部署一个同构的GaussDB(DWS)灾备集群,如果生产集群所处的地理位置发生自然灾害,或者集群内部出现了故障从而导致生产集群无法正常对外提供读写服务,那么灾备集群可以切换为生产集群,从而保障业务连续性。
GaussDB(DWS)容灾
1. 前言
- 适用版本:【细粒度容灾能力受限于DWS8.2.1版本】
容灾,即在另一个可用区(跨AZ)或另一个区域(跨region)部署一个同构的GaussDB(DWS)灾备集群,如果生产集群所处的地理位置发生自然灾害,或者集群内部出现了故障从而导致生产集群无法正常对外提供读写服务,那么灾备集群可以切换为生产集群,从而保障业务连续性。
2. 容灾概述
容灾,即在另一个可用区(跨AZ)或另一个Region(跨Region,两Region之间的VPC网络需要打通)部署一个同构的GaussDB(DWS)灾备集群,如果生产集群所处的地理位置发生自然灾害,或者集群内部出现了故障从而导致生产集群无法正常对外提供读写服务,那么灾备集群可以切换为生产集群,从而保障业务连续性。架构图如下所示:
2.1 容灾特点
- 多形态容灾
-
- 支持跨AZ容灾。
-
- 支持跨Region容灾。
-
- 多种数据同步方式:基于直连互信作为同步层,借以实现更多场景下的容灾。
- TCO低
-
- 部署异构(逻辑同构)。
-
- 容灾级别: 集群级、细粒度表级(受限内核版本)。
- 可视化
-
- 自动化,一键式容灾演练、恢复。
2.2 约束与限制
- 灾备集群在恢复期间,无法提供读写服务。
- 灾备集群在容灾任务停止或者异常但灾备集群正常的情况下,可以提供读服务,灾备切换成功后可以提供读写服务。
- 容灾创建后,主备集群禁用快照/恢复功能。
- 不支持逻辑集群。
- 容灾管理为同一租户下的双集群容灾。
- 生产集群和灾备集群在同一个VPC内,且版本号一致。跨Region容灾要求主备集群的VPC之间网络打通。
3. 容灾管理
3.1 创建容灾
- 登录GaussDB(DWS) 管理控制台。
- 在左侧导航栏中,单击“容灾管理”。
- 在“容灾管理”页面,单击“创建容灾”。
- 选择“容灾类型”。
- “容灾类型”选择“Region内容灾”。可选择不同可用区下的备集群。
开启容灾细粒度开关后,生产集群可选择需要容灾的表对象。 - “容灾类型”选择“跨Region容灾”。可选择不同区域下的备集群。
- 选择主备集群信息。
- 主集群列表,会自动过滤支持容灾的集群列表信息。
- 备集群列表,会自动过滤与主集群逻辑同构且支持容灾的集群列表信息。
- 设置高级配置。选择“自定义”时,您可以设置以下高级配置参数,若选择“默认配置”,以下参数将使用它们的默认值。
“容灾同步周期”:容灾同步周期决定了生产集群间隔多长时间向灾备集群同步增量数据,请结合实际业务数据量设置合理值。容灾同步周期默认值为30分钟。
3.2 启动容灾
- 登录GaussDB(DWS) 管理控制台。
- 在左侧导航栏中,单击“容灾管理”。
- 在容灾列表中,在指定容灾所在行的“操作”列,单击“启动”按钮。在弹出框单击“确定”。
- 此时容灾的“容灾状态”显示为“启动中”,启动需要时间请耐心等待。启动成功后“容灾状态”显示为“运行中”。
- “容灾状态”为“未启动”、“启动失败”和“已停止”时可以执行启动容灾操作。
- 启动容灾后,生产集群和灾备集群将无法进行备份、恢复、扩容、升级、重启、节点替换等操作,请谨慎操作。
3.3 停止容灾
- 登录GaussDB(DWS) 管理控制台。
- 在左侧导航栏中,单击“容灾管理”。
- 在容灾列表中,在指定容灾所在行的“操作”列,单击“停止”按钮。在弹出框单击“确定”。
- 此时容灾的“容灾状态”显示为“停止中”,停止需要时间请耐心等待。停止成功后“容灾状态”显示为“已停止”。
- “容灾状态”为“运行中”和“停止失败”时可以执行停止容灾操作。
- 停止后,将无法进行数据同步,请谨慎操作。
3.4 灾备切换
- 登录GaussDB(DWS) 管理控制台。
- 在左侧导航栏中,单击“容灾管理”。
- 在容灾列表中,在指定容灾所在行的“操作”列,单击“灾备切换”按钮。在弹出框单击“确定”。
- 此时容灾的“容灾状态”显示为“灾备切换中”,灾备切换需要时间请耐心等待。
- 切换成功后“容灾状态”更新为切换前的状态,如:切换前容灾状态为“运行中”,切换后还是“运行中”。
- “容灾状态”为“运行中”和“异常”时可以执行灾备切换操作。
- 灾备切换需要一定时间,在此期间,原生产集群将可不用。
3.5 异常切换
主集群异常不可用后,可进行异常切换操作。
- 登录GaussDB(DWS) 管理控制台。
- 在左侧导航栏中,单击“容灾管理”。
- 在容灾列表中,在指定容灾所在行的“操作”列,单击“异常切换”按钮。在弹出框单击“确定”。
- 此时容灾的“容灾状态”显示为“异常切换中”,异常切换需要时间请耐心等待。
- 切换成功后“容灾状态”更新为切换前的状态,如:切换前容灾状态为“运行中”,切换后还是“运行中”。
- “容灾状态”为“异常”时可以执行异常切换操作。
3.6 容灾恢复
在异常切换后,修复原主集群,恢复主备集群容灾关系。
- 登录GaussDB(DWS) 管理控制台。
- 在左侧导航栏中,单击“容灾管理”。
- 在容灾列表中,在指定容灾所在行的“操作”列,单击“容灾”按钮。在弹出框单击“确定”。
- 此时容灾的“容灾状态”显示为“容灾恢复中”,容灾恢复需要时间请耐心等待。
- “容灾状态”为“异常”且原主集群已修复可用时可以执行容灾恢复操作。
3.7 更新容灾配置
- 登录GaussDB(DWS) 管理控制台。
- 在左侧导航栏中,单击“容灾管理”。
- 在容灾列表中找到所需要的容灾,然后单击容灾名称,进入容灾“基本信息”页面。
- 在“容灾配置”模块,单击“修改”按钮可更新容灾的配置信息。细粒度容灾可配置需要容灾的表对象信息。
- “容灾状态”为“已停止”和“未启动”时可以执行容灾配置操作。
- 新的配置在容灾重新启动后生效。
3.8 查看容灾信息
- 登录GaussDB(DWS) 管理控制台。
- 在左侧导航栏中,单击“容灾管理”。
- 在容灾列表中找到所需要的容灾,然后单击容灾名称,进入容灾“基本信息”页面。在容灾“基本信息”页面,可以查看如下相关信息:
- 集群信息:用户可查看容灾ID、容灾名称、容灾创建时间、容灾启动时间以及容灾状态。
- 生产集群信息:用户可查看生产集群ID、集群名称、可用区、已用存储容量、集群容灾状态、最近容灾成功时间等相关信息。
- 灾备集群信息:用户可查看灾备集群ID、集群名称、可用区、已用存储容量、集群容灾状态、最近容灾成功时间等相关信息。
- 容灾配置:用户可查看并修改容灾同步周期。
3.9 删除容灾
- 登录GaussDB(DWS) 管理控制台。
- 在左侧导航栏中,单击“容灾管理”。
- 在容灾列表中,在指定容灾所在行的“操作”列,单击“删除”按钮。在弹出框单击“确定”。
- 此时容灾的“容灾状态”显示为“删除中”,删除需要时间请耐心等待。
- “容灾状态”为“创建失败”、“未启动”、“启动失败”、“已停止”、“停止失败”和“异常”时可以执行删除容灾操作。
- 删除后,将无法进行数据同步,且不可恢复,请谨慎操作。
4. 总结
跨Region容灾和细粒度容灾正在逐渐完善中,敬请期待。
想了解GuassDB(DWS)更多信息,欢迎微信搜索“GaussDB DWS”关注微信公众号,和您分享最新最全的PB级数仓黑科技,后台还可获取众多学习资料哦~
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)