云备份 CBR Caché 备份恢复用户指南
1 概览
1.1 简介
本文档是CBR Caché 定时备份恢复用户指南文档,主要描述了如何正确地使用CBR对Caché数据库进行数据备份与数据恢复的方法,包括部署前后的注意事项和典型部署方案。
1.2 任务介绍
【任务名称命名规则】:中文、大小写字母、数字、“-”、“_”、“.”、“@”组成,长度为3~255个字符,全局不可重复;
【备注信息规范】:文本类型无限制,长度0~50个字符;当用户输入的字数达到最大值时,将不再显示超过的文字。
1.3 功能介绍
1.3.1 Caché 数据备份
完全备份
将选定的数据源完全备份到指定目的地的备份集中。每次执行时,它不会根据最新的变动进行备份,而是直接将所有的数据备份到备份存储中,并产生一个时间点,用于记录备份的内容。
增量备份
自动跟踪并采集上一次成功的备份到现在期间变化的数据,调用数据库原生接口生成该期间数据变化的cbk文件,基于文件级将备份期间数据变化生成的cbk文件备份到备份存储中,同时产生相应的时间点。在尚未进行完全备份的情况下,进行增量备份时,会自动转为完全备份。
1.3.2 Caché 数据恢复
普通恢复
在Caché数据库被损坏或者数据丢失时,使用之前的备份集来实现Caché数据库数据的还原。
1.3.3 Caché 数据清理
数据清理
可以清理所管辖的全部备份数据或者单个副本。
1.4 Caché限制性列表
1.4.1 备份
l 不支持备份已卸载的数据库。
l 不支持只读数据库的增量备份。
l 备份任务所属的实例更改名称后,不支持原任务继续做备份。
l 备份任务所属的实例更改端口号后,不建议原任务继续做备份。
l 不支持多用户备份恢复。
l 数据库(命名空间)创建之后,存在多个子数据库的情况,不支持对其中一个数据库进行备份恢复。需要选择所有数据库进行备份恢复,否则可能造成数据丢失。
l 实例重启之后,需要转完全备份。
l 不支持同一个实例新建多个任务进行备份。
l 不支持普通用户进行备份。
l 只支持enuw语言设置下的备份恢复。
l 不建议cachelib、cachesys、cachetemp、cacheaudit、cachelocaldata数据库的备份恢复。
l 不支持数据库本身的加密库备份。
1.4.2 恢复
l 不支持备份数据恢复到只读目录下。
l 不支持恢复时创建数据库名称超过32个字符,即恢复成不存在的新数据库名称长度不能超过32个字符。
l 不支持恢复到cachelib、cachesys、cachetemp、cacheaudit、cachelocaldata数据库。
l 恢复目标数据库已存在的情况下,不支持重新定向到新路径恢复。
l 不支持恢复重命名数据库名字包含特殊字符。
l 不支持恢复成系统数据库名称。
1.5 Caché定时备份恢复支持功能
表1-1 Caché定时数据保护支持功能
功能 |
子功能 |
支持 |
备注 |
备份 |
完全备份 |
√ |
- |
增量备份 |
√ |
- |
|
备份粒度 |
√ |
单个数据库 |
|
数据保留策略 |
按时间保留 |
√ |
- |
按副本数保留 |
√ |
- |
|
按备份策略的备份周期设置副本保留策略 |
√ |
- |
|
传输与存储加密 |
|
√ |
- |
数据压缩 |
|
√ |
- |
流量控制 |
|
√ |
- |
重复数据删除 |
|
√ |
- |
重删高级配置 |
|
√ |
- |
备份自动重试 |
|
√ |
- |
强制数据保留 |
|
√ |
- |
备份数据一致性校验 |
|
√ |
- |
恢复 |
原机默认位置恢复 |
√ |
- |
原机异位置恢复 |
√ |
- |
|
异机默认位置/异位置恢复 |
√ |
- |
|
覆盖现有数据库 |
√ |
- |
|
自定义脚本 |
√ |
- |
|
联机 |
√ |
- |
|
日志 |
- |
√ |
- |
告警 |
- |
√ |
- |
远程复制 |
- |
√ |
- |
反向复制 |
- |
√ |
- |
2 环境前置检查
2.1 客户端安装及配置
首先需要安装客户端,请参照《云备份 CBR 客户端软件安装卸载用户指南》。
2.2 备份前置准备
备份前需做如下环境检查:
步骤 1 检查实例状态是否运行。
在进行Caché数据库备份时,要求实例必须处在开启状态。
检查方法为登录Linux系统后台,执行以下命令查看实例状态。
ccontrol list ---查看实例状态
ccontrol start TEST ---启动实例
ccontrol stop TEST ---关闭实例
ccontrol session TEST ---连接系统自带数据库TEST
如果数据库实例服务处于停止状态,请协调用户系统管理员,将数据库实例服务开启至正在运行后再进行备份,对于正常提供生产业务的数据库来说,数据库实例服务肯定是运行状态,否则无法提供业务。若数据库版本为IRISHealth-2022,将ccontrol命令替换成iris命令。
步骤 2 检查数据库是否装载为读写状态。
WEB端登录数据库实例,选择系统-->数据库,查看需要备份的数据库是否均为已加载/RW状态。如果不是,单击数据库右侧的装载按钮,装载数据库为读写。
步骤 3 检查数据库是否可正常连接,用对应的用户名,密码登录数据库,保证数据库可以连接成功。
3 Caché 客户端管理
3.1 Caché 数据库实例授权
步骤 1 使用操作员或租户登录管理控制台,单击左侧导航栏选择【资源】→ 【客户端】,进入客户端管理页面,选择需要备份的主机,单击【权限配置】,选择Caché数据库图标,选择用户。
步骤 2 选择用户后,单击展开数据源单击【添加实例】或者列表已经展示的实例右侧的【未授权按钮】,输入用户名与密码(用户名必须是Users who installed system,且拥有全部特权,后面简称超级用户),给实例授权。若是添加实例,还需要输入实例名。
步骤 3 授权前,检查数据库用户权限:
----结束
3.2 新建Caché 虚拟客户端
步骤 1 使用操作员或租户登录管理控制台,单击左侧导航栏选择【资源】→ 【客户端】,进入客户端管理页面,单击【新建虚拟客户端】,选择【Caché集群虚拟客户端】。
步骤 2 在新建虚拟客户端页面,填写虚拟客户端名称,勾选集群下的物理客户端,单击【创建】。
步骤 3 删除虚拟集群客户端。选择创建好的虚拟集群客户端,单击【删除】,在文本框输入“YES”,单击【确定】。
步骤 4 给虚拟集群客户端下的所有物理客户端授权,参考3.1 Caché数据库实例授权。
----结束
3.3 授权 FAQs
l Q1:数据源授权时,展开实例时,界面报错:sh:control:未找到命令。
【问题原因】:
- 生产机不存在ccontrol工具。
- 生产机未安装Caché数据库。
【解决方案】:
检查生产环境是否都已安装 Caché数据库,且可正常执行ccontrol相关命令。
l Q2:数据源授权时,输入用户名密码后单击授权,报错授权实例失败,原因是:授权实例失败,请检查用户名或密码是否正确。
【问题原因】:
- 实例未成功运行,或在授权时被关闭。
- 用户名或者密码填写不正确,导致授权失败。
- 实例软件许可颁发中授权码过期,导致无法正常连接。
【解决方案】:
- 按照用户指南,检查实例状态是否为运行中。
- 检查填写的用户名与密码是否正确。使用{ccontrol session 实例名}连接实例,填写授权的用户名,密码,查看是否能够连接成功。连接成功后输入h退出登录,重新授权。
- 检查实例软件许授权码是否过期,过期请添加新的授权码。
4 Caché 数据备份
4.1 备份任务创建
步骤 1 使用操作员或租户登录管理控制台,单击标签栏【定时数据保护】→【数据备份】→【任务】→【数据级备份任务】选项卡,在操作界面,单击【新建】→【数据级备份任务】,选择相应的Caché虚拟客户端,其应用类型自动显示在右侧,选择【Caché数据库】。
步骤 2 单击【下一步】,展开数据源层级,勾选需要保护的数据源,数据源可勾选单个实例或者单个或多个数据库(若数据库属于同一个命名空间,请全部勾选)。
步骤 3 备份介质与备份选项,备份介质默认选中OFS,备份选项按需要配置,各选项功能再下方有说明,按需要配置之后,单击【下一步】。
【传输和存储加密】默认不开启,开启该选项后默认启用启AES256加密算法,可选择启用SM4加密算法,该功能可以和【重复数据删除选项】同时开启;
【数据压缩】默认不开启;开启后默认启用快速压缩,可选择启用强力压缩;
【重复数据删除】默认为不开启,开启该选项可以启用源端重复数据删除的功能,具体配置可参考《云备份 CBR 定时数据保护重复数据删除用户指南》;
【重删高级配置】默认不开启;开启重复数据删除选项后方可开启该选项,可参阅《云备份 CBR 定时数据保护重复数据删除用户指南》;
【流量控制】默认不开启,开启之后支持分时段限速,限速范围0~1024MiB/s。可添加多条限速计划,计划时段不允许冲突。
【备份自动重试】默认不开启。开启之后任务失败之后,按照设定的时间间隔与次数重新触发任务执行。
【强制数据保留】默认不开启;开启后,则保留时常内的数据无法被清理,同时该策略在编辑时,保留时长只能增加不能减少,也无法关闭该选项。
【备份数据一致性校验】默认不开启;该功能不可以和【重复数据删除选项】同时开启;开启此选项,任务可以创建数据校验任务。
步骤 4 单击【下一步】,填写备份任务名称和备注,单击【完成】,任务创建成功。
步骤 5 单击【完成】,弹出信息确认框,确认录入信息。
l 勾选【任务生成后立即执行】,单击【确定】,任务立即发起。
l 不勾选【任务生成后立即执行】,单击【确定】,任务新建成功后不会自动发起。
步骤 6 新建成功的备份任务信息展示。
----结束
4.2 备份策略管理
步骤 1 使用操作员或租户登录管理控制台,单击【定时数据保护】→【策略】→【新建】→【策略名称】,根据需要选择【备份周期】→【确定】。
【策略名称】:中文、大小写字母、数字、"-"、"_"、"."、"@"组成,长度为3-30个字符,不可重复。
【备份周期】:可选单位:天、周、月。默认:每1天,范围:1~365天;选中“周”时,出现周几的多选控件,默认:选中周日,范围:周一至周日,可多选;选中“月”时,出现选择每月几号的下拉多选控件, 默认:选中每月1日,范围:1-31可多选,未选几号时需提示必填。若当月无选定日期则在最后一天触发,例如九月份无31号,但是日期选中了31号,则默认在9月30号即九月最后一天触发任务。
【重复发起】:默认关闭。若开启,则出现“持续时间”和“频率”设置;意义为:在一定的【持续时间】内,依【频率】发起多次备份。【持续时间】范围:1~59分钟,1~24小时,默认值24小时【频率】范围:1~59分钟,1~24小时,默认值1小时【频率】不可超过【持续时间】。
在策略页面,选中策略可以查看策略的内容和该策略关联的任务。
步骤 2 在备份任务页面,勾选创建成功的任务,单击【策略】,在弹出的对话框中选择【添加】,选择【备份方式】和【发起时间】,单击【确定】弹出【设置策略成功】即设置成功。
【备份方式】:分为完全备份、增量备份。
【发起时间】:必选项,发起计划的具体时间格式:YYYY-MM-DD HH:MM,精确到分钟,默认显示:当前时间,设置时间不可早于当前时间。
步骤 3 可以对策略任务进行编辑、禁用与启用,删除,
l 添加每月策略任务的时候,尽量避免选择31号、30号、29号进行定时备份,考虑到有的月份特殊,可选择28号及其之前的任何一个日期进行备份,这样可以保证每月都有任务执行;
l 在设置【开始时间】时,建议您尽量在服务器空闲时进行备份操作;另外,在设置【最大保存完全副本数】时,可在综合考虑您的存储空间和数据需求等因素后进行合理的设置(保留副本数策略:保留n个副本数,至少需要n+1个副本的空间)。
l 在设置策略时,请务必不要使用一个完全后续全是增量备份的方式;一个月必须要进行至少一次的完全备份,以保护数据安全。
----结束
4.3 数据保留策略管理
步骤 1 使用操作员或租户登录管理控制台,单击【定时数据保护】→【策略】→【备份数据保留策略】,单击【新建】按钮,新建数据保留策略。
数据保留策略名称由中文、大小写字母、数字、“-”、“_”、“.”、“@”组成,长度为3~30个字符。
开启数据保留策略,一共有三种保留策略,分别为:数据保留期限、保留副本个数和按备份策略的备份周期设置副本保留策略。
【数据保留期限】开启选项后,默认选中数据保留期限一年。可选择的保留期限为天、周、年、月,数字最大数为999。可开启【严格保留】选项。
【保留副本个数】可以设置保留完全副本的个数,最小为1个副本,最大可设置1024个副本。
【按备份策略的备份周期设置副本保留策略】可选择按天、周、月、年备份策略保留副本个数,按备份策略保留的副本数每一种的最大数为99999个。
【完整副本保留】:开启后不会触发备份数据自动清理。
步骤 2 给备份任务添加数据保留策略。
步骤 3 在数据备份页面中,选中任务,单击【策略】->【添加数据保留策略模板】。
移除数据保留策略。在数据备份页面中,选中任务,单击【策略】→【移除数据保留策略】,单击确定,成功移除模板。
----结束
4.4 备份任务编辑
步骤 1 使用操作员或租户登录管理控制台,单击标签栏【定时数据保护】→【数据备份】→【任务】选项卡,选中需要编辑的备份任务,单击【编辑】。
步骤 2 进入主机选择界面,需要保护的主机不能编辑修改,单击【下一步】。
步骤 3 进入数据源选择界面,数据源支持编辑,可编辑新增或者减少数据库,选择完成后单击“下一步”。
步骤 4 进入备份介质与备份选项页面,备份介质不支持修改,备份选项中【传输与存储加密】和【重复数据删除】和【重删高级配置】和【备份数据一致性校验】不支持修改,其余选项可修改。按照需要修改备份选项后,单击【下一步】。
----结束
4.5 备份任务执行
步骤 1 使用操作员或租户登录管理控制台,单击标签栏【定时数据保护】→【数据备份】→【任务】选项卡,选择已创建的备份任务,选择【启动】,弹出启动确认弹窗,选择备份方式后,单击【启动】,发起任务。
步骤 2 启动任务后,在【监控】页面选中任务,单击【详情】,可在执行中查看执行概要及执行输出信息。
步骤 3 任务执行结束,可在历史记录中查看执行结果。单击【详情】,可查看执行概要及执行输出信息。
----结束
4.6 备份任务删除
步骤 1 使用操作员或租户登录管理控制台,单击标签栏【定时数据保护】→【数据备份】→【任务】选项卡,选择已创建的备份任务,选择【删除】,弹出删除确认弹窗,输入“YES”,单击删除,删除任务。
l 若备份数据源中存在数据库为卸载状态,备份任务不会备份此部分数据库。
l 若备份数据源中存在数据库为只读装载状态,备份任务只能做完全备份。
l 利用普通用户授权的实例,备份任务会执行失败,请使用超级用户进行实例授权。
l 手动更改过实例名称,备份任务会失败。
l 实例处于紧急模式开启,备份任务会失败。
l 备份节点存放cbk文件的目录空间(默认为/tmp目录)不足,备份任务会失败。
l 如果进行过手动备份,不支持继续发起增量备份,可能会造成数据丢失。
l 一个实例下的数据库不能存在多个备份任务中,会造成生成cbk文件失败。
l 删除任务并不会删除数据,若需要清理数据,请至数据清理清理数据。
l Caché备份实例如果存在大量增倍事务,发起增量备份任务时,在开始备份cbk文件时任务数据不会有变化,属正常现象。
l 若新增了命名空间或者数据库,建议发起一次完备,以确保数据完整性。
----结束
4.7 备份 FAQs
l Q1:备份任务执行有警告,警告:数据库XXX在客户端处于卸载或者不可用状态,本任务不备份这些数据库。
【问题原因】:
- 备份任务存在部分数据库处于卸载状态。
- 备份任务存在部分数据库不存在或不可用。
【解决方案】:
- 重新装载卸载的数据库。
- 编辑任务取消掉不存在的数据库,或者单击删除数据源删除不存在的数据库。
l Q2:备份任务失败,报错:数据源解析为空。
【问题原因】:
- 实例关闭未运行;
- 任务中备份数据源的所有数据库状态为卸载或者不可用;
- 用户名密码错误,导致数据库连接失败。
【解决方案】:
- 检查实例是否运行;
- 检查备份列表中的数据库状态是否正常。
- 检查授权用户是否可以正常连接数据库与授权。
l Q3:备份失败,报错:备份过失败,报错:增倍cbk文件生成失败。可能原因为:1、cbk文件生成路径空间不足,请增加该路径的空间大小 2、实例开启的模式为维护模式,请正常开启实例 3、实例授权的用户名密码已更改或者权限不足。
【问题原因】:
- cbk文件生成路径空间不足
- 实例开启的模式为维护模式
- 实例授权的用户名密码已更改或者权限不足。
【解决方案】:
- 增大临时存放cbk文件的目录空间大小或者修改配置文件,添加一个空间足够大的新目录;
- 修改实例为正常运行状态;
- 检查用户名密码是否正确,以及用户权限是否符合要求。
l Q4:备份失败,报错增倍cbk文件生成失败。原因为:由于实例提示本次备份需强制为完全备份。
【问题原因】:
- 数据库待备份列表改变过。
- 实例重启过。
- 数据库卸载过。
- 人为进行了手工备份。
【解决方案】:重新发起完全备份。
l Q5:备份失败,报错:该数据库下面的数据文件不存在或者cbk文件不存在。
【问题原因】:
- 备份任务的数据文件DAT文件丢失。
- cbk文件没有生成,存放cbk文件的路径空间不足。
【解决方案】:
- 检查数据库是否正常可用;
- 加大存放cbk文件的目录空间或者按照配置文件修改存放位置。
l Q6:备份失败,报错:数据库xxx为只读,此次备份转化为完全备份。
【问题原因】: 数据库为只读。
【解决方案】: 卸载数据库,装载数据库不勾选只读,装载为读写状态。
l Q7:备份警告,数据库xxx在该客户端不存在,本次任务不备份这些数据库。
【问题原因】: 此节点不存在这些数据库,可能是数据库已被删除。
【解决方案】:编辑任务减少这部分数据库,或者数据源删除这部分数据库,再次发起备份。
l Q8:备份失败,报错:获取数据库xxx路径失败。
【问题原因】:备份过程中数据库被删除。
【解决方案】:检查此部分数据库是否为正常状态。
l Q9:备份失败,报错:连接存储服务失败。
【问题原因】:备份节点未创建元数据卷。
【解决方案】:登录admin账户,进入节点管理,创建元数据卷。
5 Caché 数据恢复
5.1 恢复注意事项
l 恢复数据库个数不能超过160个,否则可能会导致恢复失败。
l 恢复路径为只读权限,恢复失败。
l 恢复的目的地若已有实例再运行,需要先关闭实例,否则恢复失败。参考3.2.2的步骤。
l 异机恢复时,必须保证异机已安装相同版本的 Caché 数据库。
l 恢复时,若恢复数据库在目标实例已存在,指定其他位置恢复,恢复失败。
l 恢复之后的数据库,可能处于卸载状态,需要手动装载。
l 恢复目的地空间不足,恢复失败。
l 不要同时向同一个路径发起恢复任务,这样可能会造成数据丢失。
l 恢复过程中停止任务,会导致数据库损坏或者数据丢失。
5.2 恢复步骤
步骤 1 检查要恢复的位置实例是否关闭,若正在运行,请先关闭实例。
步骤 2 使用操作员或租户登录管理控制台,单击【定时数据保护】→【数据恢复】→【恢复备份数据】,单击【新建】,进入新建恢复任务页面第一页。
步骤 3 选择要恢复的备份任务。
步骤 4 单击【下一步】,选择备份时间点,展开数据源列表,勾选需要恢复的数据源。
步骤 5 选择客户端和数据库用户以及恢复路径,设置恢复选项。恢复选项说明如下。
【覆盖现有数据库】默认不开启,开启之后恢复任务会覆盖目的地现有数据。原机原位置恢复需要开启此选项。
【联机】默认开启。开启之后任务执行后会自动启动实例,否则实例不启动。
【自定义脚本】默认不开启。开启之后可设置恢复前,恢复成功,恢复失败后执行选定的脚本。
步骤 6 单击【下一步】,填写任务名称和备注。
步骤 7 单击【完成】,弹出信息确认框。
步骤 8 单击【确定】,任务开始执行,可查看任务执行记录。
步骤 9 选中任务,单击【详情】,可查看任务执行详情与执行输出。
----结束
5.3 恢复 FAQs
l Q1:恢复失败,报错:实例正在运行。
【问题原因】:恢复的目标实例处于运行状态。
【解决方案】:关闭要恢复的目标实例。
l Q2:恢复失败,报错:没有可恢复的实例。
【问题原因】:恢复填写的目标实例在客户端不存在。
【解决方案】:恢复到正确的实例下。
l Q3:恢复失败,报错:如果不指定覆盖现有数据库,需要指定新的数据库名称。
【问题原因】:恢复任务以原名称做恢复,但是未开启覆盖选项。
【解决方案】:
- 恢复任务恢复至不存在的新数据库名称。
- 恢复任务恢复为原名称,开启覆盖选项。
l Q4:恢复失败,报错没有可恢复的目标数据库。
【问题原因】:恢复目标数据库创建失败。
【解决方案】:
- 检查路径权限,是否支持创建数据库;
- 检查路径名称是否合法,路径名称以英文字母、数字、下划线组成;
- 检查数据库名称是否合法,数据库名称以英文字母、数字、下划线组成,不超过32个字符;
- 检查恢复指定路径空间是否充足。
l Q5:恢复任务失败,恢复目标数据库已存在,不能重定向。
【问题原因】:恢复目标数据库名称在目标已存在,且任务设置为重定向恢复。
【解决方案】:恢复成不存在的新数据库名称或者恢复设置为默认位置且开启覆盖。
l Q6:恢复任务失败,报错No space left on device .
【问题原因】:恢复临时存放cbk路径空间满。
【解决方案】:增加恢复临时存放的cbk路径或者按照配置文件修改为空间足够的新目录。
6 Caché 数据清理
6.1 数据清理
步骤 1 使用操作员或租户登录管理控制台,单击标签栏【定时数据保护】→【数据清理】→【清理备份数据】,在数据清理界面单击【新建】按钮,新建数据清理任务。
步骤 2 选择需要进行数据清理的任务,单击【下一步】。
步骤 3 请选择要清理的副本,默认清理全部副本。可以选择清理指定副本。
步骤 4 单击【下一步】,弹出任务确认界面,单击完成。
步骤 5 弹出数据清理信息确认界面,输入YES。此处区分大小写,必须填大写半角英文字。
步骤 6 数据清理完成之后,可用管理员用户登录查看OFS卷空间是否相应的发生变化。
l 数据清理需要一定的执行时间,请延迟一段时间查看准确数据;
l 在清理全部时间点的选项下,最新时间点可以被清理。选择清理部分时间点时,最新时间点置灰,不能清理;
l 正在执行备份或恢复的任务无法清理数据,此类任务在新建清理任务时,数据状态显示占用。
----结束
7 CachéEnv.Config 配置文件说明
客户端安装目录下../etc/ClientService/AggregateApp的CachéEnv.Config文件,为Caché可配置项,现加以说明,可按照需要进行配置。
- 配置参数
BackupPath:备份任务临时存放cbk文件的位置,默认临时存放位置为安装目录下etc/../AggregateApp/cache_backup。请确保此位置的空间是增量合成数据的1.5倍左右,否则备份任务可能会失败。
RecoveryPath:恢复任务临时存放cbk文件的位置,默认临时存放位置为安装目录下etc/../AggregateApp//cache_restore。请确保此位置的空间是增量合成数据的1.5倍左右,否则恢复任务可能会失败。
l 修改此文件时,需要取消前面的注释符。请将恢复路径后面注释符号后面的内容换行。
l 若配置了cbk临时存放路径,在备份恢复异常失败的情况下,临时存放的cbk文件可能未清理干净,请手动删除cbk文件,以免占用过多的路径空间。
- 点赞
- 收藏
- 关注作者
评论(0)