鲲鹏 BCManager 存储灾备系统详解
【摘要】 鲲鹏 BCManager 存储灾备系统详解
鲲鹏云服务搭建BCManager存储灾备系统
鲲鹏云服务:华为基于鲲鹏自研芯片和服务器开发的公有云资源
BCManager:华为自研容灾备份软件
一、灾备的概念与作用
1. 信息与数据
- 数据是对物理世界所有事物的数字表示(eg:温度、湿度等等)
- 信息是经过加工处理后的数据,用于支持决策(eg:气温降低我们要增加衣服,如果明天下雨我们要准备雨具)
- 信息与数据对个人、企业、国家都相当重要
- 数据具有一定的生命周期
数据产生–>数据处理–>数据传输–>数据展示–>数据应用–>数据销毁
2. 存储是信息与数据的载体
- 狭义的存储定义:主要指硬件(eg:CD、DVD、ZIP、磁带、磁盘等)
- 广义的存储定义
- 存储硬件系统(磁盘阵列,控制器,磁盘柜,磁带库等)
- 存储软件(备份软件;管理软件,快照,复制等增值软件)
- 存储网络(HBA卡,光纤交换机,FC/SAS线缆等)
- 存储解决方案(集中存储,归档,备份,容灾等)
3. 存储灾备作用与概念
- 存储要具备容灾备份能力
- 灾难无法预知(自然灾害与人为因素)
- 业务中断,数据丢失,经济与信誉损失巨大
- 政策监督与企业运营需要
- 容灾与备份
- 容灾即灾难发生后恢复业务可用保证数据安全,表征了对灾难的容忍程度
- 备份即对系统或数据创建副本,用于业务与数据恢复
- 备份是容灾的一种手段,通常说的灾备是将容灾与备份结合
4. 灾备系统的关键指标
- RPO:故障发生后,丢失的数据量或者容忍丢失的数据量
- RTO:故障发生后,业务恢复可用所需要的时间
- RPO与RTO越小,系统的可用性就越高,需要的投资也越大
二、灾备的原理与应用
1. 容灾方案一 • 本地保护
1.1 容灾方案——本地保护
- 本方案只涉及生产站点
- 维护终端:供系统维护人员接入it系统
- 容灾管理服务器:用于配置管理容灾应用
- 生产应用主机:可以是公司的文件服务器
- 生产存储:用于存放公司的共享材料,可以利用快照技术生成特定时刻的副本,一旦源数据不可读取/不可用,可以快速恢复数据到特定时刻
1.2 容灾原理——快照技术
- 快照技术类似于定格拍照,速度快,占用空间小
- 通过COW(Copy On Write)技术实现,用于非物理故障恢复场景(比如软件Bug、数据丢失等)
2. 容灾方案二 • 主备容灾
2.1 容灾方案——主备容灾
2.2 灾备原理——LUN克隆技术
LUN可以理解为存储的逻辑划分
- 克隆是源数据在某个时间点的完整副本(不同于快照,快照需要依赖于源LUN才可进行数据恢复,非完整副本,只是临时性的部分副本)
- 能够在不中断主机业务的情况下实现LUN级别数据的恢复
3. 容灾方案三 • 双活数据中心
3.1 灾备方案——双活数据中心
同一时刻,两个生产站点都对外提供服务(不同于主备容灾,主备方案同一时刻只有一个站点对外提供服务)
可以进一步扩展为多活数据中心
3.2 灾备原理——数据双写与数据变更日志
- 通过数据双写和数据变更日志机制实现存储层数据的双活,两个数据中心同时对主机提供数据读写的能力
4. 灾备方案四 • 两地三中心
4.1 容灾方案——两地三中心
4.2 灾备原理——存储复制
- 利用存储同步/异步远程复制功能,将业务数据从生产中心复制到灾备中心,实现生产中心的数据复制和保护
5. 灾备案例 • 某企业OA系统
三、华为灾备方案BCManager介绍
1. 华为容灾软件OceanStor BCManager
- 底层存储系统所提供的增值特性:快照、克隆、复制等技术
- 对各类常见应用系统和文件系统提供数据保护及容灾恢复
快照:基于原始数据的一部分进行恢复,恢复需要依赖于原始数据
克隆:原始数据的一个完整副本,恢复不需要原始副本
复制:两个站点之间同步数据
2. BCManager 相关概念
- 生产站点和灾备站点
- 生产站点:生产系统所在的站点,也是我们要保护的站点,该站点运行企业单位的各类业务系统,即提供服务的站点
- 灾备站点:灾备系统的站点,可以为生产系统提供灾备能力,当灾难发生时,可以基于该站点恢复业务,根据不同的灾备方案(前面已经提及)提供服务
- 主机和主机组
- 主机:生产站点/灾备站点中的应用服务器(生产主机/灾备主机)
- 主机组:一组主机的集合(一般是同类主机的组合,组内主机通常为同一个型号/操作系统版本/业务类型相似)
- 保护组(保护对象和保护策略)
- 将容灾管理系统进行容灾保护的业务对象和保护策略关联起来
- 保护对象:
- 保护策略:容灾管理系统对保护对象进行容灾保护的保护方式/调度策略(eg:多久一次备份,备份哪些数据,备份的速率,备份的时间点)
- 恢复计划
- 容灾管理系统进行容灾恢复的业务对象,用户可以对恢复计划执行测试、清理、计划性迁移、重保护、故障恢复、切换等容灾业务操作
3. BCManager 软件架构
- 基于B/S架构(Browser/Server)架构进行容灾管理
- 支持安装在windows和Linux操作系统上
四、华为云搭建BCManager环境
1. 实验拓扑介绍
- ECS:作为业务主机承载应用
- estor安装存储模拟器,提供存储资源
- BCManager:部署灾备软件,用来实现业务主机上文件的容灾恢复
2. 磁盘阵列 DiskArray 简介
- 磁盘阵列就是包含一堆磁盘的存储设备
3. IP-SAN简介
- 硬盘域、存储池
- 硬盘域:一堆磁盘,由同种类型/不同类型的硬盘组合而成,不同硬盘域间的业务相互隔离
- 存储池:创建在硬盘域中的,由若干不同性能的硬盘按照一定的规则组成
- LUN(组)
- 逻辑单元号,从存储池中获取存储空间,LUN是应用服务器能够识别的最小存储逻辑单元
- 一个LUN组可以包含一个或多个LUN
- 主机(组)
- 存储映射与使用
- estor模拟器
4. 华为云服务——网络
- VPC:虚拟私有云(Virtual Private Cloud):提供隔离的网络环境
- EIP:Elastic IP:可向外访问公网,对公网提供服务
- 安全组及规则:放通/禁止对应的服务/端口
5. 华为云服务——鲲鹏计算(基于ARM和RISC)
- ECS:Elastic Cloud Server,弹性云服务器
6. 华为云服务——对象存储OBS服务
- 对象(Object)
- 桶(bucket)
- AK和SK
五、BCManager灾备实验
1. 云环境准备
-
准备软件
- 华为云控制台
- 用到的资源
-
创建VPC
-
创建子网
-
配置安全组
2. 部署存储环境
- 发放业务主机
- 制作estor镜像
- 通过OBS上传
- 部署estor存储
- 配置SAN业务
3. 部署BCManager
- 发放鲲鹏ECS
- 部署BC软件
- 登录BC管理端
4. 灾备测试
- 添加站点及资源
- 配置保护组
- 数据误删恢复
- 释放资源
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)