鲲鹏 BCManager 存储灾备系统详解

举报
ruochen 发表于 2021/07/15 13:50:22 2021/07/15
【摘要】 鲲鹏 BCManager 存储灾备系统详解

鲲鹏云服务搭建BCManager存储灾备系统

鲲鹏云服务:华为基于鲲鹏自研芯片和服务器开发的公有云资源
BCManager:华为自研容灾备份软件

一、灾备的概念与作用

1. 信息与数据

  • 数据是对物理世界所有事物的数字表示(eg:温度、湿度等等)
  • 信息是经过加工处理后的数据,用于支持决策(eg:气温降低我们要增加衣服,如果明天下雨我们要准备雨具)
  • 信息与数据对个人、企业、国家都相当重要
  • 数据具有一定的生命周期

    数据产生–>数据处理–>数据传输–>数据展示–>数据应用–>数据销毁

2. 存储是信息与数据的载体

  • 狭义的存储定义:主要指硬件(eg:CD、DVD、ZIP、磁带、磁盘等)
  • 广义的存储定义
    • 存储硬件系统(磁盘阵列,控制器,磁盘柜,磁带库等)
    • 存储软件(备份软件;管理软件,快照,复制等增值软件)
    • 存储网络(HBA卡,光纤交换机,FC/SAS线缆等)
    • 存储解决方案(集中存储,归档,备份,容灾等)

3. 存储灾备作用与概念

  • 存储要具备容灾备份能力
    • 灾难无法预知(自然灾害与人为因素)
    • 业务中断,数据丢失,经济与信誉损失巨大
    • 政策监督与企业运营需要
  • 容灾与备份
    • 容灾即灾难发生后恢复业务可用保证数据安全,表征了对灾难的容忍程度
    • 备份即对系统或数据创建副本,用于业务与数据恢复
    • 备份是容灾的一种手段,通常说的灾备是将容灾与备份结合

4. 灾备系统的关键指标

  • RPO:故障发生后,丢失的数据量或者容忍丢失的数据量
  • RTO:故障发生后,业务恢复可用所需要的时间
  • RPO与RTO越小,系统的可用性就越高,需要的投资也越大
    在这里插入图片描述

二、灾备的原理与应用

1. 容灾方案一 • 本地保护

1.1 容灾方案——本地保护

  • 本方案只涉及生产站点
  • 维护终端:供系统维护人员接入it系统
  • 容灾管理服务器:用于配置管理容灾应用
  • 生产应用主机:可以是公司的文件服务器
  • 生产存储:用于存放公司的共享材料,可以利用快照技术生成特定时刻的副本,一旦源数据不可读取/不可用,可以快速恢复数据到特定时刻
    在这里插入图片描述

1.2 容灾原理——快照技术

  • 快照技术类似于定格拍照,速度快,占用空间小
  • 通过COW(Copy On Write)技术实现,用于非物理故障恢复场景(比如软件Bug、数据丢失等)
    在这里插入图片描述

2. 容灾方案二 • 主备容灾

2.1 容灾方案——主备容灾

在这里插入图片描述

2.2 灾备原理——LUN克隆技术

LUN可以理解为存储的逻辑划分

  • 克隆是源数据在某个时间点的完整副本(不同于快照,快照需要依赖于源LUN才可进行数据恢复,非完整副本,只是临时性的部分副本)
  • 能够在不中断主机业务的情况下实现LUN级别数据的恢复
    在这里插入图片描述

3. 容灾方案三 • 双活数据中心

3.1 灾备方案——双活数据中心

同一时刻,两个生产站点都对外提供服务(不同于主备容灾,主备方案同一时刻只有一个站点对外提供服务)
可以进一步扩展为多活数据中心

在这里插入图片描述

3.2 灾备原理——数据双写与数据变更日志

  • 通过数据双写和数据变更日志机制实现存储层数据的双活,两个数据中心同时对主机提供数据读写的能力
    在这里插入图片描述
    在这里插入图片描述

4. 灾备方案四 • 两地三中心

4.1 容灾方案——两地三中心

在这里插入图片描述

4.2 灾备原理——存储复制

  • 利用存储同步/异步远程复制功能,将业务数据从生产中心复制到灾备中心,实现生产中心的数据复制和保护
    在这里插入图片描述

5. 灾备案例 • 某企业OA系统

在这里插入图片描述

三、华为灾备方案BCManager介绍

1. 华为容灾软件OceanStor BCManager

  • 底层存储系统所提供的增值特性:快照、克隆、复制等技术
  • 对各类常见应用系统和文件系统提供数据保护及容灾恢复

快照:基于原始数据的一部分进行恢复,恢复需要依赖于原始数据
克隆:原始数据的一个完整副本,恢复不需要原始副本
复制:两个站点之间同步数据

2. BCManager 相关概念

  • 生产站点和灾备站点
    • 生产站点:生产系统所在的站点,也是我们要保护的站点,该站点运行企业单位的各类业务系统,即提供服务的站点
    • 灾备站点:灾备系统的站点,可以为生产系统提供灾备能力,当灾难发生时,可以基于该站点恢复业务,根据不同的灾备方案(前面已经提及)提供服务
  • 主机和主机组
    • 主机:生产站点/灾备站点中的应用服务器(生产主机/灾备主机)
    • 主机组:一组主机的集合(一般是同类主机的组合,组内主机通常为同一个型号/操作系统版本/业务类型相似)
  • 保护组(保护对象和保护策略)
    • 将容灾管理系统进行容灾保护的业务对象和保护策略关联起来
    • 保护对象:
      在这里插入图片描述
    • 保护策略:容灾管理系统对保护对象进行容灾保护的保护方式/调度策略(eg:多久一次备份,备份哪些数据,备份的速率,备份的时间点)
  • 恢复计划
    • 容灾管理系统进行容灾恢复的业务对象,用户可以对恢复计划执行测试、清理、计划性迁移、重保护、故障恢复、切换等容灾业务操作

3. BCManager 软件架构

  • 基于B/S架构(Browser/Server)架构进行容灾管理
  • 支持安装在windows和Linux操作系统上
    在这里插入图片描述

四、华为云搭建BCManager环境

1. 实验拓扑介绍

  • ECS:作为业务主机承载应用
  • estor安装存储模拟器,提供存储资源
  • BCManager:部署灾备软件,用来实现业务主机上文件的容灾恢复
    在这里插入图片描述

2. 磁盘阵列 DiskArray 简介

  • 磁盘阵列就是包含一堆磁盘的存储设备在这里插入图片描述

3. IP-SAN简介

  • 硬盘域、存储池
    • 硬盘域:一堆磁盘,由同种类型/不同类型的硬盘组合而成,不同硬盘域间的业务相互隔离
    • 存储池:创建在硬盘域中的,由若干不同性能的硬盘按照一定的规则组成
  • LUN(组)
    • 逻辑单元号,从存储池中获取存储空间,LUN是应用服务器能够识别的最小存储逻辑单元
    • 一个LUN组可以包含一个或多个LUN
  • 主机(组)
  • 存储映射与使用
  • estor模拟器
    在这里插入图片描述

4. 华为云服务——网络

  • VPC:虚拟私有云(Virtual Private Cloud):提供隔离的网络环境
  • EIP:Elastic IP:可向外访问公网,对公网提供服务
  • 安全组及规则:放通/禁止对应的服务/端口
    在这里插入图片描述

5. 华为云服务——鲲鹏计算(基于ARM和RISC)

  • ECS:Elastic Cloud Server,弹性云服务器
    在这里插入图片描述

6. 华为云服务——对象存储OBS服务

  • 对象(Object)
  • 桶(bucket)
  • AK和SK
    在这里插入图片描述

五、BCManager灾备实验

1. 云环境准备

2. 部署存储环境

  • 发放业务主机
  • 制作estor镜像
    • 通过OBS上传
  • 部署estor存储
  • 配置SAN业务

3. 部署BCManager

  • 发放鲲鹏ECS
  • 部署BC软件
  • 登录BC管理端

4. 灾备测试

  • 添加站点及资源
  • 配置保护组
  • 数据误删恢复
  • 释放资源
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

举报
请填写举报理由
0/200