离线大数据迁移到MRS(三) 通过CDM迁移HDFS数据到华为云MRS服务

举报
kevin_chen 发表于 2020/04/23 10:45:26 2020/04/23
【摘要】 借助华为云云数据迁移服务CDM,可以完成线下IDC机房或者自建Hadoop集群上的HDFS数据迁移到华为云MRS服务。本文重点介绍如何通过使用CDM将HDFS数据搬迁到MRS。

离线大数据迁移到MRS(三)

通过CDM迁移HDFS数据到华为云MRS服务


借助华为云云数据迁移服务CDM,可以完成线下IDC机房或者自建Hadoop集群上的HDFS数据迁移到华为云MRS服务。本文重点介绍如何通过使用CDM将HDFS数据搬迁到MRS。

      

     CDM华为云云数据迁移服务用户资料: https://support.huaweicloud.com/productdesc-cdm/cdm_01_0143.html


      

迁移操作步骤

 

一、配置CDM进行HDFS数据搬迁

     (1)  创建CDM集群,创建CDM集群时候选择和MRS新集群在同一个安全组、同一个VPC、同一个子网网络,保证CDM集群和MRS集群之间网络是互通的。

(2) 集群创建成功后,进入CDM集群管理, 在“连接管理”上,新建到迁移源端和迁移目的端集群的两个HDFS连接。并测试连通性。


          

(3)       在“表/文件迁移” 中新建作业,源端选择老集群的HDFS连接并选择要迁移的文件夹,目的端选择MRSHDFS连接并指定目的路径。通过目录过滤器选择test*,迁移匹配/user/test*的文件夹。

(4)       单击保存,回到作业管理界面

(5)       CDM作业管理界面运行作业,即可开始HDFS文件数据搬迁。

    

         (6)  在MRS新集群客户端上通过hdfs命令查看迁移过来的文件夹和文件,可以看到/user/路径下以test  test2 test3 test4 4个文件夹和他下面的文件均已经迁移到当前集群上。


7)在迁移数据时候并不会中断老集群的业务。完成一次数据迁移后,就可以在新集群上做些业务层面的验证;后续配置CDM定时任务定期每天(时间可以根据具体业务需求设置)迁移一次增量数据,直到所有业务割接到新集群。每天定期任务执行时候会跳过重复文件的搬迁,只迁移老集群上新增的文件


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。