CDM迁移HDFS数据上云(OBS)详解

举报
天使在人间 发表于 2019/06/23 16:24:25 2019/06/23
【摘要】 CDM(Cloud Data Migration)提供同构/异构数据源之间批量数据迁移服务,帮助客户实现数据自由流动。支持客户自建和公有云上的文件系统,关系数据库,数据仓库,NoSQL,大数据云服务,对象存储等数据源。本文将以CDM迁移HDFS数据到华为云OBS为例,介绍CDM配置过程。

CDM迁移服务配置流程:购买云数据迁移服务->作业管理->创建连接管理(源端和目的端)->创建表/文件迁移。

步骤一:

进入CDM控制台:

0.png

 

步骤二:

点击步骤一中的【购买云数据迁移服务】:

1.png

2.png

3.png

当前区域:有专线的情况下,选择专线打通区域。

实例类型:有计算配置、带宽基准、并发数三个指标,可根据预计迁移的速度、迁移文件的数量、迁移文件的大小等因素综合考虑,如果无法确认,可以联系技术人员给出建议。

网络:虚拟私有云和子网特别在使用专线的情况下,需要选择专线打通的VPC网络和子网。

安全组:设置开放需要使用到的端口。

自动关机、定时开机、定时关机可根据需要开启,注意:自动关机功能和定时开关机功能不可同时开启。

消息通知:开启后可以接受到异常消息。

配置完成后点击【立即购买】,支付完毕后跳转到首页。

 

步骤三:

进入首页后,集群状态显示“创建中”,需要等待一定时间

 

4.png

创建完成59%:

5.png


步骤四:

步骤三中创建完成后,点击【作业管理】:

6.png

选择【连接管理】:

7.png

点击【新建连接】:

8.png

9.png

 

在这里选择连接到的服务,我们以迁移HadoopApache HDFS数据(源端)到对象存储中对象存储服务(OBS)(目的端)为例

 

步骤五(创建源端连接器):

步骤四中选择【Apache HDFS】,点击【下一步】:

10.png

输入名称(自拟):URINameNode URI地址。

认证类型和运行模式根据实际情况选择。

IP与主机映射关系:如果HDFS配置文件使用主机名,需要配置IP与主机的映射,格式:IP与主机 名之间使用空格分隔,多对映射使用分号或回车换行分隔,例如:

nameNode1 192.168.1.1

dataNode1 192.168.1.2

可以通过点击【测试】按钮,看配置是否OK。测试成功后保存。

 

步骤六(创建目的端连接器):

如步骤五中,选择【对象存储】,点击【对象存储服务(OBS)】:

 

11.png

输入名称,OBS终端节点,端口,AKSK,测试连通性,成功后保存。

 

步骤七:

选择步骤四中【表/文件迁移】,点击【新建作业】:

12.png

输入作业名称,选择已创建的连接器,源端-Apache HDFS,目的端-OBS。选择源端目录或文件(待迁移数据的路径)和目的端写入目录。文件格式选择二进制格式。高级属性中,根据需要选择。

配置完成后,点击【下一步】:

13.png

任务配置中,有作业失败重试(建议开启,避免网络抖动引起的迁移失败),作业分组,是否定时执行,还有高级属性,可根据需要配置。其中高级属性中,抽取并发数是同时拉取数据并发数任务,并发数越高,迁移速度越快。

配置完成后,点击【保存并运行】:

14.png

 

 

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。