DWS配合CDM做ETL,导出导入数据

举报
行人忆南山 发表于 2020/05/21 20:19:57 2020/05/21
【摘要】 通过CDM将DWS的数据归档到OBS上

前提:DWS已经创建就绪。

一.创建CDM集群

1.  登陆华为云控制台,进入“云数据迁移CDM”管理页面,点击进入控制台。

image.png

2. 点击右上角的“购买云数据迁移服务”,进行创建CDM集群的配置。

image.png

image.png

集群名称:CDM的集群名称

实例类型:CDM集群规格,选择cdm.small规格

虚拟私有云:需要和DWS集群的虚拟私有云保持一致

其余选项选择默认即可。

点击“点击立即购买”,开始创建CDM集群,等待几分钟,集群创建完成。如下图所示

image.png

 注:CDM的收费方式为运行作业时收费,此种规格运行作业时0.56元/小时,关机时费用0.05元/小时,所以当没有作业需要运行迁移时,可以选择关机,这样节省费用。当需要迁移数据时,在开机CDM集群。


二.创建OBS桶并上传数据

1.  登陆华为云“对象存储服务OBS”的管理控制台。

image.png

2. 点击“管理控制台”,点击右上角“创建桶”。然后进行配置。

image.png

区域:注意区域需要选择和DWS集群,CDM集群相同的区域,保证它们之间的数据是能够访问通的。点击“立即创建”。稍等几分钟后,桶会创建好。

桶创建好后,点击桶名,进入详情界面,如下图:

image.png

点击左侧“对象”,如下图:

image.png

可知,这里是存储数据文件的页面,DWS导出的数据之后也应该在这个页面可以查看到。

四.配置CDM作业

2.  回到CDM管理页面,点击CDM集群上的“作业管理”,开始配置连接管理和作业。

首先配置源端OBS连接。点击“新建连接”。选择“对象存储”中的“对象存储服务(OBS)

image.png

 点击“下一步”,

image.png

名称:给源端连接起个名字

连接器:OBS,不可选

OBS终端节点:地址,不可选

端口:默认443

访问标识/密钥:填写华为云账号的AK/SK

填写完成后,点击“测试”,如果测试成功,点击保存。

3.  配置目的端DWS连接。点击“新建连接”,选择数据仓库中的“数据仓库服务(DWS)”。

image.png

点击“下一步”,进行数据仓库的配置:

image.png

数据仓库的配置和创建DWS集群的配置相同,此处不再赘述。填写完成后,点击“测试”,如果测试成功,点击保存。

4. 配置CDM作业,开始迁移。在“作业管理”页面,点击“新建作业”。

image.png

源端作业配置,我们选择刚刚创建的DWS连接,然后选择我们想要导出的特定模式下表;目的端连接我们选择创建OBS连接,选择我们需要将DWS表导出到OBS的哪个目录,配置好后点击“下一步”,最后点击“保存并运行”。

5. 查看作业运行,并检查作业是否导出。回到“作业管理”页面,可以看到历史运行的作业情况。如下图:

image.png

作业如果成功,会显示“Succeeded”。如果失败,可以更多里面“日志”,来查看失败的原因。然后修改配置后,可以点击“运行”,再次运行作业,知道作业成功。

当作业运行成功后,我们到OBS页面查看是否有数据导出。

image.png

可以看到,在OBS桶的根目录下,有文件导出,可以下载的本地进行查看。

至此,通过CDM导出DWS数据到OBS上的操作就全部完成了。


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。