- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

GaussDB(DWS)实践系列-ClickHouse数据迁移

四叶草发表于 2021/08/09 15:03:31 2021/08/09

【摘要】在项目交付中经常会遇到各种异构数据库间的迁移替换，该场景重度依赖迁移工具完成同步。目前华为云上没有现成的数据迁移工具能够支持Clickhouse到GaussDB(DWS)的迁移，本文提供一种思路，通过Spark代码完成ClickHouse中表数据读取，并写入到GaussDB(DWS)中完成迁移。

在项目交付中经常会遇到各种异构数据库间的迁移替换，该场景重度依赖迁移工具完成同步。目前华为云上没有现成的数据迁移工具能够支持Clickhouse到GaussDB(DWS)的迁移，本文提供一种思路，通过Spark代码完成ClickHouse中表数据读取，并写入到GaussDB(DWS)中完成迁移。

样例参考代码如下：

#! /bin/bash/env python3

from pyspark.sql import SparkSession
from datetime import datetime, timedelta
import sys

def ch2dws():

startTime = datetime.now()
print("===== {}任务开始时间{}:".format("order2dws", startTime.strftime("%Y-%m-%d %H:%M:%S.%f")))

spark = SparkSession.builder.master("yarn").appName("ch2dws").getOrCreate()

sql = """
select
kid
, ym
, ymareaid
, amount
, order_total
from xxxxx.xxxxxx oia
where orderday='2021-06-03'
limit 3000
"""
print(sql)
df = spark.read.format("jdbc").options(
url="jdbc:clickhouse://xxxxx:8123/xxxxxxxx",
driver="ru.yandex.clickhouse.ClickHouseDriver",
dbtable="(%s) tp" % sql,
user="xxxxxxxxx", password="xxxxxxxx").load()
# append
df.write.mode(saveMode="overwrite") \
.format("jdbc") \
.option("driver", "org.postgresql.Driver") \
.option("url", "jdbc:postgresql://xxxxxxxxx:8000/xxxxxxxxxx") \
.option("useSSL", "false") \
.option("user", "xxxxxxxxxx") \
.option("password", "xxxxxxxxx") \
.option("batchsize", 10000) \
.option("dbtable", "xxxxxxxxxx") \
.option("isolationLevel", "NONE") \
.option("truncate", False) \
.save()

spark.stop()

endTime = datetime.now()
print("任务结束时间:{},总耗时{}".format(endTime, timedelta(seconds=(endTime - startTime).total_seconds())))

if __name__ == '__main__':
# date_input = [it for it in sys.argv[1:]]
ch2dws()

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

GaussDB(DWS)实践系列-ClickHouse数据迁移

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

GaussDB(DWS)实践系列-ClickHouse数据迁移

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品