Debezium适配GaussDB开源开发任务

举报
yd_229853316 发表于 2024/10/28 17:34:24 2024/10/28
【摘要】 Debezium 是RedHat开源的一款将多种数据源实时变更数据捕获,形成数据流输出的数据同步工具。它是一个分布式平台,可将现有的数据库日志转换为事件流,因此应用程序可以感知到数据库中的每个行级更改并对此做出立即响应。本任务的主要目的是让Debezium支持华为云 GuassDB数据库,拓展GuassDB数据库的影响力,让Debezium的用户使用华为云服务时能够顺利对接GuassDB数据库。

背景介绍

开源for Huawei(参考:https://developer.huaweicloud.com/programs/opensource/contributing/)  通过和公司、高校、社区的开发者合作,完成鲲鹏、昇腾、欧拉、鸿蒙、高斯、云服务等与开源软件的适配开发,帮助繁荣Huawei的基础生态,同时让开源软件能够更加简单、高效的运行于华为云上。

开始之前,开发者可以下载 开源for Huawei Wiki(参考:https://gitcode.com/HuaweiCloudDeveloper/OpenSourceForHuaweiWiki/overview) 了解详细的开发步骤,技术准备,以及开发过程需要的各种资源。

1 需求分析

1.1 项目影响力

Debezium 是RedHat开源的一款将多种数据源实时变更数据捕获,形成数据流输出的数据同步工具。它是一个分布式平台,可将现有的数据库日志转换为事件流,因此应用程序可以感知到数据库中的每个行级更改并对此做出立即响应。Debezium 构建在 Apache Kafka 之上,并提供与 Kafka Connect 兼容的 Connector 以便监控指定的数据库管理系统。从应用程序开始使用数据库的时候,Debezium 就会在 Kafka Log 中记录它们数据变更的历史记录。Debezium Connector是一组用于 Apache Kafka Connect 的 Source Connector每个 Connector 都通过使用该数据库的变更数据捕获 (CDC Change Data Capture) 功能从不同的数据库中获取变更与其他方法(例如轮询或双重写入)不同,Debezium 的实现基于日志的 CDC:

· 确保捕获所有的数据变更。

· 以极低的延迟生成变更事件,同时避免因为频繁轮询导致 CPU 使用率增加。例如,对于 MySQL 或 PostgreSQL,延迟在毫秒范围内。

· 不需要更改您的数据模型,例如 ‘Last Updated’ 列。

· 可以捕获删除操作。

· 可以捕获旧记录状态以及其他元数据,例如,事务 ID,具体取决于数据库的功能和配置。

项目数据:Fork 2.5KStar 10.4KContributors 525+

主要开发语言:

· Java 98.9% 

· ANTLR 3.7%

官网: https://debezium.io/

源代码仓库:https://github.com/debezium/debezium  

star历史(https://star-history.com/):

1.2 任务目的和范围

本任务的主要目的是让Debezium支持华为云 GuassDB数据库,拓展GuassDB数据库的影响力,Debezium的用户使用华为云服务时能够顺利对接GuassDB数据库。Debezium可以使应用程序轻松消费所有正确且完整的事件即使您的应用程序意外停止,它也不会丢失任何事件当应用程序重新启动时,会继续从上次它停止的位置重新消费。

  • 适配任务清单

              生态

 

生态细类

是否需要验证

验证逻辑说明

是否需要适配

适配场景说明

昇腾生态

指令

使用昇腾处理器运行应用。

使用昇腾指令实现适配逻辑。

CANN

应用功能依赖于CANN运行。

使用CANN实现适配逻辑。

MindSpore

应用功能依赖于MindSpore运行。

使用MindSpore实现适配逻辑。

鲲鹏生态

指令

使用鲲鹏处理器运行应用。

使用鲲鹏指令实现适配逻辑。

Euler

使用Euler系统运行应用(基于鲲鹏云CCE环境的部署)

在鲲鹏云ECS中部署Marquez服务及本任务中涉及的相关服务和DEMO

数据库生态

GaussDB

使用GaussDB功能。

Marquez 数据存储需要对接GuassDB数据库

GaussDB(DWS)

使用GaussDBDWS)功能。

使用GaussDB(DWS)的驱动和SQL实现适配逻辑。

存储生态

OBS

使用OBS功能。

基于OBS API访问实现适配逻辑。

鸿蒙生态

HarmonyOS

使用HarmonyOS系统运行应用。

使用HarmonyOS系统调用实现适配逻辑。

 

2 工作量评估和任务分解

2.1 工作量评估

任务

/天

基于华为云ECS完成

Debezium安装和部署

1

完成GuassDB数据库适配功能开发

5

完成DEMO设计和验证

2

输出开发资料和博客

2

代码推送上游社区和更新社区资料

1

总计

11人天

2.2 基于华为云ECS完成Debezium安装和部署调试 

要求在华为鲲鹏云ECS中部署调试Debezium部署调试成功后,根据DEMO设计,Debezium能够以CDC的方式使用connectorGuassDB建立连接,实时采集到GuassDB数据库当中不断变化的(增、删、改)数据流。

Debezium架构图

参考:

代码仓库https://github.com/debezium/debezium

2.3 完成GuassDB数据库适配功能开发

按照现有debezium的架构参考其它已适配完成的开源组件,完成2个功能点的分析和适配工作。

  • GaussDB 作为 debezium source 开发适配数据源的connector重点
  • GaussDB 作为sink 开发适配下沉库的connector(可以与市面上其它遵循JDBC协议的库通用)。

参考:

https://github.com/debezium/debezium/tree/main/debezium-connector-postgres

https://github.com/debezium/debezium/tree/main/debezium-connector-mysql

https://github.com/debezium/debezium/tree/main/debezium-connector-oracle

https://github.com/debezium/debezium/tree/main/debezium-connector-sqlserver

2.4 完成DEMO设计和验证

  • Debezium可以通过类似如 debezium-connector-guassdb的私有connectorGuassDB数据库建立连接,实时采集(读)GuassDB数据库当中不断变化的数据流
  • Kafka流出的数据可以通过 JDBC connector实时写入到GuassDB数据库当中

2.5 在华为云开发者论坛输出博客

访问华为云开发者论坛(参考:https://bbs.huaweicloud.com/blogs)发表博客,介绍完成这些任务的过程和心得。

内容包括不限于如下内容:

  • 开源for Huawei的背景
  • 开源软件的功能介绍
  • 开发适配过程及碰到和解决的问题
  • DEMO设计、开发、部署过程
  • 代码推送开源社区及互动过程

博客打上如下标签:

  • 开源(必选)
  • 开发者(必选)
  • GaussDB数据库(可选)
  • 云数据库 GaussDB(可选)
  • 鲲鹏(可选)
  • 昇腾(可选)
  • 鸿蒙(可选)
  • 对象存储 OBS(可选)

2.6 代码推送上游社区

将代码合并到Debezium官网主干代码更新Debezium官网资料,包括版本说明、开发指南等。

3 验收材料

验收细则

评分说明

是否为验收必选项

结果(通过/不通过)

开发者举证

功能开发:完成与华为三大根技术生态(鲲鹏云、昇腾云、鸿蒙)适配的功能开发

完成GaussDB数据库适配功能开发。举证提供PR链接。

代码质量:适配华为三大根技术生态的代码质量经过工具检测达标

推送给开源社区的代码符合开源社区关于代码风格、功能、自动化测试等要求。

提供相关文档,比如部署文档、使用文档、配置文档等

根据社区要求,完善相关的开发指南和部署指导

合入到开源项目主仓:代码推送上游社区

代码合并到当前主干分支。举证提供代码仓库链接。

Deomo设计&开发:完成功能演示Demo的开发

举证提供DEMO仓库地址和DEMO开发提交记录。

Demo部署&验证:完成功能演示DEMO基于华为云鲲鹏环境的部署和功能验证

提供DEMO部署验证结果的关键截图进行举证。提供DEMO运行环境和资源的规格清单。

发布博客:发布博客介绍适配心得。

提供博客的地址。

制作单机版无高危开源镜像。

上架云商店。

单机版镜像上架时支持模板部署。

制作集群版无高危开源镜像

上架云商店。

集群版镜像上架时支持模板部署

4 参考资料

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。