- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

kafka connect基本概念、部署

gaozhiliang 发表于 2020/08/24 19:54:31 2020/08/24

【摘要】 Kafka connect：一、是一个可以在kafka和其它数据系统中进行数据传输的工具，一般用于增量数据迁移或者导出导入数据到目标地址。二、基本概念： 1）Connector：有两种类型的connector，分别是sourceConnector和sinkConnector，其基类都是Connector：sourceConnector：数据导入kafka集群功能；sourceConnec...

Kafka connect：

一、是一个可以在kafka和其它数据系统中进行数据传输的工具，一般用于增量数据迁移或者导出导入数据到目标地址。

二、基本概念：

1）Connector：

有两种类型的connector，分别是sourceConnector和sinkConnector，其基类都是Connector：

sourceConnector：数据导入kafka集群功能；

sinkConnector：把数据导出kafka集群。

2）Task：

是具体迁移数据的实现，也有两种类型的Task：

sourceTask：主要是不断地读取源文件/数据库中的变更数据，写入kafka集群，期间需要维护kafka相关的生产者偏移量信息；

sinkTask：主要是不断地读取kafka中的数据，写入目标地址，期间也需要维护kafka相关的消费者偏移量信息；

3）Worker：

可以理解为运行任务的进程，协调各个Connector的工作。

三：部署:

下面只讲单机部署的步骤，主要是配置好相关的配置文件，例如zookeeper、kafka、connect-source\connect-sink文件：

1）、下载kafka安装包（https://kafka.apache.org/downloads），解压并放在服务器某个目录上：

2）、配置相关文件，在kafka/config目录（以oracle为例）：

3）、启动zookeeper：

bin/zookeeper-server-start.sh -daemon config/zookeeper.properties

4）、配置并启动kafka：

bin/kafka-server-start.sh -daemon config/server.properties

5）、启动kafka connect：

bin/connect-standalone.sh config/connect-standalone.properties config/connect-file-source.properties

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

kafka connect基本概念、部署

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品