kafka connect基本概念、部署

举报
gaozhiliang 发表于 2020/08/24 19:54:31 2020/08/24
【摘要】 Kafka connect: 一、是一个可以在kafka和其它数据系统中进行数据传输的工具,一般用于增量数据迁移或者导出导入数据到目标地址。 二、基本概念: 1)Connector:有两种类型的connector,分别是sourceConnector和sinkConnector,其基类都是Connector:sourceConnector:数据导入kafka集群功能;sourceConnec...

Kafka connect

 

一、是一个可以在kafka和其它数据系统中进行数据传输的工具,一般用于增量数据迁移或者导出导入数据到目标地址。

 

二、基本概念:

 


1Connector

有两种类型的connector,分别是sourceConnector和sinkConnector,其基类都是Connector:

sourceConnector:数据导入kafka集群功能;

sinkConnector:把数据导出kafka集群。

 

2Task

   是具体迁移数据的实现,也有两种类型的Task:

sourceTask:主要是不断地读取源文件/数据库中的变更数据,写入kafka集群,期间需要维护kafka相关的生产者偏移量信息;

sinkTask:主要是不断地读取kafka中的数据,写入目标地址,期间也需要维护kafka相关的消费者偏移量信息;

 

3Worker

可以理解为运行任务的进程,协调各个Connector的工作。


三:部署:

   下面只讲单机部署的步骤,主要是配置好相关的配置文件,例如zookeeper、kafka、connect-source\connect-sink文件:

   1)、下载kafka安装包(https://kafka.apache.org/downloads),解压并放在服务器某个目录上: 

         


  

   2)、配置相关文件,在kafka/config目录(以oracle为例):

       


3)、启动zookeeper

  bin/zookeeper-server-start.sh -daemon config/zookeeper.properties

4)、配置并启动kafka

  bin/kafka-server-start.sh -daemon config/server.properties

 

5)、启动kafka connect

     bin/connect-standalone.sh config/connect-standalone.properties config/connect-file-source.properties


【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。