flume常面对的两种场景

举报
have mi 发表于 2018/12/18 19:36:45 2018/12/18
【摘要】 场景一某平台服务器不定期产生新日志文件,flume实时传输新文件到分布式存储服务器HDFSflume配置文件:#定义三大组件的名称agent1.sources = s1agent1.sinks = k1agent1.channels = c1# 配置source组件,spooldir用于监控文件目录agent1.sources.s1.type = spooldiragent1.sources...

场景一

某平台服务器不定期产生新日志文件,flume实时传输新文件到分布式存储服务器HDFS
flume配置文件:


#定义三大组件的名称

agent1.sources = s1

agent1.sinks = k1

agent1.channels = c1


# 配置source组件,spooldir用于监控文件目录

agent1.sources.s1.type = spooldir

agent1.sources.s1.spoolDir =/home/hadoop/logs

agent1.sources.s1.fileHeader = false


#配置拦截器

agent1.sources.s1.interceptors = i1

agent1.sources.s1.interceptors.i1.type = host

agent1.sources.s1.interceptors.i1.hostHeader = hostname


# 配置sink组件

agent1.sinks.k1.type = hdfs

agent1.sinks.k1.hdfs.path =hdfs://master:9000/weblog/%y-%m-%d/%H-%M

agent1.sinks.k1.hdfs.filePrefix = access_log

agent1.sinks.k1.hdfs.maxOpenFiles = 5000

agent1.sinks.k1.hdfs.batchSize= 100

agent1.sinks.k1.hdfs.fileType = DataStream

agent1.sinks.sink1.hdfs.writeFormat =Text

agent1.sinks.sink1.hdfs.useLocalTimeStamp = true


#配置channels组件,缓存到内存

agent1.channels.c1.type = memory

agent1.channels.c1.keep-alive = 120

agent1.channels.c1.capacity = 4000

agent1.channels.c1.transactionCapacity = 600


#连接三大组件

agent1.sources.s1.channels = c1

agent1.sinks.k1.channel = c1


场景二

某平台通过log4j产生日志信息,flume监控日志文件,把文件中追加的日志实时传输到HDFS。
flume配置文件:


#定义三大组件的名称

agent1.sources = s1

agent1.sinks = k1

agent1.channels = c1


# 配置source组件,exec用于监控文件内容更新

agent1.sources.s1.type = exec

agent1.sources.s1.command = tail -F/home/hadoop/weblogs/access_log


#配置拦截器

agent1.sources.s1.interceptors = i1

agent1.sources.s1.interceptors.i1.type = host

agent1.sources.s1.interceptors.i1.hostHeader = hostname


# 配置sink组件

agent1.sinks.k1.type = hdfs

#a1.sinks.k1.channel = c1

agent1.sinks.k1.hdfs.path =hdfs://master:9000/weblog/%y-%m-%d/%H-%M

agent1.sinks.k1.hdfs.filePrefix = access_log

agent1.sinks.k1.hdfs.maxOpenFiles = 5000

agent1.sinks.k1.hdfs.batchSize= 100

agent1.sinks.k1.hdfs.fileType = DataStream

agent1.sinks.k1.hdfs.writeFormat =Text

agent1.sinks.k1.hdfs.useLocalTimeStamp = true


#配置channels组件,缓存到内存

agent1.channels.c1.type = memory

agent1.channels.c1.keep-alive = 120

agent1.channels.c1.capacity = 4000

agent1.channels.c1.transactionCapacity = 600


# 连接三大组件

agent1.sources.s1.channels = c1

agent1.sinks.k1.channel = c1


flume常用组件

1.PNG

2.PNG




【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。