MENU
// //

Centos搭建Flume

July 6, 2024 • 技术分享

Flume搭建

flume下载地址https://www.apache.org/dyn/closer.lua/flume/1.11.0/apache-flume-1.11.0-bin.tar.gz

安装部署

  • 将压缩包apache-flume-1.11.0-bin.tar.gz上传到linux系统的/usr/local/flume目录下
  • 将软件压缩包解压缩到/opt/module目录中,并修改名称

解压缩文件

tar -zxvf apache-flume-1.11.0-bin.tar.gz -C /usr/local/flume/

修改名称

mv apache-flume-1.11.0-bin/* ./

生产环境中,可以设置flume的堆内存为4G或以上。

  • 修改/usr/local/flume/conf/flume-env.sh文件,配置如下参数(虚拟机环境暂不配置)
  • 修改JVM配置

export JAVA_OPTS="-Xms4096m -Xmx4096m -Dcom.sun.management.jmxremote

增加集成配置

flume采集数据到Kafka的配置

  • 在linux系统解压缩后的flume软件目录中,创建job目录
  • 进入flume软件目录

cd /usr/local/flume/

  • 创建job目录

mkdir job

创建配置文件:file_to_kafka.conf

  • 进入job目录

cd /usr/local/flume/job

  • 创建文件

vim file_to_kafka.conf

  • 增加文件内容
# 定义组件
a1.sources = r1
a1.channels = c1

# 配置source
a1.sources.r1.type = TAILDIR
a1.sources.r1.filegroups = f1
# 日志(数据)文件
a1.sources.r1.filegroups.f1 = /usr/local/flume/data/test.log
a1.sources.r1.positionFile = /usr/local/flume/taildir_position.json

# 配置channel
# 采用Kafka Channel,省去了Sink,提高了效率
a1.channels.c1.type = org.apache.flume.channel.kafka.KafkaChannel
a1.channels.c1.kafka.bootstrap.servers = 101.126.112.112:9092
a1.channels.c1.kafka.topic = myTestTopic
a1.channels.c1.parseAsFlumeEvent = false

# 组装
a1.sources.r1.channels = c1
Last Modified: July 12, 2024