热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

开发笔记:数据采集flumekafka

本文由编程笔记#小编为大家整理,主要介绍了数据采集flumekafka相关的知识,希望对你有一定的参考价值。需求:采集8类日志数据,并且进入es展示:方案制定:目前数据采
本文由编程笔记#小编为大家整理,主要介绍了数据采集flume kafka相关的知识,希望对你有一定的参考价值。

需求:采集8类日志数据,并且进入es展示:

方案制定:目前数据采集通用flume+kafka模式,所以采用原有模式,一类服务进入一个topic,然后通过logstash进行数据清洗,最后进入es进行展示。

flume采用tadir 读取数据源,memory 进行缓存,kafka进行sink

 

a1.sources = s1 s2 s3 s4 s5 s6 s7 s8
a1.channels
= c1 c2 c3 c4 c5 c6 c7 c8
a1.sinks
= k1 k2 k3 k4 k5 k6 k7 k8
a1.sources.s1.type
= TAILDIR
a1.sources.s1.filegroups
= f1 f2
a1.sources.s1.filegroups.f1
= /home/es/.*.log
a1.sources.s1.channels
= c1
a1.sources.s2.type
= TAILDIR
a1.sources.s2.filegroups
= f1 f2
a1.sources.s2.filegroups.f1
= /home/adm/.*.log
a1.sources.s2.channels
= c2
a1.sources.s3.type
= TAILDIR
a1.sources.s3.filegroups
= f1 f2
a1.sources.s3.filegroups.f1
= /home/bas/.*.log
a1.sources.s3.channels
= c3
a1.sources.s4.type
= TAILDIR
a1.sources.s4.filegroups
= f1 f2
a1.sources.s4.filegroups.f1
= /home/cha/.*.log
a1.sources.s4.channels
= c2
a1.sources.s5.type
= TAILDIR
a1.sources.s5.filegroups
= f1 f2
a1.sources.s5.filegroups.f1
= /home/anog/.*.log
a1.sources.s5.channels
= c5
a1.sources.s6.type
= TAILDIR
a1.sources.s6.filegroups
= f1 f2
a1.sources.s6.filegroups.f1
= /home/dip/es_okeano/3.27.20.38/config_log/.*.log
a1.sources.s6.channels
= c6
a1.sources.s7.type
= TAILDIR
a1.sources.s7.filegroups
= f1 f2
a1.sources.s7.filegroups.f1
= /home/oau/.*.log
a1.sources.s7.channels
= c7
a1.sources.s8.type
= TAILDIR
a1.sources.s8.filegroups
= f1 f2
a1.sources.s8.filegroups.f1
= /home/z/.*.log
a1.sources.s8.channels
= c8
a1.channels.c1.type
= memory
a1.channels.c1.capacity
= 10000
a1.channels.c1.transactionCapacity
= 1000
a1.channels.c2.type
= memory
a1.channels.c2.capacity
= 10000
a1.channels.c2.transactionCapacity
= 1000
a1.channels.c3.type
= memory
a1.channels.c3.capacity
= 10000
a1.channels.c3.transactionCapacity
= 1000
a1.channels.c4.type
= memory
a1.channels.c4.capacity
= 10000
a1.channels.c4.transactionCapacity
= 1000
a1.channels.c5.type
= memory
a1.channels.c5.capacity
= 10000
a1.channels.c5.transactionCapacity
= 1000
a1.channels.c6.type
= memory
a1.channels.c6.capacity
= 10000
a1.channels.c6.transactionCapacity
= 1000
a1.channels.c7.type
= memory
a1.channels.c7.capacity
= 10000
a1.channels.c7.transactionCapacity
= 1000
a1.channels.c8.type
= memory
a1.channels.c8.capacity
= 10000
a1.channels.c8.transactionCapacity
= 1000
a1.sinks.k1.channel
= c1
a1.sinks.k1.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.kafka.topic
= ws_activity
a1.sinks.k1.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k1.kafka.flumeBatchSize
= 5
a1.sinks.k1.kafka.producer.acks
= 1
a1.sinks.k2.channel
= c2
a1.sinks.k2.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k2.kafka.topic
= ws_admin
a1.sinks.k2.kafka.bootstrap.servers
= 172.56.10.23:9092
a1.sinks.k2.kafka.flumeBatchSize
= 5
a1.sinks.k2.kafka.producer.acks
= 1
a1.sinks.k3.channel
= c3
a1.sinks.k3.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k3.kafka.topic
= ws_authorization_oauth
a1.sinks.k3.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k3.kafka.flumeBatchSize
= 5
a1.sinks.k3.kafka.producer.acks
= 1
a1.sinks.k4.channel
= c4
a1.sinks.k4.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k4.kafka.topic
= ws_base
a1.sinks.k4.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k4.kafka.flumeBatchSize
= 5
a1.sinks.k4.kafka.producer.acks
= 1
a1.sinks.k5.channel
= c5
a1.sinks.k5.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k5.kafka.topic
= ws_channel
a1.sinks.k5.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k5.kafka.flumeBatchSize
= 5
a1.sinks.k5.kafka.producer.acks
= 1
a1.sinks.k6.channel
= c6
a1.sinks.k6.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k6.kafka.topic
= ws_config
a1.sinks.k6.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k6.kafka.flumeBatchSize
= 5
a1.sinks.k6.kafka.producer.acks
= 1
a1.sinks.k7.channel
= c7
a1.sinks.k7.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k7.kafka.topic
= ws_material
a1.sinks.k7.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k7.kafka.flumeBatchSize
= 5
a1.sinks.k7.kafka.producer.acks
= 1
a1.sinks.k8.channel
= c8
a1.sinks.k8.type
= org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k8.kafka.topic
= ws_zuul
a1.sinks.k8.kafka.bootstrap.servers
=172.56.10.23:9092
a1.sinks.k8.kafka.flumeBatchSize
= 5
a1.sinks.k8.kafka.producer.acks
= 1

 


推荐阅读
  • Nginx使用AWStats日志分析的步骤及注意事项
    本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息,并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境,并进行DNS解析。 ... [详细]
  • Skywalking系列博客1安装单机版 Skywalking的快速安装方法
    本文介绍了如何快速安装单机版的Skywalking,包括下载、环境需求和端口检查等步骤。同时提供了百度盘下载地址和查询端口是否被占用的命令。 ... [详细]
  • VScode格式化文档换行或不换行的设置方法
    本文介绍了在VScode中设置格式化文档换行或不换行的方法,包括使用插件和修改settings.json文件的内容。详细步骤为:找到settings.json文件,将其中的代码替换为指定的代码。 ... [详细]
  • 本文介绍了在rhel5.5操作系统下搭建网关+LAMP+postfix+dhcp的步骤和配置方法。通过配置dhcp自动分配ip、实现外网访问公司网站、内网收发邮件、内网上网以及SNAT转换等功能。详细介绍了安装dhcp和配置相关文件的步骤,并提供了相关的命令和配置示例。 ... [详细]
  • Android Studio Bumblebee | 2021.1.1(大黄蜂版本使用介绍)
    本文介绍了Android Studio Bumblebee | 2021.1.1(大黄蜂版本)的使用方法和相关知识,包括Gradle的介绍、设备管理器的配置、无线调试、新版本问题等内容。同时还提供了更新版本的下载地址和启动页面截图。 ... [详细]
  • 本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取,用于解析LOCAL_LISTENER,并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例,并展示了listener.ora文件的内容。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 利用Visual Basic开发SAP接口程序初探的方法与原理
    本文介绍了利用Visual Basic开发SAP接口程序的方法与原理,以及SAP R/3系统的特点和二次开发平台ABAP的使用。通过程序接口自动读取SAP R/3的数据表或视图,在外部进行处理和利用水晶报表等工具生成符合中国人习惯的报表样式。具体介绍了RFC调用的原理和模型,并强调本文主要不讨论SAP R/3函数的开发,而是针对使用SAP的公司的非ABAP开发人员提供了初步的接口程序开发指导。 ... [详细]
  • 本文介绍了在Windows环境下如何配置php+apache环境,包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]
  • 本文介绍了在mac环境下使用nginx配置nodejs代理服务器的步骤,包括安装nginx、创建目录和文件、配置代理的域名和日志记录等。 ... [详细]
  • 本文介绍了在Linux下安装和配置Kafka的方法,包括安装JDK、下载和解压Kafka、配置Kafka的参数,以及配置Kafka的日志目录、服务器IP和日志存放路径等。同时还提供了单机配置部署的方法和zookeeper地址和端口的配置。通过实操成功的案例,帮助读者快速完成Kafka的安装和配置。 ... [详细]
  • 本文讨论了在openwrt-17.01版本中,mt7628设备上初始化启动时eth0的mac地址总是随机生成的问题。每次随机生成的eth0的mac地址都会写到/sys/class/net/eth0/address目录下,而openwrt-17.01原版的SDK会根据随机生成的eth0的mac地址再生成eth0.1、eth0.2等,生成后的mac地址会保存在/etc/config/network下。 ... [详细]
  • 本文介绍了Windows操作系统的版本及其特点,包括Windows 7系统的6个版本:Starter、Home Basic、Home Premium、Professional、Enterprise、Ultimate。Windows操作系统是微软公司研发的一套操作系统,具有人机操作性优异、支持的应用软件较多、对硬件支持良好等优点。Windows 7 Starter是功能最少的版本,缺乏Aero特效功能,没有64位支持,最初设计不能同时运行三个以上应用程序。 ... [详细]
  • 本文介绍了禅道作为一款国产开源免费的测试管理工具的特点和功能,并提供了禅道的搭建和调试方法。禅道是一款B/S结构的项目管理工具,可以实现组织管理、后台管理、产品管理、项目管理和测试管理等功能。同时,本文还介绍了其他软件测试相关工具,如功能自动化工具和性能自动化工具,以及白盒测试工具的使用。通过本文的阅读,读者可以了解禅道的基本使用方法和优势,从而更好地进行测试管理工作。 ... [详细]
  • 本文介绍了解决java开源项目apache commons email简单使用报错的方法,包括使用正确的JAR包和正确的代码配置,以及相关参数的设置。详细介绍了如何使用apache commons email发送邮件。 ... [详细]
author-avatar
Candy王丫丫
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有