首页 > 其他分享 >ELK+kafka+filebeat企业内部日志分析系统

ELK+kafka+filebeat企业内部日志分析系统

时间:2024-05-26 16:29:33浏览次数:13  
标签:centos7.5 ELK filebeat kafka 搜集 Elasticsearch 日志 数据 Logstash

1、组件介绍

1、Elasticsearch:

  是一个基于Lucene的搜索服务器。提供搜集、分析、存储数据三大功能。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

2、Logstash:

  主要是用来日志的搜集、分析、过滤日志的工具。用于管理日志和事件的工具,你可以用它去收集日志、转换日志、解析日志并将他们作为数据提供给其它模块调用,例如搜索、存储等。

3、Kibana:

  是一个优秀的前端日志展示框架,它可以非常详细的将日志转化为各种图表,为用户提供强大的数据可视化支持,它能够搜索、展示存储在 Elasticsearch 中索引数据。使用它可以很方便的用图表、表格、地图展示和分析数据。

4、Kafka:

数据缓冲队列。作为消息队列解耦合处理过程,同时提高了可扩展性。具有峰值处理能力,使用消息队列能够使关键组件顶住突发的访问压力,而不会因为突发的超负荷的请求而完全崩溃。

  • 1.发布和订阅记录流,类似于消息队列或企业消息传递系统。

  • 2.以容错持久的方式存储记录流。

  • 3.处理记录发生的流。

5、Filebeat:

隶属于Beats,轻量级数据收集引擎。基于原先 Logstash-fowarder 的源码改造出来。换句话说:Filebeat就是新版的 Logstash-fowarder,也会是 ELK Stack 在 Agent 的第一选择,目前Beats包含四种工具:

  • 1.Packetbeat(搜集网络流量数据)

  • 2.Metricbeat(搜集系统、进程和文件系统级别的 CPU 和内存使用情况等数据。通过从操作系统和服务收集指标,帮助您监控服务器及其托管的服务。)

  • 3.Filebeat(搜集文件数据)

  • 4.Winlogbeat(搜集 Windows 事件日志数据)

2、环境介绍

注:以下为环境所需所有服务器,配置为测试环境配置。

安装软件主机名IP地址系统版本配置
Elasticsearch/Logstash/kibanaElk10.3.145.14centos7.5.18042核4G
ElasticsearchEs110.3.145.56centos7.5.18042核3G
ElasticsearchEs210.3.145.57centos7.5.18042核3G
zookeeper/kafkaKafka110.3.145.41centos7.5.18041核2G
zookeeper/kafkaKafka210.3.145.42centos7.5.18041核2G
zookeeper/kafkaKafka310.3.145.43centos7.5.18041核2G
Filebeat

3、版本说明

Elasticsearch: 7.13.2
Logstash: 7.13.2
Kibana: 7.13.2
Kafka: 2.11-1
Filebeat: 7.13.2
相应的版本最好下载对应的插件

4、搭建架构

5、 大致流程

1、日志数据由filebate进行收集,定义日志位置,定义kafka集群,定义要传给kafka的那个topic
2、kafka接受到数据后,端口为9092,等待消费
3、logstash消费kafka中的数据,对数据进行搜集、分析,根据输入条件,过滤条件,输出条件处理后,将数据传输给es集群
4、es集群接受数据后,搜集、分析、存储
5、kibana提供可视化服务,将es中的数据展示。

6、实施部署

Elasticsearch集群部署、Kibana部署、Logstash部署、Filebeat 部署

Elasticsearch集群和Logstash、Kibana部署-CSDN博客

Kafka部署

Kafka集群搭建-CSDN博客

标签:centos7.5,ELK,filebeat,kafka,搜集,Elasticsearch,日志,数据,Logstash
From: https://blog.csdn.net/weixin_45814478/article/details/139157851

相关文章

  • 第二篇:深入剖析Kafka生产者的架构和原理
    大家好!今天我们来深入探讨一下Kafka生产者的架构和原理。Kafka生产者是数据流入Kafka集群的起点,其设计和实现直接影响消息传输的可靠性和性能。本文将通过示例代码和源码剖析,带大家全面了解Kafka生产者的参数、整体架构、元数据更新过程等内容。准备好了吗?让我们开始吧!文......
  • 动态地控制kafka的消费速度,从而满足业务要求
    kafka是一个分布式流媒体平台,它可以处理大规模的数据流,并允许实时消费该数据流。在实际应用中,我们需要动态控制kafka消费速度,以便处理数据流的速率能够满足系统和业务的需求。本文将介绍如何在kafka中实现动态控制消费速度的方法。1.消费者配置在Kafka中,消费者可以使用以下参......
  • kafka调优参考建议 —— 筑梦之路
    这里主要是从不同使用场景来调优,仅供参考。吞吐量优先吞吐量优先使用场景如采集日志。1. broker配置调优num.partitions:分区个数,设置为与消费者的线程数基本相等2. producer配置调优 batch.size批量提交消息的字节数,发送消息累计大小达到该值时才会发送(或者达到......
  • springboot集成kafka解决集群模式下分组ID不同问题
    背景:在集群模式下,每个实例需要分组ID不同,共同消费某个topic,集群下的实例是动态扩展的,无法确认实例的个数,每次项目启动的时候,需要动态的给定kakfa的分组ID,但是分组ID整体是一样的,不能改变。方式1:CURRENT_INSTANCE_GROUP_ID=KafkaConstant.SSE_GROUP.concat(String.valueOf(Sys......
  • ELK搭建
    本次ELK安装版本均为7.17.21,8.0版本容易出软件如兼容的问题,故选择7的最后一个版本进行安装前期准备:elastic官网:https://www.elastic.co/elasticsearch下载地址:https://www.elastic.co/cn/downloads/past-releases/elasticsearch-7-17-21logstash下载地址:https://w......
  • Kafka篇
    ----------------------------------------------------------------------------------------消息队列分类:点对点(Queue),将消息发送到queue中,可以有多个消费者,但一个消息只能被一个消费者消费。发布与订阅(Topic),将消息发布到topic(主题)中,有多个消费者订阅某消息。发布到topic中的消息......
  • kafka再学习,上海银行面试后
    卡夫卡消费者  offset值,消费到哪里了呢?之前存储在zookeeper,后面kafka保存在一个主题里,并持久化到硬盘,相当安全消费者组ID用命令行创建会默认给你一个  cororifnator协调器,分区初始化对主题数50取模,选择有一个corrdinator超高频面试题再平衡 保持3秒的心跳,na......
  • Java核心面试知识集—Kafka面试题
    目录基础篇1、TCP、UDP的区别?2、TCP协议如何保证可靠传输?3、TCP的握手、挥手机制?4、TCP的粘包/拆包原因及其解决方法是什么?5、Netty的粘包/拆包是怎么处理的,有哪些实现?6、同步与异步、阻塞与非阻塞的区别?7、说说网络IO模型?8、BIO、NIO、AIO分别是什么?9、select、poll、epoll的机制......
  • Flink同步kafka到iceberg数据延迟,两个checkpoint后才可查询
    一、问题描述用户配置了高级参数很多,观察kafka增量数据不多,flink负载不高情况下两个checkpoint后才可查询到数据。  排查时hdfs有数据文件产生,但是mainfast文件中最新快照id没变化。 二、原因经腾讯排查,用户参数指定高级参数execution.checkpointing.unaligned:true引起......
  • kafka权威指南
    消息有字节数组组成消息Key也是一个字节数组根据消息key的哈希码进行取模后写入不同分区,保证具有相同key的消息总是被写入到相同分区中为了提供消息写入效率,支持消息的分批次写入,批次就是一组消息,每个批次的消息输入同一个主体和分区为了减少网络消耗,批次数据会被压缩kakfa使......