ELK 企业级日志分析系统

ops/2024/11/14 2:22:24/

1、ELK概述

ELK平台是一套完整的日志集中处理解决方案,将 ElasticSearchLogstashKiabana 三个开源工具配合使用, 完成更强大的用户对日志的查询、排序、统计需求。

ELKElasticsearch、Logstash、Kibana 的缩写,这三个工具组合在一起,用于数据收集、存储、搜索和可视化分析。它们的角色如下:

  • Elasticsearch:超级快速的搜索、分析工具,可以在海量数据中快速查找数据,实时分析数据。功能强大、灵活,用于很多公司做大数据分析、实时搜索的工具

  • Logstash:多功能”数据搬运工“,从各种来源(如日志文件、数据库)收集数据, 分析、过滤、格式化,输出到Elasticsearch。用于数据分析,监控和处理过程,让你可以轻松处理各种数据

  • Kibana:数据可视化工具,提供图形界面来展示和分析存储在Elasticsearch中的数据,支持创建各种图表和仪表板。用于监控系统、查询日志

简单理解

ELK Stack 是一个一体化的工具包,帮助用户从多个数据源中收集数据、存储并进行快速搜索、分析和可视化,适合于日志分析、监控、数据可视化等场景。

2、Elasticsearch(分布式全文搜索引擎)

Elastic Search简介及安装(windows,附:ELK安装)_es官网-CSDN博客

ElasticSearch:是基于Lucene(一个全文检索引擎的架构)开发的分布式存储检索引擎,用来存储各类日志。

Elasticsearch 是用 Java 开发的,可通过 RESTful Web 接口,让用户可以通过浏览器与 Elasticsearch 通信。

Elasticsearch是一个实时的、分布式的可扩展的搜索引擎,允许进行全文、结构化搜索,它通常用于索引和搜索大容量的日志数据,也可用于搜索许多不同类型的文档。

2.1 核心功能

  • 全文搜索:Elasticsearch最广为人知的功能是全文搜索。它能够对文本数据进行快速的全文索引和搜索,是实现复杂搜索功能的理想工具。

  • 实时数据分析:支持实时的数据更新和查询,适合用于日志分析、监控数据的实时处理等场景。

  • 分布式架构:Elasticsearch基于分布式架构设计,支持跨集群的数据存储和检索,使其在扩展性和性能上具有很大优势。

  • RESTful API(沟通协议):Elasticsearch使用简单的HTTP接口(RESTful API),支持通过各种语言和平台进行集成。

2.2 架构与组件

  • 集群(Cluster):一个或多个Elasticsearch节点(实例)组成一个集群,集群中的所有节点协同工作,共享数据和负载。

  • 节点(Node):运行Elasticsearch的单个实例,节点可以有不同的角色(如主节点、数据节点等),负责存储数据和处理查询。

  • 索引(Index):一个索引类似于传统数据库中的一个表,包含了一个数据集。每个索引都有唯一的名称,用于引用其中的文档。

  • 文档(Document):Elasticsearch中的最小数据单元,每个文档是一个JSON格式的对象,存储在索引中。

  • 分片(Shard):每个索引可以被分割为多个分片(shards),每个分片是一个Lucene索引。分片提供了数据的分布和并行处理能力,确保系统的高可用性和可扩展性。

  • 副本(Replica):每个分片都可以有一个或多个副本,用于数据冗余和提高系统的容错能力。

2.3 使用场景

  • 日志和事件数据分析:适合处理大规模的日志、事件流数据,提供实时的查询和分析能力。常与Logstash和Kibana(组成ELK Stack)一起使用。

  • 全文搜索应用:如电子商务网站中的产品搜索,社交媒体平台的用户内容搜索。

  • 监控和报警系统:通过与Kibana等工具结合,提供数据的可视化和实时监控功能。

  • 商业智能(BI):支持复杂数据查询和分析,帮助企业从数据中获取洞察。

2.4 Elasticsearch优点与缺点

优点:

  • 高性能:得益于Lucene的底层支持,Elasticsearch在处理全文搜索和分析操作时性能非常优越。

  • 易扩展:其分布式架构设计使得集群可以随着数据量的增长而轻松扩展。

  • 灵活性强:支持多种数据类型和复杂查询语法,可以适应各种不同的应用需求。

  • 开放源代码:免费且活跃的社区支持,用户可以自由定制和扩展。

缺点:

  • 资源消耗:作为一个内存密集型应用,Elasticsearch对硬件资源的要求较高,尤其在处理大量数据时。

  • 难学:虽然Elasticsearch易于集成,但对于新手来说,理解其复杂的查询DSL(Domain Specific Language)和架构可能需要一些时间。

  • 管理复杂性:在大型分布式集群环境中,管理和调优Elasticsearch需要相当的专业知识

https://nodejs.org/en/download nodejs 安装包

3、Logstash(数据收集引擎)

Logstash 作为数据收集引擎。它支持动态的从各种数据源搜集数据,并对数据进行过滤、分析、丰富、统一格式等操作,然后将处理后的数据发送到存储或分析系统(例如Elasticsearch)。 Logstash 由 Ruby 语言编写,运行在 Java 虚拟机(JVM)上,是一款强大的数据处理工具, 可以实现数据传输、格式处理、格式化输出。Logstash 具有强大的插件功能,常用于日志处理。

3.1 主要特点

  1. 数据收集

    Logstash能够从多种数据源(如日志文件、数据库、消息队列等)收集数据。

    它支持各种输入插件,这些插件帮助你从不同的系统或服务中提取数据。

  2. 数据处理

    Logstash使用过滤器插件来处理数据,可以对数据进行清洗、格式转换、字段解析等操作。

    支持丰富的数据处理操作,比如正则表达式解析、日期转换、字段拆分和合并等。

  3. 数据输出

    处理后的数据可以被发送到多种输出目标,如Elasticsearch、关系型数据库、消息队列、文件系统等。

    输出插件的灵活性使得Logstash能够与各种系统集成。

  4. 可扩展性

    Logstash的架构允许通过插件轻松扩展和自定义,插件包括输入插件、过滤器插件、输出插件和编码插件等。

  5. 实时处理

    Logstash支持实时数据处理,适用于需要快速数据流的场景,比如实时日志监控、数据流分析等。

3.2 使用场景

  • 日志收集和分析:从各种日志文件中提取数据(如系统日志、应用日志),然后将数据发送到Elasticsearch进行集中化分析和监控。

  • 数据转换:在数据进入目标存储之前,对其进行清理、格式化和标准化处理。

  • 数据流整合:从多种来源获取数据,将其汇聚到一个统一的平台进行进一步的分析和决策支持。

3.3 数据流向****

 input(数据采集) filter(数据过滤、分析、格式化) output (数据输出到ES搜索引擎)

3.3 其他 数据收集组件

① Filebeat

轻量级的开源日志文件数据搜集器。通常在需要采集数据的客户端安装 Filebeat,并指定目录与日志格式,Filebeat 就能快速收集数据,并发送给 logstash 进或是直接发给 Elasticsearch 存储,性能上相比运行于 JVM 上的 logstash 优势明显,是对它的替代。常应用于 EFLK 架构当中。行解析

filebeat 结合 logstash 带来好处: 1)通过 Logstash 具有基于磁盘的自适应缓冲系统,该系统将吸收传入的吞吐量,从而减轻 Elasticsearch 持续写入数据的压力 2)从其他数据源(例如数据库,S3对象存储或消息传递队列)中提取 3)将数据发送到多个目的地,例如S3,HDFS(Hadoop分布式文件系统)或写入文件 4)使用条件数据流逻辑组成更复杂的处理管道

缓存/消息队列(redis、kafka、RabbitMQ等):可以对高并发日志数据进行流量削峰和缓冲,这样的缓冲可以一定程度的保护数据不丢失,还可以对整个架构进行应用解耦。

② Fluentd

是一个流行的开源数据收集器。由于 logstash 太重量级的缺点,Logstash 性能低、资源消耗比较多等问题,随后就有 Fluentd 的出现。相比较 logstash,Fluentd 更易用、资源消耗更少、性能更高,在数据处理上更高效可靠,受到企业欢迎,成为 logstash 的一种替代方案,常应用于 EFK 架构当中。在 Kubernetes 集群中也常使用 EFK 作为日志数据收集的方案。 在 Kubernetes 集群中一般是通过 DaemonSet 来运行 Fluentd,以便它在每个 Kubernetes 工作节点上都可以运行一个 Pod。 它通过获取容器日志文件、过滤和转换日志数据,然后将数据传递到 Elasticsearch 集群,在该集群中对其进行索引和存储。

4、Kiabana(可视化工具)

Kibana 通常与 Elasticsearch 一起部署,Kibana 是 Elasticsearch 的一个功能强大的数据可视化 Dashboard,Kibana 提供图形化的 web 界面来浏览 Elasticsearch 日志数据,可以用来汇总、分析和搜索重要数据。它为用户提供了交互式仪表盘、图表和报告功能,用于更好地理解数据。

4.1 Kibana 的主要功能

  1. 数据可视化(Visualizations):

    Kibana 提供丰富的可视化工具,可以通过折线图、饼图、柱状图、地图等方式展示数据。

    用户可以根据需求自定义图表样式,以便更好地分析和解读数据。

    支持创建动态可视化,根据过滤器和时间范围即时更新显示内容。

  2. 仪表板(Dashboards):

    Kibana 的仪表板是一种用来展示多个可视化图表的集合,可以通过仪表板同时监控多个数据来源或系统状态。

    仪表板支持交互式过滤器,用户可以在不同时间范围、不同条件下实时查看数据。

  3. 日志管理和搜索(Log Management & Discovery):

    Kibana 的 “Discovery” 功能提供了对 Elasticsearch 中存储的原始数据的实时搜索与过滤功能。

    用户可以根据条件快速查询和检索日志、数据记录等内容,并使用强大的过滤器和查询语言(KQL 或 Lucene)来精准获取所需信息。

  4. 时间序列分析(Time Series Analytics):

    使用 Kibana 的 "TSVB"(Time Series Visual Builder),用户可以进行复杂的时间序列分析。

    它支持创建基于时间的数据图表,常用于监控系统性能、用户活动趋势等。

  5. 报警与监控(Alerts & Monitoring):

    Kibana 可以通过与 Elasticsearch 和 Logstash 的集成提供数据监控、报警通知功能。

    用户可以设置阈值,当数据达到某个条件时,Kibana 可以自动触发报警并发送通知。

  6. 安全和访问控制(Security & Access Control):

    Kibana 提供基于角色的访问控制,管理员可以根据用户角色来设置权限,例如是否允许访问某些数据或仪表板。(黑白名单)

    Kibana 支持与外部认证系统(如 LDAP、OAuth)集成。

  7. 机器学习(Machine Learning):

    Kibana 提供了与 Elastic Stack 的机器学习功能集成,用户可以对数据进行异常检测、趋势预测和自动模式识别。

    可以通过无监督的机器学习算法自动检测数据中的异常行为。

  8. 地图和地理可视化(Maps & Geospatial Visualization):

    Kibana 提供了强大的地理数据可视化功能,通过 Elastic Maps 可以显示地理数据、绘制地图并叠加数据层。

    支持动态过滤和聚合地理数据,适用于位置数据分析、物流、地理信息系统等领域。

  9. Canvas 和报告(Canvas & Reporting):

    Canvas: Kibana 的 Canvas 功能允许用户创建高度自定义的、视觉吸引力强的报告和展示。

    Reporting: Kibana 支持自动生成报告,可以通过预定义模板或自定义的方式导出 PDF、CSV 报告。

  10. 监控(Monitoring):

    Kibana 提供 Elastic Stack 组件的监控功能,帮助用户监控 Elasticsearch 集群、Logstash 管道等系统的健康状况、性能和资源使用情况。

4.2 Kibana 的使用场景

  1. 日志管理与分析:

    通过 Kibana 可以对大量的日志数据进行集中管理与分析,帮助开发者、运维工程师及时发现系统故障、监控应用程序状态。

  2. 实时监控:

    运用 Kibana 的仪表板和报警功能,用户可以对系统的性能和服务进行实时监控,并在异常时及时采取行动。

  3. 业务数据分析:

    Kibana 可以用于对商业数据(如销售数据、用户行为数据)进行深度分析,帮助企业决策。

  4. 安全分析与威胁检测:

    通过集成 Elastic Security,Kibana 可以用来检测网络中的安全威胁,分析安全日志,进行入侵检测。

  5. 机器学习与数据预测:

    Kibana 提供的机器学习功能可用于自动化的数据预测、趋势识别和异常检测,适用于金融预测、系统监控等场景。

4.3 Kibana 的工作原理

  1. 数据存储在 Elasticsearch 中:

    Kibana 本身不存储数据,而是通过 Elasticsearch 查询和检索存储的数据。Elasticsearch 是 Kibana 的数据源,数据可以从不同来源(如 Logstash、Beats、API 等)存储到 Elasticsearch 中。

  2. 查询和分析:

    用户在 Kibana 中执行查询时,Kibana 会向 Elasticsearch 发送查询请求。查询可以使用 Kibana Query Language (KQL) 或 Lucene 查询语法。

  3. 数据可视化和展示:

    查询结果返回后,Kibana 会通过各种可视化工具(如图表、地图、仪表盘等)展示数据,帮助用户快速理解和分析数据。

5、为什么要使用 ELK

日志主要包括系统日志、应用程序日志和安全日志。系统运维和开发人员可以通过日志了解服务器软硬件信息、检查配置过程中的错误及错误发生的原因。经常分析日志可以了解服务器的负荷,性能安全性,从而及时采取措施纠正错误。 往往单台机器的日志我们使用grep、awk等工具就能基本实现简单分析,但是当日志被分散的储存不同的设备上。如果你管理数十上百台服务器,你还在使用依次登录每台机器的传统方法查阅日志。这样是不是感觉很繁琐和效率低下。当务之急我们使用集中化的日志管理,例如:开源的syslog,将所有服务器上的日志收集汇总。集中化管理日志后,日志的统计和检索又成为一件比较麻烦的事情,一般我们使用 grep、awk和wc等Linux命令能实现检索和统计,但是对于要求更高的查询、排序和统计等要求和庞大的机器数量依然使用这样的方法难免有点力不从心。

一般大型系统是一个分布式部署的架构,不同的服务模块部署在不同的服务器上,问题出现时,大部分情况需要根据问题暴露的关键信息,定位到具体的服务器和服务模块,构建一套集中式日志系统,可以提高定位问题的效率。

6、完整日志系统基本特征

  • 收集:能够采集多种来源的日志数据

  • 传输:能够稳定的把日志数据解析过滤并传输到存储系统

  • 存储:存储日志数据

  • 分析:支持 UI 分析

  • 警告:能够提供错误报告,监控机制

7、ELK 的工作原理 ****

(1)在所有需要收集日志的服务器上部署Logstash;或者先将日志进行集中化管理在日志服务器上,在日志服务器上部署 Logstash。

(2)Logstash 收集日志,将日志格式化并输出到 Elasticsearch 群集中。

(3)Elasticsearch 对格式化后的数据进行索引和存储。

(4)Kibana 从 ES 群集中查询数据生成图表,展示到客户端的日志。

8、部署环境ELK

配置与名称IP服务
Node1节点(2C/8G)node1/192.168.190.50Elasticsearch(集群) Kibana
Node2节点(2C/4G)node2/192.168.190.60Elasticsearch(集群)
Apache节点apache/192.168.190.70Logstash Apache

官方网站(中文) :https://www.elastic.co/cn/downloads/

8.1 环境准备

node1、node2都做

1、关闭防火墙与增强功能
systectl stop firewalld   #关闭防火墙
setenforce 0    #关闭增强功能

2、更改主机名、配置域名解析、查看Java环境

Node1节点:hostnamectl set-hostname node1
Node2节点:hostnamectl set-hostname node2

3、主机名与IP解析

vim /etc/hosts
192.168.190.50 node1
192.168.190.60 node2  

4、java安装
注:版本问题

java -version                                       #如果没有安装,yum -y install java
openjdk version "1.8.0_131"
OpenJDK Runtime Environment (build 1.8.0_131-b12)
OpenJDK 64-Bit Server VM (build 25.131-b12, mixed mode)

也可使用 jdk 

8.2 Elasticsearch 集群部署

(在Node1、Node2节点上操作)

1、部署 Elasticsearch 软件

(1)安装elasticsearch—rpm包
#上传elasticsearch-6.6.1.rpm到/opt目录下

cd /opt
rpm -ivh elasticsearch-6.6.1.rpm​

(2)加载系统服务

systemctl daemon-reload    
systemctl enable elasticsearch.service

​(3)修改elasticsearch主配置文件

cp /etc/elasticsearch/elasticsearch.yml /etc/elasticsearch/elasticsearch.yml.bak
vim /etc/elasticsearch/elasticsearch.yml
--17--取消注释,指定集群名字
cluster.name: my-elk-cluster
--23--取消注释,指定节点名字:Node1节点为node1,Node2节点为node2
node.name: node1                                         #node2--》   node.name: node2
--33--取消注释,指定数据存放路径
path.data: /data/elk_data
--37--取消注释,指定日志存放路径
path.logs: /var/log/elasticsearch/
--43--取消注释,改为在启动的时候不锁定内存
bootstrap.memory_lock: false
--55--取消注释,设置监听地址,0.0.0.0代表所有地址
network.host: 0.0.0.0
--59--取消注释,ES 服务的默认监听端口为9200
http.port: 9200
--68--取消注释,集群发现通过单播实现,指定要发现的节点 node1、node2
discovery.zen.ping.unicast.hosts: ["node1", "node2"]

grep -v "^#" /etc/elasticsearch/elasticsearch.yml

(4)创建数据存放路径并授权

mkdir -p /data/elk_data
chown elasticsearch:elasticsearch /data/elk_data/

(5)启动elasticsearch是否成功开启

systemctl start elasticsearch.service         

systemctl status elasticsearch.service        #java代码编写,可能有点慢,稍等一下
netstat -antp | grep 9200

(6)查看节点信息

浏览器访问   http://192.168.190.50:9200 

                     http://192.168.190.60:9200

查看节点 Node1、Node2 的信息。

浏览器访问       http://192.168.190.50:9200/_cluster/health?pretty                                                                   http://192.168.190.60:9200/_cluster/health?pretty   

  查看群集的健康情况,可以看到 status 值为 green(绿色), 表示节点健康运行。

​绿色:健康  数据和副本 全都没有问题
红色:数据都不完整
黄色:数据完整,但副本有问题


浏览器访问      http://192.168.190.50:9200/_cluster/state?pretty  检查群集状态信息。

#使用上述方式查看群集的状态对用户并不友好,可以通过安装 Elasticsearch-head 插件,可以更方便地管理群集。

​2.安装 Elasticsearch-head 插件(只要在node1上做)
Elasticsearch 在 5.0 版本后,Elasticsearch-head 插件需要作为独立服务进行安装,需要使用npm工具(NodeJS的包管理工具)安装。
安装 Elasticsearch-head 需要提前安装好依赖软件 node 和 phantomjs。
node:是一个基于 Chrome V8 引擎的 JavaScript 运行环境。
phantomjs:是一个基于 webkit 的JavaScriptAPI,可以理解为一个隐形的浏览器,任何基于 webkit 浏览器做的事情,它都可以做到。

​java -jar weifuwu.jar/war  

(1)编译安装 node
#上传软件包 node-v8.2.1.tar.gz 到/opt

yum install gcc gcc-c++ make -y

cd /opt
tar zxvf node-v8.2.1.tar.gz

cd node-v8.2.1/
./configure
make -j 4 && make install

(2)安装 phantomjs(前端的框架)
#上传软件包 phantomjs-2.1.1-linux-x86_64.tar.bz2 到

cd /opt
tar jxvf phantomjs-2.1.1-linux-x86_64.tar.bz2 -C /usr/local/src/
cd /usr/local/src/phantomjs-2.1.1-linux-x86_64/bin
cp phantomjs /usr/local/bin

(3)安装 Elasticsearch-head 数据可视化工具
#上传软件包 elasticsearch-head.tar.gz 到/opt

cd /opt
tar zxvf elasticsearch-head.tar.gz -C /usr/local/src/
cd /usr/local/src/elasticsearch-head/
npm install

(4)修改 Elasticsearch 主配置文件

vim /etc/elasticsearch/elasticsearch.yml
......
--末尾添加以下内容--
http.cors.enabled: true             #开启跨域访问支持,默认为 false
http.cors.allow-origin: "*"         #指定跨域访问允许的域名地址为所有
                                                ​# :冒号前要有空格,不然重启不了
systemctl restart elasticsearch

(5)启动 elasticsearch-head 服务
#必须在解压后的 elasticsearch-head 目录下启动服务,进程会读取该目录下的 gruntfile.js 文件,否则可能启动失败。

cd /usr/local/src/elasticsearch-head/
npm run start &

> elasticsearch-head@0.0.0 start /usr/local/src/elasticsearch-head
> grunt server

Running "connect:server" (connect) task
Waiting forever...
Started connect web server on http://localhost:9100

#elasticsearch-head 监听的端口是 9100
netstat -natp |grep 9100

(6)通过 Elasticsearch-head 查看 Elasticsearch 信息

浏览器访问           http://192.168.190.50:9100/            地址并连接群集。

#如果上面的地址访问不了,可以访问 Elasticsearch-head 并带上 base_uri 参数          

http://192.168.190.50:9100/?base_uri=http://192.168.190.50:9200

如果看到群集健康值为 green 绿色,代表群集很健康。

(7)插入索引
#通过命令插入一个测试索引,索引为 index-demo,类型为 test。

//输出结果如下:curl -X PUT 'localhost:9200/index-demo1/test/1?pretty&pretty' -H 'content-Type: application/json' -d '{"user":"zhangsan","mesg":"hello world"}'

{
"_index" : "index-demo",
"_type" : "test",
"_id" : "1",
"_version" : 1,
"result" : "created",
"_shards" : {
"total" : 2,
"successful" : 2,
"failed" : 0
},
"created" : true
}

浏览器访问 http://192.168.190.50:9100/ 查看索引信息,可以看见索引默认被分片5个,并且有一个副本。
点击“数据浏览”,会发现在node1上创建的索引为 index-demo,类型为 test 的相关信息。

8.3 Logstash 部署

(在 Apache 节点上操作)(apache 和 Logstash 是同一台机器 )

Logstash 一般部署在需要监控其日志的服务器。在本案例中,Logstash 部署在 Apache 服务器上,用于收集 Apache 服务器的日志信息并发送到 Elasticsearch

1.更改主机名

hostnamectl set-hostname apache​

2.安装Apahce服务(httpd)

yum -y install httpd
systemctl start httpd

​3.安装Java环境

yum -y install java
java -version

4.安装logstash
#上传软件包 logstash-6.6.1.rpm 到/opt目录下

cd /opt
rpm -ivh logstash-6.6.1.rpm                          
systemctl start logstash.service                      
systemctl enable logstash.service

ln -s /usr/share/logstash/bin/logstash /usr/local/bin/

5.测试 Logstash
Logstash 命令常用选项:
-f:通过这个选项可以指定 Logstash 的配置文件,根据配置文件配置 Logstash 的输入和输出流。
-e:从命令行中获取,输入、输出后面跟着字符串,该字符串可以被当作 Logstash 的配置(如果是空,则默认使用 stdin 作为输入,stdout 作为输出)。
-t:测试配置文件是否正确,然后退出。

定义输入和输出流:
#输入采用标准输入,输出采用标准输出(类似管道)

logstash -e 'input { stdin{} } output { stdout{} }'
......
www.baidu.com                                       #键入内容(标准输入)
2020-12-22T03:58:47.799Z node1 www.baidu.com        #输出结果(标准输出)
www.sina.com.cn                                     #键入内容(标准输入)
2017-12-22T03:59:02.908Z node1 www.sina.com.cn      #输出结果(标准输出)
​//执行 ctrl+c 退出

#使用 rubydebug 输出详细格式显示,codec 为一种编解码器

logstash -e 'input { stdin{} } output { stdout{ codec=>rubydebug } }'
......
www.baidu.com                                       #键入内容(标准输入)
{
   "@timestamp" => 2020-12-22T02:15:39.136Z,       #输出结果(处理后的结果)
     "@version" => "1",
         "host" => "apache",
      "message" => "www.baidu.com"
}

#使用 Logstash 将信息写入 Elasticsearch 中

logstash -e 'input { stdin{} } output { elasticsearch { hosts=>["192.168.190.50:9200"] } }'
             输入             输出          对接
......
www.baidu.com                                       #键入内容(标准输入)
www.sina.com.cn                                     #键入内容(标准输入)
www.google.com                                      #键入内容(标准输入)

//结果不在标准输出显示,而是发送至 Elasticsearch 中,可

浏览器访问

6.定义 logstash配置文件
Logstash 配置文件基本由三部分组成:input、output 以及 filter(可选,根据需要选择使用)。
input:表示从数据源采集数据,常见的数据源如Kafka、日志文件等
filter:表示数据处理层,包括对数据进行格式化处理、数据类型转换、数据过滤等,支持正则表达式
output:表示将Logstash收集的数据经由过滤器处理之后输出到Elasticsearch。

#格式如下:
input {...}
filter {...}
output {...}

#在每个部分中,也可以指定多个访问方式。例如,若要指定两个日志来源文件,则格式如下:
input {
    file { path =>"/var/log/messages" type =>"syslog"}
    file { path =>"/var/log/httpd/access.log" type =>"apache"}
}

#修改 Logstash 配置文件,让其收集系统日志/var/log/messages,并将其输出到 elasticsearch 中。

chmod +r /var/log/messages                  #让 Logstash 可以读取日志

vim /etc/logstash/conf.d/system.conf
input {
   file{
       path =>"/var/log/messages"                      #指定要收集的日志的位置
       type =>"system"                                 #自定义日志类型标识
       start_position =>"beginning"                    #表示从开始处收集
   }
}
output {
   elasticsearch {                                     #输出到 elasticsearch
       hosts => ["192.168.190.50:9200"]                 #指定 elasticsearch 服务器的地址和端口
       index =>"system-%{+YYYY.MM.dd}"                 #指定输出到 elasticsearch 的索引格式
   }
}

systemctl restart logstash

logstash -t system.conf      #检查代码

浏览器访问       http://192.168.190.50:9100/         查看索引信息

8.4 Kiabana 部署

(在 Node1 节点上操作)

​官方网站 :https://www.elastic.co/cn/downloads/kibana/
wget https://artifacts.elastic.co/downloads/kibana/kibana-6.6.1-linux-x86_64.tar.gz
1.安装 Kiabana

cd /opt         #上传软件包 kibana-6.6.1-x86_64.rpm 到/opt目录
rpm -ivh kibana-6.6.1-x86_64.rpm

​2.设置 Kibana 的主配置文件

cp /etc/kibana/kibana.yml{,_bak}

vim /etc/kibana/kibana.yml
--2--取消注释,Kiabana 服务的默认监听端口为5601
server.port: 5601
--7--取消注释,设置 Kiabana 的监听地址,0.0.0.0代表所有地址
server.host: "0.0.0.0"
--28--取消注释,设置和 Elasticsearch 建立连接的地址和端口
elasticsearch.hosts: ["http://192.168.190.50:9200"]
--37--取消注释,设置在 elasticsearch 中添加.kibana索引
kibana.index: ".kibana"

3.启动 Kibana 服务

systemctl start kibana.service
systemctl enable kibana.service

netstat -natp | grep 5601

4.验证 Kibana

浏览器访问 http://192.168.190.50:5601

第一次登录需要添加一个 Elasticsearch 索引:
Index Patterns---》create index Patterns
//输入:system-*           #在索引名中输入之前配置的 Output 前缀“system”

然后--》Next step(下一步)--》Time Filter field name--》@timestarmp

单击 “create index Patterns” 按钮创建,单击 “Discover” 按钮可查看图表信息及日志信息。
数据展示可以分类显示,在“Available Fields”中的“host”,然后单击 “add”按钮,可以看到按照“host”筛选后的结果

​后面再次创建的步骤---》Management--》index Patterns--》单击 “create index Patterns” 按钮创建



 

5.将 Apache 服务器的日志(访问的、错误的)添加到 Elasticsearch 并通过 Kibana 显示

(在 apache 服务器上做)

vim /etc/logstash/conf.d/apache_log.conf
input {
   file{
       path => "/etc/httpd/logs/access_log"       # cat /etc/httpd/logs/access_log要有内容,不然报错
       type => "access"
       start_position => "beginning"
   }
   file{
       path => "/etc/httpd/logs/error_log"
       type => "error"
       start_position => "beginning"
   }
}
output {
   if [type] == "access" {
       elasticsearch {
           hosts => ["192.168.190.50:9200"]
           index => "apache_access-%{+YYYY.MM.dd}"
       }
   }
    if [type] == "error" {
       elasticsearch {
           hosts => ["192.168.190.50:9200"]
           index => "apache_error-%{+YYYY.MM.dd}"
       }
   }
}

cd /etc/logstash/conf.d/
/usr/share/logstash/bin/logstash -f apache_log.conf

浏览器访问 http://192.168.190.50:9100 查看索引是否创建

浏览器访问 http://192.168.190.50:5601 登录 Kibana,单击“Create Index Pattern”按钮添加索引, 在索引名中输入之前配置的 Output 前缀 apache_access-*,并单击“Create”按钮。在用相同的方法添加 apache_error-*索引。
选择“Discover”选项卡,在中间下拉列表中选择刚添加的 apache_access-*apache_error-* 索引, 可以查看相应的图表及日志信息。 

9、Filebeat+ELK 部署

入门级架构,适合处理简单的日志数据

filebeat:轻量级数据数据收集工具(filebeat不占用大量资源,logstash占用资源太大),把数据输出给logstash,如何通过接口输出,最后logstash处理数据,并发送给ES,进行kibana数据展示

配置与名称IP服务
Node1节点(2C/4G)node1/192.168.190.50Elasticsearch(集群) Kibana
Node2节点(2C/4G)node2/192.168.190.60Elasticsearch(集群)
Apache节点apache/192.168.190.70Logstash Apache
Filebeat节点filebeat/192.168.190.10Filebeat

官方网站(中文下载):Download Filebeat • Lightweight Log Analysis | Elastic

9.1 环境部署

在 Filebeat节点(192.168.190.10)上操作

https://www.elastic.co/cn/downloads/beats/filebeat

1.安装 Filebeat 两种

① 二进制解包即可
#上传软件包 filebeat-6.2.4-linux-x86_64.tar.gz 到/opt目录
tar zxvf filebeat-6.2.4-linux-x86_64.tar.gz
mv filebeat-6.2.4-linux-x86_64/ /usr/local/filebeat

② 使用rpm包安装 上传包
[root@kgc16 opt]# rpm -ivh filebeat-6.6.1-x86_64.rpm

​2.设置 filebeat 的主配置文件

① 如果使用第一种方式按照如下配置
cd /usr/local/filebeat

vim filebeat.yml
filebeat.prospectors:
- type: log         #指定 log 类型,从日志文件中读取消息
  enabled: true
  paths:
   - /var/log/messages       #指定监控的日志文件
   - /var/log/*.log
  fields:           #可以使用 fields 配置选项设置一些参数字段添加到 output 中
   service_name: filebeat
   log_type: log
   service_id: 192.168.190.10
​--------------Elasticsearch output-------------------
(全部注释掉)
​----------------Logstash output---------------------
output.logstash:
  hosts: ["192.168.190.70:5044"]      #指定 logstash 的 IP 和端口

./filebeat -e -c filebeat.yml               ​#启动 filebeat

② rpm包方式安装    配置都一样

cd /etc/filebeat
vim /etc/filebeat/filebeat.yml

filebeat -e -c filebeat.yml               ​#启动 filebeat

​3.在 Logstash 组件所在节点上新建一个 Logstash 配置文件(Apache 192.168.190.70)

cd /etc/logstash/conf.d

vim logstash.conf
input {
   beats {
       port => "5044"
   }
}
output {
   elasticsearch {
       hosts => ["192.168.190.50:9200"]
       index => "%{[fields][service_name]}-%{+YYYY.MM.dd}"
   }
   stdout {
       codec => rubydebug
   }
}

logstash -f logstash.conf                 #启动 logstash

4.浏览器访问 http://192.168.190.50:5601 登录 Kibana,

先点击Management--》“Index Pattern”--》“Create Index Pattern”按钮创建--》选择输入“Index Pattern”--》然后Next step(下一步)--》Time Filter field name--》@timestarmp

单击 “Discover” 按钮可查看图表信息及日志信息。  按钮添加索引“filebeat-*”


生产架构一(elk):直接用logstash收集日志过滤

生产架构二(elfk):中等量日志情况下,logstash做格式化和过滤,filebeat收集日志


http://www.ppmy.cn/ops/114442.html

相关文章

阿里1688一面总结

首先,面试官进行对业务进行介绍,然后,候选人进行自我介绍。 面试官根据候选人经历进行提问。 候选人针对想了解的事情进行提问。 接下来主要是对面试官的问题进行记录: 在容量管理优化查询逻辑里面,集群及单机信息是…

Vue学习记录之五(组件/生命周期)

一、组件 在每一个.vue文件可以看作是一个组件,组件是可以复用的,每个应用可以看作是一棵嵌套的组件树。 在Vue3中,组件导入以后即可直接使用。 二、组件的生命周期 生命周期就是从诞生(创建)到死亡(销毁) 的过程。 Vue3 组合式API中(se…

【数据结构与算法 | 灵神题单 | 二叉搜索树篇】力扣653

1. 力扣653:两数之和IV - 输入二叉搜索树 1.1 题目: 给定一个二叉搜索树 root 和一个目标结果 k,如果二叉搜索树中存在两个元素且它们的和等于给定的目标结果,则返回 true。 示例 1: 输入: root [5,3,6,2,4,null,7…

Spring Cloud Gateway组件

Spring Cloud Gateway是Spring Cloud生态系统中的一个关键组件,它基于Spring Framework 5、Spring Boot 2和Project Reactor等技 术构建,为微服务架构提供了强大且灵活的网关服务。以下是对Spring Cloud Gateway的详细介绍:一、概述 Spring …

Java 入门指南:JVM(Java虚拟机)垃圾回收机制 —— 新一代垃圾回收器 ZGC 收集器

文章目录 垃圾回收机制垃圾收集器垃圾收集器分类ZGC 收集器ZGC 的性能优势复制算法指针染色读屏障 ZGC 的工作过程Stop-The-World 暂停阶段并发阶段 垃圾回收机制 垃圾回收(Garbage Collection,GC),顾名思义就是释放垃圾占用的空…

PostgreSQL配置主从同步

PostgreSQL配置主从同步 1 主、备库安装postgresql软件 su - pg12 cd /home/pg12/resource tar -zxvf postgresql-12.9.tar.gz cd postgresql-12.9/ ./configure --prefix/home/pg12/soft/ make -j 16 && make install2 主、备库配置环境变量 vi ~/.bash_profile…

运行 xxxxApplication 时出错。命令行过长。 通过 JAR 清单或通过类路径文件缩短命令行,然后重新运行。

一、问题描述 运行 xxxxApplication 时出错。命令行过长。 通过 JAR 清单或通过类路径文件缩短命令行,然后重新运行。 二、问题分析 在idea中,运行一个springboot项目,在使用大量的库和依赖的时候,会出现报错“命令行过长”&…

C#基础(14)冒泡排序

前言 其实到上一节结构体我们就已经将c#的基础知识点大概讲完,接下来我们会讲解一些关于算法相关的东西。 我们一样来问一下gpt吧: Q:解释算法 A: 算法是一组有序的逻辑步骤,用于解决特定问题或执行特定任务。它可以是一个计算过程、一个…