Zookeeper 配置文件:核心参数优化与实操指南

embedded/2025/1/18 9:58:11/

文章目录

  • 一、核心参数优化详解
    • 1.1 tickTime:Client-Server通信心跳时间
    • 1.2 initLimit:Leader-Follower初始通信时限
    • 1.3 syncLimit:Leader-Follower同步通信时限
    • 1.4 dataDir:数据文件目录
    • 1.5 clientPort:客户端连接端口
  • 二、优化操作说明
    • 2.1 jvm配置
    • 2.2 log4j配置
    • 2.3 ACL验证忽略

一、核心参数优化详解

1.1 tickTime:Client-Server通信心跳时间

Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳。tickTime以毫秒为单位。

tickTime=2000

1.2 initLimit:Leader-Follower初始通信时限

集群中的follower服务器(F)与leader服务器(L)之间初始连接时能容忍的最多心跳数(tickTime的数量)。
initLimit=5

1.3 syncLimit:Leader-Follower同步通信时限

集群中的follower服务器与leader服务器之间请求和应答之间能容忍的最多心跳数(tickTime的数量)。

syncLimit=2

1.4 dataDir:数据文件目录

Zookeeper保存数据的目录,默认情况下,Zookeeper将写数据的日志文件也保存在这个目录里。

dataDir=/opt/zookeeper/data

1.5 clientPort:客户端连接端口

客户端连接 Zookeeper 服务器的端口,Zookeeper 会监听这个端口,接受客户端的访问请求。

clientPort=2181
服务器名称与地址:集群信息(服务器编号,服务器地址,LF通信端口,选举端口)
这个配置项的书写格式比较特殊,规则如下:

server.N=YYY:A:B
server.1=itcast05:2888:3888
server.2=itcast06:2888:3888
server.3=itcast07:2888:3888

ALLOW_ANONYMOUS_LOGIN=yes
表明zookeeper会读取该环境变量,从字面意思也可知,该参数配置的为是否可以让匿名用户访问服务,说白了也就是游客也可以访问。

ZOO_LISTEN_ALLIPS_ENABLED

二、优化操作说明

2.1 jvm配置

默认jvm没有配置Xmx、Xms等信息,可以在conf目录下创建java.env文件。

export JVMFLAGS=“-Xms512m -Xmx512m $JVMFLAGS”

2.2 log4j配置

log4j配置,由于zk是通过nohup启动的,会有一个zookeeper.out日志文件,该文件中记录的是输出到console的日志。
log4j中只要配置输出到console即可,zookeeper.out日积月累会不断变大,要放在容量大的磁盘上。

zookeeper.root.logger=INFO, CONSOLE
zookeeper.console.threshold=INFO
log4j.rootLogger=${zookeeper.root.logger}log4j.appender.CONSOLE=org.apache.log4j.ConsoleAppender
log4j.appender.CONSOLE.Threshold=${zookeeper.console.threshold}
log4j.appender.CONSOLE.layout=org.apache.log4j.PatternLayout
log4j.appender.CONSOLE.layout.ConversionPattern=%d{ISO8601} [myid:%X{myid}] - %-5p [%t:%C{1}@%L] - %m%n

zoo.cfg文件中,dataDir是存放快照数据的,dataLogDir是存放写前日志的。
这两个目录不要配置成一个路径,要配置到不同的磁盘上。
如果磁盘是使用了raid,系统就一块磁盘,那配置到一块磁盘上也可以。
写前日志的部分对写请求的性能影响很大,保证dataLogDir所在磁盘性能良好。

2.3 ACL验证忽略

zoo.cfg文件中skipACL=yes,忽略ACL验证,可以减少权限验证的相关操作,提升一点性能。

zoo.cfg文件中forceSync=no,这个对写请求的性能提升很有帮助,是指每次写请求的数据都要从pagecache中固化到磁盘上,才算是写成功返回。
当写请求数量到达一定程度的时候,后续写请求会等待前面写请求的forceSync操作,造成一定延时。
如果追求低延时的写请求,配置forceSync=no,数据写到pagecache后就返回。但是机器断电的时候,pagecache中的数据有可能丢失。

zk的dataDir和dataLogDir路径下,如果没有配置zk自动清理,会不断的新增数据文件。可配置成zk系统自动清理数据文件,但是最求系统最高性能的话,建议人工手动清理文件:

zkCleanup.sh -n 3  #这样保留三份文件。

查看zk节点状态。重新启动zk节点前后,一定要查看状态

echo ruok | nc host port
echo stat | nc host port

配置fsync.warningthresholdms=20,单位是毫秒,在forceSync=yes的时候,如果数据固化到磁盘的操作fsync超过20ms的时候,将会在zookeeper.out中输出一条warn日志。
这个目前zk的3.4.5和3.5版本有bug,在zoo.cfg中配置不生效。我的做法是在conf/java.env中添加java系统属性:

1
export JVMFLAGS=“-Dfsync.warningthresholdms=20 $JVMFLAGS”


http://www.ppmy.cn/embedded/154907.html

相关文章

Qiankun 微前端框架全面解析:架构、原理与最佳实践

Qiankun 微前端框架全面解析:架构、原理与最佳实践 随着前端应用的不断发展,单体前端项目在复杂度、维护成本和团队协作上面临越来越多的挑战。微前端(Micro Frontends)作为解决方案之一,可以帮助企业拆分前端应用&am…

Hadoop 和 Spark 的内存管理机制分析

💖 欢迎来到我的博客! 非常高兴能在这里与您相遇。在这里,您不仅能获得有趣的技术分享,还能感受到轻松愉快的氛围。无论您是编程新手,还是资深开发者,都能在这里找到属于您的知识宝藏,学习和成长…

走进数据中心:了解定义、作用、分类,洞悉云计算大数据时代发展新趋势

一、数据中心的定义、作用及分类 数据中心是一整套复杂的设施,它不仅包括计算机系统和其他与之配套的网络、存储等设备,还包含冗余的数据通信连接设备、环境控制设备、监控设备以及各种安全装置。Google在其发布的《The Datacenter as a Computer》一书…

嵌入式入门Day42

C Day5 作业 作业 //main.cpp #include <iostream> #include "mystring.h"using namespace std;int main() {mystring stra("Hello");mystring strb;cin >> strb;cout << strb << endl;strb stra;cout << strb << e…

vue的生命周期

生命周期是指一个对象、组件或应用程序从创建到销毁、从初始化到终止的整个过程。 Vue 2 生命周期钩子 beforeCreate实例初始化之后&#xff0c;数据观测和事件配置之前。created实例创建完成后&#xff0c;数据观测、属性和方法的运算、事件/回调配置之后。beforeMount挂载开…

1.6 从 GPT-1 到 GPT-3.5:一路的风云变幻

从 GPT-1 到 GPT-3.5:一路的风云变幻 人工智能的进步一直是科技领域的一个重要话题,而在自然语言处理(NLP)领域,GPT(Generative Pre-trained Transformer)系列模型的发布,标志着一个又一个技术突破。从2018年发布的 GPT-1 到2022年推出的 GPT-3.5,OpenAI 的每一次更新…

【MySQL】环境变量配置

环境变量英文名SystemRoot&#xff0c;直译为“系统总&#xff08;根&#xff09;目录"&#xff0c;主要指明操作系统的重要目录在哪里。那么配置MySQL的环境变量&#xff0c;就是在程序运行时&#xff0c;告诉操作系统你的MySQL目录位置。 复制MySQL安装目录&#xff1a;…

C++11特性简述

Lambda表达式 捕获列表参数列表&#xff08;没有参数可以省略&#xff09;返回值函数体 类成员函数中定义lambda表达式可以捕获this指针&#xff0c;但是没有捕获函数参数的时候捕获this也不能访问函数参数 自动推导返回值&#xff1a;必须是唯一形式的返回值类型才能推导出来&…