Nginx+KeepAlived高可用负载均衡集群的部署

一.KeepAlived补充知识

1.一个合格的群集应该具备的特点

2.健康检查（探针）常用的工作方式

3.相关面试问题

问题1

问题2

二.Keepealived脑裂现象

1.现象

2.原因

硬件原因

运用配置原因

3.解决

4.预防

方法1

方法2

方法3

方法4

三.实验部署

nginx%E5%81%9A%E5%88%9D%E5%A7%8B%E5%8C%96%E6%93%8D%E4%BD%9C%E5%B9%B6%E5%AE%89%E8%A3%85nginx-toc" style="margin-left:40px;">1.两台nginx做初始化操作并安装nginx

2.四层反向代理配置

2.1.修改主调度器配置

2.2.修改备调度器配置

nginx%E6%9C%8D%E5%8A%A1%E5%99%A8-toc" style="margin-left:80px;">2.3.浏览器测试两台nginx服务器

3.配置高可用

nginx%E8%BF%90%E8%A1%8C%E7%8A%B6%E6%80%81%E8%84%9A%E6%9C%AC-toc" style="margin-left:40px;">4.准备检查nginx运行状态脚本

4.1.主服务器

4.2.备服务器

5.开启keepalived服务并测试

5.1.分别开启主备两台服务器keepalived

5.2.浏览器测试

一.KeepAlived补充知识

1.一个合格的群集应该具备的特点

负载均衡用于提高群集的性能 LVS Nginx HAProxy SLB F5
健康检查（探针）针对于调度器和节点服务器 Keepalived Heartbeat
故障转移通过VIP漂移实现主备切换 VRRP 脚本

2.健康检查（探针）常用的工作方式

发送心跳消息 vrrp报文 ping/pong
TCP端口检查向目标主机的 IP:PORT 发起TCP连接请求，如果TCP连接三次握手成功则认为健康检查正常，否则认为健康检查异常
HTTP URL检查向目标主机的URL路径（比如http://IP:PORT/URI路径）发起 HTTP GET 请求方法
如果响应消息的状态码为 2XX 或 3XX，则认为健康检查正常
如果响应消息的状态码为 4XX 或 5XX，则认为健康检查异常

3.相关面试问题

问题1

Keepalived通过什么判断哪台主机为主服务器,通过什么方式配置浮动IP

答案

Keepalived首先做初始化先检查state状态，master为主服务器，backup为备服务器
然后再对比所有服务器的priority，谁的优先级高谁是最终的主服务
优先级高的服务器会通过ip命令为自己的电脑配置一个提前定义好的浮动IP地址

问题2

keepalived的抢占与非抢占模式

答案

抢占模式即MASTER从故障中恢复后，会将VIP从BACKUP节点中抢占过来。非抢占模式即MASTER恢复后不抢占BACKUP升级为MASTER后的VIP
非抢占式俩节点state必须为bakcup，且必须配置nopreempt

注意：这样配置后，我们要注意启动服务的顺序，优先启动的获取master权限，与优先级没有关系了

二.Keepealived脑裂现象

1.现象

主服务器和备服务器都同时拥有相同的VIP

在"双机热备"高可用（HA）系统中，当联系两个节点的"心跳线"断开时(即两个节点断开联系时)，

本来为一个整体、动作协调的HA系统，就分裂成为两个独立的节点(即两个独立的个体)。由于相互

失去了联系，都以为是对方出了故障，此时备用调度器会运转起来争做主调度器的工作，而主调度

器依然保持着调度工作，两个调度的同时运转导致整个系统的紊乱。就会发生严重后果：

共享资源被瓜分、两边"服务"都起不来
或者两边"服务"都起来了，但同时读写"共享存储"，导致数据损坏（常见如数据库轮询着的联机日志出错）

2.原因

因为主服务器和备服务器的通信中断，导致备服务器无法收到主服务器发送的VRRP报文，备服务

器误认为主服务器已经故障了并通过ip命令生成VIP

硬件原因

高可用服务器各节点之间心跳线链路发生故障，导致无法正常通信
因心跳线坏了（包括断了，老化）
因网卡及相关驱动坏了，ip配置及冲突问题（网卡直连）
因心跳线间连接的设备故障（网卡及交换机）
因仲裁的机器出问题（采用仲裁的方案）

运用配置原因

高可用服务器上开启了iptables防火墙阻挡了心跳消息传输
高可用服务器上心跳网卡地址等信息配置不正确，导致发送心跳失败
其他服务配置不当等原因，如心跳方式不同，心跳广插冲突、软件Bug等
Keepalived配置里同一VRRP实例如果virtual_router_id两端参数配置不一致也会导致裂脑问题发生

3.解决

关闭主服务器或备服务器其中一个的keepalived服务

4.预防

方法1

如果是系统防火墙导致，则关闭防火墙或添加防火墙规则放通VRRP组播地址(224.0.0.18)的传输

方法2

如果是主备服务器之间的通信链路中断导致，则可以在主备服务器之间添加双链路通信

方法3

在主服务器使用脚本定时判断与备服务器通信链路是否中断，如果判断是主备服务器之间的链接中

断则自行关闭主服务器上的keepalived服务

方法4

利用第三方应用或监控系统检测是否发生了脑裂故障现象，如果确认发生了脑裂故障则通过第三方

应用或监控系统来关闭主服务器或备服务器其中一个的keepalived服务

三.实验部署

此实验基于以上 LVS+KeepAlived高可用负载均衡群集的部署实验为基础，将两台调度器改为

nginx服务器，其余不变

准备虚拟机

192.168.80.104（nginx服务器四层代理）

192.168.80.105（nginx服务器四层代理）

192.168.80.106（web1）

192.168.80.107（web2）

192.168.80.108（nfs共享存储）

nginx%E5%81%9A%E5%88%9D%E5%A7%8B%E5%8C%96%E6%93%8D%E4%BD%9C%E5%B9%B6%E5%AE%89%E8%A3%85nginx">1.两台nginx做初始化操作并安装nginx

nginx镜像网址：

2.四层反向代理配置

2.1.修改主调度器配置

stream {upstream backends {server 192.168.80.106:80;server 192.168.80.107:80;}server {listen 8080;proxy_pass backends;}
}

2.2.修改备调度器配置

将主调度器的nginx.conf复制过来

nginx%E6%9C%8D%E5%8A%A1%E5%99%A8">2.3.浏览器测试两台nginx服务器

192.168.80.104/192.168.80.105

3.配置高可用

两台nginx服务器安装keepalived

nginx%E8%BF%90%E8%A1%8C%E7%8A%B6%E6%80%81%E8%84%9A%E6%9C%AC">4.准备检查nginx运行状态脚本

4.1.主服务器

#!/bin/bashif ! killall -0 nginx &> /dev/nullthensystemctl stop keepalived
fi