错误报告:WebSocket 设备连接断开处理问题

devtools/2025/2/12 15:19:35/

错误报告:WebSocket 设备连接断开处理问题

项目背景

  1. 设备通过自启动的客户端连接到服务器,服务器将设备的 mac_address 和设备信息存入 Redis。
  2. 前端通过 Redis 接口查看设备信息并展示。

问题描述

设备连接到服务器后,前端无法立即看到设备信息。

发现的问题

  1. 设备连接后直接关机:在设备关机的情况下,服务器未及时收到断开连接的信号。由于 TCP Keep-Alive 的机制,测试中发现需要约 45 秒才会自动触发断开连接。
  2. 设备重新开机:设备重新启动后重新连接服务器。此时服务器加速了断开连接的触发(约 28 秒),但是服务器错误地删除了 Redis 中的记录。实际上,设备的连接并没有真正断开。通过向 Redis 中重新写入相同的信息,验证了 Redis 中的设备信息并未真正丢失。

目前的处理方式

为了应对上述问题,做了以下改进:

  1. 增加了校验机制:当服务器接收到断开连接时,增加了对 Redis 中存储的设备信息的检查。
  2. 心跳机制:为了更好地管理连接,预留了一个 PingPong 心跳机制,用于检测连接的有效性。由于设备端版本原因,并不全支持 pong 回应,暂时未启用这个机制,预留了一个 heartbeat ping 的函数,但它不响应 pong,后续有需要可以进一步完善。

处理方法

disconnect 方法中增加了校验机制,以确保只有在正确的条件下删除 Redis 中的设备信息。

@staticmethod
async def disconnect(ws: WebSocket, client: AsyncRedis, mac_address: str) -> None:remote_ip, remote_port = ws.clientcurrent_client_info = await client.hget(settings.REDIS_WS_CLIENT_KEY, mac_address)current_client_info = json.loads(current_client_info)if current_client_info:logger.info(f"WS_LIFESPAN: {mac_address} 正在清除状态")# 如果没有 remote port,那么说明这个链接异常,可以直接清理current_remote_port = current_client_info.get("remote_port", remote_port)# 如果旧的 ws client port 等于现在的 port,说明存储的信息仍然是当前链接的信息,可以删除if current_remote_port == remote_port:await WsService.remove_client(client, mac_address)logger.info(f"WS_LIFESPAN: {mac_address} 清除状态完成")else:logger.info(f"WS_LIFESPAN: {mac_address} 当前连接已被新连接替代,跳过清理")else:logger.info(f"WS_LIFESPAN: {mac_address} 未在 Redis 中找到客户端记录,跳过清理")

预留的 heartbeat 如下

    async def send_heartbeat():"""心跳检测- 目前只在服务器单方面检测- 如果 ping 发送失败,则认为断线,关闭连接"""while True:await asyncio.sleep(PING_INTERVAL)try:ping_msg = {"action": "ping", "timestamp": get_current_datetime_str()}await ws.send_text(json.dumps(ping_msg))logger.info(f"WS_LIFESPAN: {mac_address} 发送ping")except Exception as e:logger.error(f"WS_LIFESPAN: {mac_address} 发送ping消息失败,连接可能已断开: {str(e)}")break# 启动心跳检测任务# heartbeat_task = asyncio.create_task(send_heartbeat())

在 client 端中预留了一个 pong 机制如下 client >= 0.2.1

async def handle_ping(ws: WebSocketClientProtocol, **params):"""处理 Ping,返回 Pong"""pong_msg = {"action": "pong"}await ws.send(json.dumps(pong_msg))

解决方案

  1. TCP Keep-Alive 设置可以考虑调整 TCP Keep-Alive 设置,以加快服务器检测到设备断开的速度,从而减少等待时间。 这会影响整个设备的 TCP Keep Alive,尽量不进行
  2. 心跳机制:进一步完善 PingPong 心跳机制,确保定时检查连接是否有效。如果检测到设备失去连接,可以更快地清除 Redis 中的记录。
  3. 断开连接的逻辑加强:在断开连接的逻辑中增加更多的校验,确保只有当设备断开并且确实不再连接时才从 Redis 中移除其信息。

总结

通过对 WebSocket 断开连接的处理逻辑进行增强,增加了对 Redis 存储的校验机制,可以有效避免由于设备重新启动时,错误地删除 Redis 中的设备信息。此外,心跳机制的加入也进一步提升了连接的管理效率。


http://www.ppmy.cn/devtools/158240.html

相关文章

《Peephole LSTM:窥视孔连接如何开启性能提升之门》

在深度学习的领域中,长短期记忆网络(LSTM)以其出色的序列数据处理能力而备受瞩目。而Peephole LSTM作为LSTM的一种重要变体,通过引入窥视孔连接,进一步提升了模型的性能。那么,窥视孔连接究竟是如何发挥作用…

字符设备驱动开发

驱动就是获取外设、传感器数据和控制外设。数据会提交给应用程序。 Linux 驱动编译既要编写一个驱动,还要编写一个简单的测试应用程序。 而单片机下驱动和应用都是放在一个文件里,也就是杂在一块。而 Linux 则是分开了。 一、字符设备驱动开发流程 Lin…

[golang][MAC]Go环境搭建+VsCode配置

一、go环境搭建 1.1 安装SDK 1、下载go官方SDK 官方:go 官方地址 中文:go 中文社区 根据你的设备下载对应的安装包: 2、打开压缩包,根据引导一路下一步安装。 3、检测安装是否完成打开终端,输入: go ve…

机器学习(李宏毅)——self-Attention

一、前言 本文章作为学习2023年《李宏毅机器学习课程》的笔记,感谢台湾大学李宏毅教授的课程,respect!!! 二、大纲 何为self-Attention?原理剖析self-Attention VS CNN、RNN、GNN 三、何为self-Attenti…

Express 路由

在构建 Web 应用程序时,路由是处理不同 URL 请求的核心机制。Express.js 是 Node.js 上最流行的轻量级框架之一,它简化了路由的定义和管理过程。本文将深入介绍如何使用 Express 进行路由配置,帮助你快速上手并掌握其核心概念。 什么是路由&…

重庆西站公路桥梁自动化监测

1.项目概述 重庆西站属于渝黔铁路的配套工程,是承担兰渝、川黔、渝昆等多条铁路的特级客运站,未来重庆铁路三大客运站之一。作为我国西部地区规模最大的火车站、重庆西站于2014年在沙坪坝区上桥开工建设,该站东临内环高速,西靠中梁山&#x…

《qt open3d中添加最远点采样》

qt open3d中添加最远点采样 效果展示二、流程三、代码效果展示 二、流程 创建动作,链接到槽函数,并把动作放置菜单栏 参照前文 三、代码 1、槽函数实现 void on_actionFilterFarthestDownSample_triggered();void MainWindow::on_

二分算法篇:二分答案法的巧妙应用

二分算法篇:二分答案法的巧妙应用 那么看到二分这两个字想必我们一定非常熟悉,那么在大学期间的c语言的教学中会专门讲解二分查找,那么我们来简单回顾一下二分查找算法,我们知道二分查找是在一个有序的序列中寻找一个数在这个序列…