【计算机视觉】工业表计读数（2）--表计检测

1. 简介

工业表计（如压力表、电表、气表等）在工控系统、能源管理等领域具有重要应用。然而，传统人工抄表不仅工作量大、效率低，而且容易产生数据误差。近年来，基于深度学习的目标检测方法在工业检测中展现出极大优势，其中YOLO（You Only Look Once）系列模型因其端到端的检测流程和实时性备受关注。本文以YOLO11为基础，构建了一套完整的表计检测系统，实现对表计区域的自动识别与裁剪，为后续的读数识别奠定基础。

2. 系统架构与实现方法

本系统主要分为两个模块：表计检测模型训练模块与检测后预测模块。下文分别介绍这两个模块的实现细节。

2.1 表计检测模型训练

在训练阶段，系统利用YOLO11模型对采集到的表计图像进行目标检测模型训练，主要步骤如下：

模型构建与权重加载
利用Ultralytics的YOLO库，根据自定义的配置文件（yolo11.yaml）构建模型，并加载预训练权重（yolo11n.pt）。

from ultralytics import YOLO
import warnings
warnings.filterwarnings("ignore")if __name__ == '__main__':# 模型配置文件与预训练权重路径yolo_yaml = "/root/cv/task_0/yolo_model/yolo11.yaml"yolo_pt = "/root/cv/task_0/yolo_model/yolo11n.pt"data_yaml = "/root/autodl-tmp/meter_data/meter_detect/dataset.yaml"# 构建模型并加载预训练权重model = YOLO(yolo_yaml)model.load(yolo_pt)# 开始训练，设置训练数据、迭代次数及图像尺寸results = model.train(data=data_yaml, epochs=200, imgsz=640)

以上代码展示了如何通过加载模型配置与权重，利用自定义数据集进行200个epoch的训练。数据集的配置文件中包含了表计的标注信息，确保模型能够在多样化环境下学习到稳定的表计特征。

数据预处理与增强
为了提升模型在复杂场景下的泛化能力，对原始数据进行了旋转、缩放、模糊等数据增强操作，增强模型对光照、遮挡等干扰因素的鲁棒性。

2.2 表计检测预测模块

在预测阶段，训练好的模型用于对新的表计图像进行检测，主要流程包括加载模型、对输入图像进行检测、裁剪出目标区域及保存检测结果。代码实现如下：

import cv2
import numpy as np
import os
import matplotlib.pyplot as plt
from ultralytics import YOLO# 加载训练好的自定义模型
model = YOLO('/root/cv/task_0/runs/detect/train5/weights/best.pt')# 指定保存预测结果的目录
output_dir = '/root/cv/test/task_0_result'
os.makedirs(output_dir, exist_ok=True)# 对单张图片进行预测
image_path = '/root/cv/test/detected_meter/test.jpg'
results = model(image_path, conf=0.60, save=False)# 读取原始图像并转换为RGB格式（用于显示）
frame = cv2.imread(image_path)
frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)# 遍历检测结果，提取目标边界框并保存目标图像
for idx, result in enumerate(results):# 获取检测结果中的边界框数据boxes = result.boxes.cpu().numpy()for i, box in enumerate(boxes.data):l, t, r, b = box[:4].astype(np.int32)  # 左、上、右、下坐标conf, id = box[4:]  # 置信度与类别id = int(id)# 裁剪出目标区域图像target_image = frame[t:b, l:r]target_image_path = os.path.join(output_dir, f"target_{idx+1}_{i+1}.jpg")cv2.imwrite(target_image_path, target_image)# 在原图上绘制检测边界框和类别置信度cv2.rectangle(frame_rgb, (l, t), (r, b), (0, 0, 255), 2)cv2.putText(frame_rgb, f"{model.names[id]} {conf * 100:.1f}%", (l, t - 10),cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)# 显示检测结果图像
plt.imshow(frame_rgb)
plt.show()# 保存整体检测结果图像
image_name = image_path.split("/")[-1]
output_image_path = os.path.join(output_dir, image_name)
cv2.imwrite(output_image_path, cv2.cvtColor(frame_rgb, cv2.COLOR_RGB2BGR))
print(f"Prediction result saved to: {output_image_path}")