实现rolabelimg对于dota格式文件的直接加载和保存

server/2025/2/22 22:02:17/

在本篇博客中,我们将讲解如何修改roLabelImg.py文件,使其能够直接加载和保存Dota格式的标注文件(txt)以替换掉复杂的xml文件。通过对源代码的修改,我们将实现支持加载并保存Dota格式标注数据,以便与roLabelImg的图形界面进行配合。

1. 修改roLabelImg.py中的函数

在原本的roLabelImg.py中,首先,我们需要替换PascalVocReaderDotaReader,这样我们就可以通过自定义的DotaReader类来解析Dota格式的标注数据。

python"># 修改前
from pascal_voc_io import PascalVocReader# 修改后
from pascal_voc_io import PascalVocReader, DotaReader

接着,我们需要更新读取标注的代码。在原有的代码中,使用的是PascalVocReader,现在我们需要将其替换为DotaReader来解析Dota格式的标注文件。

python"># 修改前
tVocParseReader = PascalVocReader(xmlPath)# 修改后
tVocParseReader = DotaReader(xmlPath)

在标注保存部分的代码中,我们将标注以Dota格式保存为txt文件,而不是Pascal VOC格式的xml文件。以下是代码的修改:

python"># 修改前
try:if self.usingPascalVocFormat is True:print('Img: ' + self.filePath + ' -> Its xml: ' + annotationFilePath)self.labelFile.savePascalVocFormat(annotationFilePath, shapes, self.filePath, self.imageData,self.lineColor.getRgb(), self.fillColor.getRgb())else:self.labelFile.save(annotationFilePath, shapes, self.filePath, self.imageData,self.lineColor.getRgb(), self.fillColor.getRgb())# 修改后
try:print('Img: ' + self.filePath + ' -> Its txt: ' + annotationFilePath)with open(annotationFilePath, 'w') as f:for shape in shapes:points = shape['points']label = shape['label']difficult = 0# 将4个点坐标 + 标签 + 难度级别写入文件line = " ".join([f"{p[0]} {p[1]}" for p in points]) + f" {label} {difficult}\n"f.write(line)return True
2. 修改pascal_voc_io.py中的代码

我们需要在pascal_voc_io.py中新增DotaReader类,它负责解析Dota格式的标注文件并将其转换为roLabelImg可以识别的格式。

DotaReader类的实现

首先,我们实现一个辅助函数polygon_to_rotated_box,该函数用于将Dota格式中的四个点坐标转换为一个旋转框,便于后续处理。

python">def polygon_to_rotated_box(polygon):"""将8参数多边形(四个点的坐标)转换为5参数旋转框。"""# 将多边形顶点转换为numpy数组poly_points = np.array(polygon, dtype=np.float32).reshape(-1, 2)# 获取最小外接矩形rect = cv2.minAreaRect(poly_points)(cx, cy), (w, h), theta = rect# OpenCV返回的角度是负角度,需要转换成正角度if w < h:w, h = h, wtheta += 90theta = np.deg2rad(theta)  # 将角度转换为弧度return cx, cy, w, h, theta

接着,我们实现DotaReader类,它负责读取Dota格式的txt标注文件并将每个标注信息解析为相应的格式。

python">class DotaReader:def __init__(self, filepath):self.shapes = []self.filepath = filepathself.parseDotaFile()self.verified = Falsedef getShapes(self):return self.shapesdef addShape(self, label, points, difficult):# 将每个标注转换为相应的四个角点(顺时针或逆时针)cx, cy, w, h, theta = polygon_to_rotated_box(points)self.shapes.append((label, points, theta, True, None, None, difficult))def parseDotaFile(self):assert self.filepath.endswith('.txt'), "Unsupport file format"print(self.filepath)with open(self.filepath, 'r') as file:lines = file.readlines()for line in lines:parts = line.strip().split()if len(parts) == 9:# 提取四个点坐标(8个数值)x1, y1, x2, y2, x3, y3, x4, y4 = map(float, parts[:8])label = parts[8]  # 标签difficult = 0  # 难度标记,0 或 1# 将四个坐标点按顺时针顺序排列points = [(x1, y1), (x2, y2), (x3, y3), (x4, y4)]# 添加标注信息到shapesself.addShape(label, points, difficult)elif len(parts) == 10:# 提取四个点坐标(8个数值)x1, y1, x2, y2, x3, y3, x4, y4 = map(float, parts[:8])label = parts[8]  # 标签difficult = int(parts[9])  # 难度标记,0 或 1# 将四个坐标点按顺时针顺序排列points = [(x1, y1), (x2, y2), (x3, y3), (x4, y4)]# 添加标注信息到shapesself.addShape(label, points, difficult)else:continue

3. 总结

通过以上修改,我们成功实现了roLabelImg支持Dota格式文件的加载和保存。在roLabelImg.py中,我们通过替换PascalVocReaderDotaReader,使得程序能够读取Dota格式的txt文件,并将标注信息以txt格式保存。通过修改pascal_voc_io.py文件中的代码,我们新增了DotaReader类,它能够处理Dota格式的标注数据,并将其转换为可供roLabelImg使用的格式。

这些修改为我们在使用roLabelImg进行图像标注时提供了更多灵活性,特别是对于Dota数据集的支持。

---

希望这篇博客对您有所帮助,如果您喜欢这篇文章,请点赞或关注,我会持续分享更多实用的 目标检测工具 技术内容!

---


http://www.ppmy.cn/server/169948.html

相关文章

Redis 中列表(List)常见命令详解

列表&#xff08;List&#xff09;常见命令详解 在 Redis 中&#xff0c;列表&#xff08;List&#xff09;是一种线性数据结构&#xff0c;允许在列表的头部和尾部进行高效的元素添加和删除操作。列表中的元素是有序的&#xff0c;并且可以重复。以下是 Redis 中列表相关命令…

ICRA2024:CoLRIO,用于机器人群体的激光雷达测距-惯性集中状态估计

文章目录 摘要I. 引言II. 相关工作A. 激光雷达惯性里程计B. 多机器人定位和映射 III. 相对状态估计框架A. 单个机器人前端B. 群体定位 IV. 实验V. 结论 摘要 摘要 —— 使用不同异构传感器进行协作状态估计对于在无GPS环境中运行的机器人群体来说是一个基本前提&#xff0c;这…

【论文精读】VLM-AD:通过视觉-语言模型监督实现端到端自动驾驶

论文地址&#xff1a; VLM-AD: End-to-End Autonomous Driving through Vision-Language Model Supervision 摘要 人类驾驶员依赖常识推理来应对复杂多变的真实世界驾驶场景。现有的端到端&#xff08;E2E&#xff09;自动驾驶&#xff08;AD&#xff09;模型通常被优化以模仿…

JMeter 中实现 100 个用户在 3 秒内并发登录

在 JMeter 中实现 100 个用户在 3 秒内并发登录,需要合理配置线程组、定时器和测试逻辑。以下是具体步骤: 1. 创建测试计划 打开 JMeter。右键点击“Test Plan”,选择 Add > Threads (Users) > Thread Group。 : 设置为 100(模拟 100 个用户)。 : 设置为 3

【JMeter使用-2】JMeter中Java Request采样器的使用指南

Apache JMeter 是一款功能强大的性能测试工具&#xff0c;支持多种协议和测试场景。除了内置的采样器&#xff08;如HTTP请求、FTP请求等&#xff09;&#xff0c;JMeter还允许通过 Java Request采样器 调用自定义的Java代码&#xff0c;从而实现更复杂的测试逻辑。本文将详细介…

Oracle RAC数据库单节点轮流重启

0、sqlplus / as sysdba 备份参数文件 create pfile/home/oracle/pfile.ora from spfile; 备份控制文件 Alter database backup controlfile to trace; 1、关闭两节点的监听&#xff1b; 2、操作系统层面kill掉所有LOCALNO的所有进程&#xff0c;即&#xff1a;连接会话。 p…

标准解读|汽车信息安全领域发布三项强制性国家标准,汽车测评领域新变革

为满足我国智能网联汽车行业管理需求、产业发展和技术进步需要&#xff0c;自2019年起我国陆续启动智能网联汽车领域相关强制性国家标准制定工作。8月23日&#xff0c;三项强制性国家标准GB 44495—2024《汽车整车信息安全技术要求》、GB 44496—2024《汽车软件升级通用技术要求…

【Alertmanager】alertmanager告警多种通知方式--企业微信告警、钉钉告警、电话和短信告警

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全…