水污染水质检测数据集 2400张 水污染 带标注 voc yolo 4类

news/2024/10/5 0:34:03/

 

水污染水质检测数据集 2400张 水污染 带标注 voc yolo

水污染水质检测数据集

名称

水污染水质检测数据集 (Water Pollution Detection Dataset)

规模
  • 图像数量:2487张图像。
  • 类别:4种水质类别。
  • 标注个数:2489个标注。
数据划分
  • 训练集 (Train):通常占总数据的80%左右,约1989张图像。
  • 验证集 (Validation):通常占总数据的20%左右,约500张图像。
类别和数量
  • clean:587张图像,589个标注。
  • turbid:587张图像,587个标注。
  • pollute:746张图像,746个标注。
  • normal:567张图像,567个标注。
数据特点
  • 高质量与高分辨率:所有图像均为高分辨率,适合进行详细的目标检测任务。
  • 多样性和复杂性:图像覆盖了各种水质情况,增加了模型的泛化能力。
  • 详尽标注:每个图像都附有准确的边界框标注信息,确保了训练数据的质量。
应用领域
  • 环境监测:帮助环保部门及时发现并追踪水源污染情况。
  • 水资源管理:为水资源管理和保护提供决策依据。
  • 科学研究:为水污染治理和环境保护研究提供基础数据支持。
1. 安装依赖库

首先,确保安装了必要的依赖库。可以在项目目录中的requirements.txt文件中列出这些依赖库,然后运行以下命令进行安装:

pip install -r requirements.txt

requirements.txt 文件内容示例:

 
torch==1.10.0
torchvision==0.11.1
pandas==1.3.4
cv2
albumentations==1.1.0
2. 创建数据集

定义一个自定义的数据集类,并创建数据加载器。

import os
import pandas as pd
import cv2
from torch.utils.data import Dataset, DataLoader
from torchvision.transforms import Compose, ToTensor, Normalize, Resize
from albumentations import HorizontalFlip, RandomBrightnessContrast, ShiftScaleRotate, BboxFromMasks, BBoxFormatPASCAL
from albumentations.pytorch import ToTensorV2# 自定义数据集类
class WaterPollutionDataset(Dataset):def __init__(self, data_root, annotations_file, transforms=None):self.data_root = data_rootself.annotations = pd.read_csv(annotations_file)self.transforms = transformsdef __len__(self):return len(self.annotations)def __getitem__(self, idx):img_path = os.path.join(self.data_root, self.annotations.iloc[idx, 0])image = cv2.imread(img_path)bboxes = self.annotations.iloc[idx, 1:].values.reshape(-1, 4)  # bounding box coordinateslabels = self.annotations.columns[1:]if self.transforms:augmented = self.transforms(image=image, bboxes=bboxes)image = augmented['image']bboxes = augmented['bboxes']return image, bboxes, labels# 图像预处理
def get_transforms():"""构建预处理函数"""_transform = [Resize(height=416, width=416, interpolation=cv2.INTER_LINEAR),HorizontalFlip(p=0.5),RandomBrightnessContrast(p=0.2),ShiftScaleRotate(p=0.5, shift_limit=0.0625, scale_limit=0.2, rotate_limit=15),Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),ToTensorV2(),BboxFromMasks(format=BBoxFormatPASCAL)]return Compose(_transform)# 创建数据加载器
train_dataset = WaterPollutionDataset(data_root='path_to_your_data_directory',annotations_file='path_to_your_annotations.csv',transforms=get_transforms()
)
val_dataset = WaterPollutionDataset(data_root='path_to_your_data_directory',annotations_file='path_to_your_annotations.csv',transforms=get_transforms()
)train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True, num_workers=4)
val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False, num_workers=4)
3. 训练YOLOv5模型

使用YOLOv5进行训练。

!git clone https://github.com/ultralytics/yolov5  # 下载YOLOv5代码仓库
cd yolov5# 使用YOLOv5训练模型
python train.py --weights yolov5s.pt --data path_to_your_data.yaml --name water_pollution_detection --img 416 --batch 16 --epochs 100 --device 0
  • 数据配置文件:创建一个名为data.yaml的数据配置文件,其中包含训练和验证数据集的信息。
train: path_to_your_train_images
val: path_to_your_val_images
nc: 4  # 类别数量
names: [clean, turbid, pollute, normal]
4. 调整模型
  • 超参数调整:根据实际情况调整模型的超参数,例如学习率、批大小等。
  • 数据增强:增加数据增强策略,如旋转、缩放、


http://www.ppmy.cn/news/1534666.html

相关文章

网页前端开发之Javascript入门篇(4/9):循环控制

Javascript循环控制 什么是循环控制? 答:其概念跟 Python教程 介绍的一样,只是语法上有所变化。 参考流程图如下: 其对应语法: var i 0; // 设置起始值 var minutes 15; // 设置结束值(15分钟…

以旅游购物贸易方式报关出口的货物是什么意思

旅游购物贸易方式的定义 ‌旅游购物贸易‌是指国内外旅游者通过旅游渠道,携带外币现钞、外币票据入境,到外汇指定银行兑换成人民币,并在特定区域进行商品采购、报检、报关后,将所购货物运回国内进行销售的贸易行为。这种贸易方式通…

【揭秘测绘艺术】从基础到法律,绘制地球的智慧蓝图

在人类探索与塑造世界的征途中,有一门古老而又现代的科学默默发挥着基石作用——测绘。它不仅仅是地图的绘制,更是对地球空间信息的精准捕捉与智慧应用。今天,让我们一起走进测绘的世界,解码“测绘”与“基础测绘”的内涵&#xf…

10款物联网开源嵌入式操作系统对比分析

摘要 本文对目前市场上广受欢迎的10款物联网开源嵌入式操作系统进行了深度对比分析,包括Huawei LiteOS、RT-Thread、AliOS Things等。通过探讨这些操作系统的实时性、可扩展性、特点、运行要求、开发社区活跃度和应用领域等方面,帮助开发者更好地理解它…

记录一次病毒启动脚本

在第一次下载软件时,目录中配了一个使用说明,说是需要通过start.bat 这个文件来启动程序,而这个 start.bat 就是始作俑者: 病毒作者比较狡猾,其中start.bat 用记事本打开是乱码,但是可以通过将这个批处理…

MFC工控项目实例之十九手动测试界面输出信号切换

承接专栏《MFC工控项目实例之十八手动测试界面输入信号实时检测》 根据板卡设置界面组合框选项设定的输出信号,通过读取文件中保存的键值,用单选按钮切换输出信号接通、关闭。 1、在Data_1.h文件中添加代码 CString COMB_Data_O_1[]{"夹紧",&…

TypeScript高级内容

完整总结 本节课涵盖了本地开发环境的搭建、前后端的基本交互、以及如何封装 Axios 以增强代码的安全性和可维护性。此外,我们还解决了在代码实现过程中可能遇到的一些常见问题。 1. 本地环境搭建 安装环境依赖:首先需要在本地安装 Node.js&#xff0…

详解调用钉钉AI助理消息API发送钉钉消息卡片给指定单聊用户

文章目录 前言准备工作1、在钉钉开发者后台创建一个钉钉企业内部应用;2、创建并保存好应用的appKey和appSecret,后面用于获取调用API的请求token;3、了解AI助理主动发送消息API:4、应用中配置好所需权限:4.1、权限点4.…