手把手带你跑通目标检测中的DINO-main模型

news/2024/11/19 19:27:03/

源码地址:https://github.com/IDEA-Research/DINO

我是在Ubuntu中的Pycharm上面跑的,

首先配置一个新的环境,环境名字就命名为DINO(方法很简单,这里我就不阐述了,不会的小伙伴去看看其他的博文),然后安装好对应的torch和cuda版本(注:cuda最低版本要求为11.0,其他的版本参考源码中的来)

配好新的环境之后,将模型导入至新的环境中,然后安装其他需要的包。

一键安装:pip install -r requirements.txt(如果在安装过程中,有些包安装不上去,可以试试降低包的版本,我当时就是头铁,没注意包的版本问题)  

包安装好之后,开始编译环境。在Pycharm中打开终端,然后进入到 models/dino/ops 这个文件目录下: cd models/dino/ops   

然后输入:  python setup.py build install 

输入回车之后可能会出现报错情况:error: could not create 'build': Permission denied,

解决办法:sudo chmod -R 777 xxxxxx(xxxxxx指的是当前的build所在的文件夹的名称,然后输入密码,赋予权限,再次运行就不会报错了)

接着输入 python test.py

环境编译好了,接下来就是准备数据集了,用的是COCO2017数据集,直接去COCO官网上下载(地址:COCO - Common Objects in Context)按照模型的要求下载相对应的数据集,然后新建一个文件夹命名为:COCODIR,之后按照下图的要求依次放入进去。

数据集也准备好了,接下来就直接开run了!

直接在终端输入命令:bash scripts/DINO_train.sh /path/to/your/COCODIR

注意:要找到自己源码中COCODIR这个文件夹的路径,把 path/to/your 换成自己的路径。

然后就开始训练了!!!

下面说一下我在调通的过程中,碰到的一些常见问题:

问题一:报错 Import MultiScaleDeformableAttention as MSDA,No Module named MultiScaleDeformableAttention

解决办法:检查一下自己的cuda版本,看是否是低于11.0,如果cuda版本没问题的话就去models/dino/ops 路径下找到make.sh文件,直接编译它就可以。

编译方法:直接在终端输入 sh make.sh 命令 。

问题二:在模型运行的时候出现报错: cuda is not available

解决办法: 在终端输入sudo apt install nvidia-cuda-toolkit 。


http://www.ppmy.cn/news/894683.html

相关文章

最强Zero-Shot视觉应用:Grounding DINO+Segment Anything+Stable Diffusion

借着Meta发布的Segment Anything视觉大模型,跟朋友们做了一个最强Zero-Shot视觉应用:最强的Zero-Shot检测器,最强的Zero-Shot分割器,最强的Zero-Shot生成器,三合一模型简称为Grounded-SAM。 代码地址如下: …

DINO:2022.3_SOTA_COCO_DETR

通过使用一个对比的方式为了去噪训练,一个混合的query选择方法为了anchor初始化,和一个向前看两次的方案为了box预测。 DINO在模型大小和数据大小上表现出良好的可扩展性,用SwinL backbone在Object365大数据集预训练,达到了COCO …

Grounding DINO: Marrying DINO with Grounded Pre-Training forOpen-Set Object Detection

Hello~大家好久不见,一直没时间在这里翻译论文了,最近在学GroundingDINO,强迫症的菜鸡就想先翻译成中文然后再慢慢啃....废话不多说了,因为时间关系,只翻译了关键内容,其他内容有时间再补充啦。 论文&…

Win系统使用DINO训练自己数据集

数据集 在工程主目录下创建一个coco文件夹,并修改main.py文件中的‘--coco_path’。 数据集目录: train2017用来训练,val2017用来验证。 test2017是为了训练得到模型之后,测试模型泛化性能的,有没有都可以。 annota…

DINO代码分析-自监督学习

​ 论文链接:https://arxiv.org/abs/2104.14294 代码链接:github仓库 本文目录 一、官方Readme预训练模型PyTorch Hub 上的预训练模型 训练文档DINO训练:多节点训练提升 DINO 性能:t-rex:ResNet-50 和其他卷积神经网络…

DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection翻译

点击下载 代码下载 摘要 我们提出了 DINO(是DETR with Improved deNoising anchOr boxes中的大写字母的缩写),一个目前最好的端到端的目标检测模型。 DINO通过在降噪训练上使用对比方法、锚框初始化的混合查询选择方法、盒子预测的前看两次方法,提高了…

自动驾驶遥控泊车RPA系统功能规范

目 录 1. 版本履历... 4 2. 文档使用范围... 4 3. 术语缩写... 4 4. 系统概述... 5 4.1 系统功能说明... 5 4.2 泊车状态说明... 6 5. 产品基本参数... 6 5.1控制器基本参数... 6 5.2全景摄像头基本参数... 7 5.3 超声波传感器基本参数... 7 …

自监督学习经典之作:DINO

自监督学习经典之作: DINO(self-distillation with no labels) Emerging Properties in Self-Supervised Vision Transformers 1、引言 一般来说ViT 并不像某些人预期的那样有吸引力:因为它们需要很多的计算资源,并且需要更多的训练数据,最…