手把手带你跑通目标检测中的DINO-main模型

news/2024/11/19 19:27:03/

源码地址：https://github.com/IDEA-Research/DINO

我是在Ubuntu中的Pycharm上面跑的，

首先配置一个新的环境，环境名字就命名为DINO（方法很简单，这里我就不阐述了，不会的小伙伴去看看其他的博文），然后安装好对应的torch和cuda版本（注：cuda最低版本要求为11.0，其他的版本参考源码中的来）

配好新的环境之后，将模型导入至新的环境中，然后安装其他需要的包。

一键安装：pip install -r requirements.txt（如果在安装过程中，有些包安装不上去，可以试试降低包的版本，我当时就是头铁，没注意包的版本问题）

包安装好之后，开始编译环境。在Pycharm中打开终端，然后进入到 models/dino/ops 这个文件目录下： cd models/dino/ops

然后输入： python setup.py build install

输入回车之后可能会出现报错情况：error: could not create 'build': Permission denied，

解决办法：sudo chmod -R 777 xxxxxx（xxxxxx指的是当前的build所在的文件夹的名称，然后输入密码，赋予权限，再次运行就不会报错了）

接着输入 python test.py

环境编译好了，接下来就是准备数据集了，用的是COCO2017数据集，直接去COCO官网上下载（地址：COCO - Common Objects in Context）按照模型的要求下载相对应的数据集，然后新建一个文件夹命名为：COCODIR，之后按照下图的要求依次放入进去。

数据集也准备好了，接下来就直接开run了！

直接在终端输入命令：bash scripts/DINO_train.sh /path/to/your/COCODIR

注意：要找到自己源码中COCODIR这个文件夹的路径，把 path/to/your 换成自己的路径。

然后就开始训练了！！！

下面说一下我在调通的过程中，碰到的一些常见问题：

问题一：报错 Import MultiScaleDeformableAttention as MSDA，No Module named MultiScaleDeformableAttention

解决办法：检查一下自己的cuda版本，看是否是低于11.0，如果cuda版本没问题的话就去models/dino/ops 路径下找到make.sh文件，直接编译它就可以。

编译方法：直接在终端输入 sh make.sh 命令。

问题二：在模型运行的时候出现报错： cuda is not available

解决办法：在终端输入sudo apt install nvidia-cuda-toolkit 。