DVC数据集版本控制

news/2024/11/15 2:38:16/

1. 安装

pip install dvc

2. 初始化

mkdir dvc_example
cd dvc_example
git init
dvc init

3. 添加数据

cp -r coco/test2017 dvc_example
cp -r coco/val2017 dvc_example
dvc add test2017 val2017
git add *
git commit -m "dataset init"

4. 修改数据

4.1 删除文件夹下部分文件

rm -rf test2017/000000000001.jpg
dvc add test2017
git add *
git commit -m "rm test2017/000000000001.jpg"

4.2 删除整个文件夹(要连带删除文件夹名.dvc)

rm -rf test2017 test2017.dvc
git add *
git commit -m "rm test2017"

5. 回退版本

git logcommit 3688d03792dedac774a0e540de9a7e21f0f641e2 (HEAD)
Author: nickccnie <nickccnie@tencent.com>
Date:  Sun Mar 20 17:24:37 2022 +0800rm test2017/000000000001.jpgcommit 6b1a62d09fc45ac9d2125487095815c79ba38c1d (master)
Author: nickccnie <nickccnie@tencent.com>
Date:  Sun Mar 20 17:13:32 2022 +0800dataset initgit checkout 6b1a62d09fc45ac9d2125487095815c79ba38c1d
dvc checkout

6. 大致原理

DVC 是一个用 Python 编写的命令行工具。它模仿 Git 命令和工作流程,并且与 Git 协作使用。事实上,gitanddvc命令经常一个接一个地串联使用。DVC和Git各有分工,DVC进行对大文件的版本控制,Git进行对小文件的版本控制。

  • 使用dvc add test2017后,会给文件夹test2017创建一个test2017.dvc文件。文件.dvc是指向实际数据集大文件的小文本文件;
  • git add test2017.dvc 就可以通过实现对.dvc小文件的控制间接实现对数据集大文件test2017的版本控制;

7. 参考

  • Get Started: Data Versioning
  • 使用 Python 和 DVC 进行数据版本控制

http://www.ppmy.cn/news/910479.html

相关文章

windows下dvc的使用(data version control)

新建文件夹 : basic 在文件夹中打开terminal&#xff0c;初始化git git init安装 pip install dvc初始化dvc dvc init新建文件夹data mkdir data从dvc官方github获取demo数据源头&#xff0c;获取方式是通过http dvc get https://github.com/iterative/dataset-registry …

快速入门DVC(二):安装及ML项目初始化

在上一篇文章快速入门DVC&#xff08;一&#xff09;&#xff1a;简介中概述了 DVC &#xff0c;DVC&#xff08;数据版本控制&#xff09;是一种数据和机器学习实验管理工具&#xff0c;它有效利用了您已经非常熟悉的现有工程工具集&#xff08;如Git、CI/CD 等&#xff09;。…

深度学习视频压缩1—DVC: An End-to-end Deep Video Compression Framework

本文是第一篇端到端使用神经网络来进行视频压缩的论文&#xff0c; github地址&#xff1a;GitHub - GuoLusjtu/DVC: DVC: An End-to-end Deep Video Compression Framework, CVPR 2019 (Oral) 论文地址&#xff1a;https://arxiv.org/pdf/1812.00101.pdf 各个领域的第一篇&…

PA-DVC-D24-1000 PA-SVC-D24-1500最大输出电流可调比例放大器

控制不带电气位移反馈的单双电磁铁比例线圈; 输入电压为差动输入; 高精度&#xff0c;低温度漂移; PWM调制&#xff0c;负反馈恒流控制; 非对称斜坡时间&#xff08;上升和下降时间独立可调);调制频率可调; 共信号地和电源地。 保护电路齐全&#xff08;电源反接保护&…

论文笔记24 -- (视频压缩)【CVPR2019】DVC: An End-to-end Deep Video Compression Framework

《DVC: An End-to-end Deep Video Compression Framework》 论文&#xff1a;点这里 原作代码&#xff1a;点这里 TensorFlow开源实现&#xff1a;OpenDVC Guo Lu, Wanli Ouyang, Dong Xu, Xiaoyun Zhang, Chunlei Cai, Zhiyong Gao CVPR 2019 (Oral) DVC是首个端到端的深度学…

Python 和 DVC 进行 git 版本控制

大家好&#xff0c;我是Mr数据杨&#xff0c;设想我们正准备上演一出《三国演义》&#xff0c;需要设置工作环境。就像古代的诸侯需要配置自己的军队和物资。在数据的世界里需要准备数据和代码&#xff0c;这就如同筹备兵马和粮草。 跟踪文件并上传&#xff0c;就像各诸侯的斥…

DVCS

http://www.idnovo.com.cn/zhizao/2012/0724/article_13495.html http://www.gongkong.com/company/solution/2012062510034000001.htm http://www.chuandong.com/publish/application/2012-6/20467.html

DVC 官网教程-中文版

为什么选择 DVC&#xff1f; 即使我们今天在机器学习方面取得了巨大的成功&#xff0c;特别是在深度学习及其在商业中的应用方面&#xff1b;但是&#xff0c;数据科学家仍然缺乏组织项目和有效协作的最佳实践。 这是一个关键挑战&#xff1a;虽然 ML 算法和方法不再是部落知识…