1,什么是数据标注
数据标注即通过分类、画框、标注、注释等,对图片、语音、文本等数据进行处理,标记对象的特征,以作为机器学习基础素材的过程。
2,数据标注流程
数据采集-> 数据清洗->数据标注->数据质检
3,有多少智能,就有多少人工
数据处理的量级与质量直接关系到机器的智能程度
4,数据来源
系统的日志采集
互联网数据采集
app移动端数据采集
数据服务机构进行合作
5,质量标准
对于人眼所见的图像而言,计算机所见的图像只是一堆枯燥的数字。图像标注就是根据需求将这一堆数字划分区域,让计算机在划分出来的区域中找寻数字的规律。
多音字标注的质量标准就是标注一个字的全部读音,这就需要借助字典等专业性工具进行检验。
6,检验方法
一般的产品检验方法分为全样检验和抽样检验,在数据标注中,会根据实际情况加入实时检验的环节来减少数据标注过程中出现重复的错误问题
实时检验是现场检验和流动检验的一种方式,一般安排在数据标注任务进行过程中,能够及时发现问题并解决问题
全样检验是数据标注任务完成交付前必不可少的过程,没有经过圈养检验的数据标注是无法交付的。全样检验需要质检员对已完成标注的数据集进行集中全样检验,严格按照数据标注的质量标准进行检验,并对整个数据标注任务的合格情况进行判定。
7,labelImg
源码地址:https://github.com/tzutalin/labelImg
下载网址:http://tzutalin.github.io/labelImg/
安装方式:
1 :pip install labelImg -i https://pypi.tuna.tsinghua.edu.cn/simple (cmd命令,以管理员身份运行,贴这个代码)
2 :http://tzutalin.github.io/labelImg/
建议使用第一种
open 打开一个文件
openDir打开目录
ctrl +鼠标滚轮,可以放大和缩小
w 打开矩形框
在背景区按w ,出现黄色背景色,如果出现,代表
8,labelme安装
源码:https://github.com/CSAILVision/LabelMeAnnotationTool
参考链接:https://www.cnblogs.com/wangxiaocvpr/p/9997690.html
pip install labelme -i https://pypi.tuna.tsinghua.edu.cn/simple