ImageNet决定给人脸打码,却让哈士奇图片识别率猛增

news/2024/12/23 3:19:41/
晓查 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

315晚会让大家意识到人脸识别有多可怕。在大洋彼岸,全球最具影响力的AI数据集也开始行动了。

近日,ImageNet数据集决定:给所有人脸打码,保护被收录者隐私。

ImageNet管理者之一Olga Russakovsky与李飞飞团队合作,一起“纠察”数据集中所有包含人脸的图像。

ImageNet总共有1000多个标签,其中只有3个标签与人相关,而很多看似与人脸无关的标签下,反而可能有大量人脸照片。

因此,研究团队通过亚马逊Rekognition的自动人脸识别以及众包方式,在150万张图片中,找出了243198张包含人脸的图片。

这些图片中的562626张人脸都已被模糊处理。

给人脸打码会影响AI模型效果吗?这恐怕是“炼丹”人士最关心的问题了。

在修改数据集之后,普林斯顿大学的博士生杨凯峪对这个问题进行了一番研究。

偏差不大,但结果微妙

研究者使用模糊处理后的数据集进行目标检测和场景检测基准测试。

在AlexNet、VGG、ResNet等15种主流网络模型上测试后发现,Top-1准确率最多下降1%,平均仅下降0.66%,Top-5准确率平均下降0.42%。

根据图片中模糊区域比例的不同,Top-1准确率下降程度随着模糊比例的增大,最高超过4%。

某些类别中离模糊人脸更近的目标,例如口琴或面具,会导致更高的分类错误率。

令人费解的是,一些没有人脸的照片反而会有很大的准确率波动,比如“哈士奇”、“爱斯基摩犬”分类。

其中,爱斯基摩犬的识别准确率出现大幅下降,而哈士奇的识别准确率反而大幅上升。

连作者也觉得很奇怪,因为这两个类别中的大多数图像都没有人脸。具体原因如何只有等待后续研究了。

MIT科学家Aleksander Madry认为,模糊人脸的数据集训练的AI有时候很奇怪,数据中的偏差非常微妙,但可能会带来严重的后果。

向隐私和偏见说不

2020年,在计算机科学道德伦理学术会议FAccT上,ImageNet数据集删除了“人”子树中2702个同义集,因为这些类别中含有令人反感、贬义或污秽的表述。例如一些种族和性别歧视的内容。

虽然ImageNet此次对隐私问题做出了重大改变,但来自UnifyID的首席科学家Vinay Prabhu指出该数据集还有许多严重问题。

去年7月,Prabhu发表的一篇论文指出,ImageNet、Tiny Images等图片数据集中不仅存在危害隐私的状况,甚至还有一些不可描述的图片。

在那篇论文中,Prabhu建议,对数据集中的人脸做模糊处理,并且要做到在参与者明确同意后才能收集图片,不要为这类数据集创建数据共享许可证。

他曾给连续10个月给ImageNet团队发送邮件反馈此问题,直到去年4月才收到李飞飞的回复。

而此次ImageNet团队的论文并没有引用他,在接受《连线》杂志采访时,Prabhu表示对ImageNet团队没有承认他所做的工作感到失望。

Russakovsky回复称,论文的更新版本将会把Prabhu的研究加入引文中。

2019年,微软悄悄删除了包含1000万张图片的人脸数据集MS Celeb,这些照片都未征得本人同意。

此前用公共摄像头搜集的数据集,如杜克大学的MTMC、斯坦福大学的Brainwash,近年来都被悉数删除。

在公众隐私意识觉醒、法律逐渐完善的背景下,AI数据集到了必须要保护用户隐私的时候了。

参考链接:
[1] https://venturebeat.com/2021/03/16/imagenet-creators-find-blurring-faces-for-privacy-has-a-minimal-impact-on-accuracy/
[2] https://www.wired.com/story/researchers-blur-faces-launched-thousand-algorithms/
[3] http://image-net.org/update-mar-11-2021.php
[4] https://github.com/princetonvisualai/imagenet-face-obfuscation
[5] https://vinayprabhu.medium.com/a-study-of-a-study-of-face-obfuscation-in-imagenet-d7e7591795a2

—  —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

点这里????关注我,记得标星,么么哒~

加入AI社群,拓展你的AI行业人脉

量子位「AI社群」招募中!欢迎AI从业者、关注AI行业的小伙伴们扫码加入,与50000+名好友共同关注人工智能行业发展&技术进展

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~


http://www.ppmy.cn/news/576448.html

相关文章

电脑、笔记本网络提速解决方案

我们用电脑或者笔记本连接网络有时候会发现网速始终上不去,打开浏览器浏览页面都要转圈圈,那么我们可以按照下面的步骤进行设置: 一、使用windows徽标键R打开运行 输入 gpedit.msc 二、打开本地组策略编辑器 三、按照下面这个依次点击&#x…

电脑管家加速

问题描述: 之前使用电脑管家满30min后,qq会自动加速0.2天,现在不加速了如下图: 解决办法:由于版本问题现在需要手动加速。 1、进入到个人中心:登陆电脑管家后,点击左上角自己的头像进入即可&am…

加速电脑浏览器下载和加载网页速度

昨天用电脑时发现一个很大的问题,就是自己的笔记本网页加载和文件下载速度极其的缓慢,网速有一部分原因之外还有应该就是自己电脑配置和浏览器设置问题了,今早研究了一下,按照一个大佬的操作方式果然有所提升,故借此博…

window加速设置,让电脑运行速度大幅提升

1.关闭优化传递 2.增加引导处理器个数 winR输入msconfig 3.提升网速 winR输入gpedit.msc,管理模板->网络->Qos数据包计划程序->限制可保留宽带,启用它&&设置为0 4.关闭SysMain winR输入services.msc,点击禁用 5.加速磁盘 设备管理器->选中自…

什么是GPU加速

1、什么是GPU加速计算 GPU,又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器,与CPU类似,只不过GPU是专为执行复…

启动计算机的程序方法单击,7种方法,让你的Windows计算机加速起来!

原标题:7种方法,让你的Windows计算机加速起来! 电脑用久了,会发现开机时间越来越长,打开软件速度越来越慢,动不动就出现系统无响应。是否厌倦了越来越缓慢的计算机?是否在寻找加快计算机速度的方…

教你如何处理加速电脑速度(转载)

第一招:清除系统垃圾——你也可以做的到!在每天使用电脑的工作、学习和娱乐中,你是否注意到你的电脑系统磁盘的可用空间正在一天天的减少呢?系统是不是也像老去的猴王一样,动作一天比一天迟缓呢?终于有一天…

快速加速计算机的方法,如何让电脑提速50%以上?这三招就够了!

如何让电脑提速呢?相信有许多人都有这样的问题,电脑有年头了,速度开始跟不上了,于是各种心塞的问题出现了,打游戏fps低,各种卡,各种坑队友,运行速度慢,开一个软件都要等半天,好心塞~~,但是换台电脑又不太实际,毕竟电脑还能用,除了卡得有点糟心外,还是能用的。那么…