基于对抗式深度学习和往复式深度学习的视觉目标跟踪

news/2024/11/29 10:39:31/

valse2019会议的workshop9《在线视觉跟踪》中上海交通大学的马超老师分享的题目是《基于对抗式深度学习和往复式深度学习的视觉目标跟踪》,本次分享主要是基于《VITAL:Visual Tracking via Adversarial Learning》和《Deep Attentive Tracking Via Reciprocative Learning》这两篇分别发表在CVPR 2018和NIPS 2018上的工作。

马超老师先是将现有跟踪算法分为回归模型和分类模型两类,而后指出了两种方法各自的特点,如回归模型会输出密集的响应图,方便利用多层级深度特征,但是对尺度不敏感,而分类模型会输出稀疏响应图,依赖随机采样,对尺度敏感,方便与生成网络、注意力机制结合。从而基于正样本在空间上过度重合以及正负样本数量严重不平衡的角度出发,决定采取生成判别网络(GAN)来多样化正样本,采用代价敏感的损失函数减轻样本数量不平衡的问题。并指出了在使用GAN的过程中引发的一些思考:

1)、无法直接利用GAN提高两阶段 基于检测的跟踪框架;
2)、网络输入是采样的图片而不是噪声;
3)、分类器需要的是有监督学习,而不是简单的Fake和True;
4)、需要的是判别器、而不是生成器.

基于上述思考提出了自己的方法,如图(1)所示:
在这里插入图片描述

采用了类似attention的机制,生成一个 brunch,得出mask,乘在特征上来得到分类损失。

类似attention是因为该机制与attention相反的,是对抗学习的过程。训练中先用掩模修饰过后的深度特征,保留原本的标签进行有监督学习,训练掩模生成器的时候随机生成一系列掩模,挑选具有最大高斯的掩模,进行特征修饰。
具体做法就是,一开始随机初始化9个mask,相当于初始复制9份,输入到对抗学习的过程中去。这个操作里与attention不同之处就是,在attention中中间的区分性比较大,我们希望给他最大的权重,但我们在对抗学习的过程中,他的权值是最低的,也就是中间的区分性比较低,就像高手在开始练习轻功的时候,一开始要在腿上绑一个沙袋,练成了之后取下来就会特别厉害。把最显著的特性,用mask盖掉,这样训练起来对分类器的迷惑性是最高的,训练之后鲁棒性也就是最好的。

从GAN对分类器的有效性分析的角度出发,对于二值分类器的熵分布,如公式(1)所示:
在这里插入图片描述
其中,p和1-p是预测到的正负样本的概率,熵越高,则分类越不确定。

基于正负样本损失差距巨大的现像引入了代价敏感损失函数,即容易判别的负样本总是产生较小损失,但数量大。而所有容易判别的负样本损失的和占所有损失的大部分,所以通过引入代价敏感损失函数来降低容易判别的负样本的损失的权重,代价敏感损失函数如式(2)所示
在这里插入图片描述
结合对抗式学习和代价敏感损失函数,我们可以得到如下式(3)所示的损失函数
在这里插入图片描述
其中,
在这里插入图片描述
对于使用GAN进行跟踪的总结如下:
1)GAN可以增强正样本,捕获更多的外观形状变化
2)样本数量不平衡影响分类器的训练,代价敏感损失函数可以减轻样本数量不平衡带来的副作用
3)对抗式学习结合代价敏感损失函数在多个数据集上取得当前最优的跟踪效果

基于对抗学习的工作通过一个类似attention的机制来进行对抗学习,而接下来还将探索如何使用一个attention的机制来更好的帮助训练分类器,也就是往复式深度学习的方法。基于往复式深度学习的方法流程图如下图(2)所示。
在这里插入图片描述

往复式深度学习仍选用二分类的跟踪框架,给定一个训练样本,我们首先在正向操作中计算其分类分数。然后对该样本对分类分值求偏导,得到后向操作中的注意图。我们使用这些映射作为正则化项,并结合分类损失来训练分类器。在测试阶段,没有生成注意图。分类器直接预测目标位置。

对于关注度响应图的正则化训练是根据期望正类别响应图在物体附近亮点均值高,方差小,即用均值来除以方差;期望负类别响应图在物体附近亮点均值小,方差大,即颠倒过来,用方差来除以均值。从而通过正则化约束使分类正确的图中响应分布高亮集中,分类错误的图中响应分布暗淡分散。

综上所述,往复式学习的总体流程如下:
1)在训练过程中,先对每一个样本进行前向传播产生预测;
2)再对每个预测进行后向传播获得关注度响应图;
3)计算响应图对应的统计特性,对分类损失进行正则项约束;
4)依据计算出的损失更新网络参数.

对于使用往复性深度学习的总结如下:
1)往复式深度学习可以挖掘网络自身对目标物体的关注度;
2)关注度响应图可以作为正则化约束项帮助网络的训练;
3)训练结束后,网络具有对目标物体的关注特性,从而提升跟踪性能。

(文末附上马超老师团队对于目标跟踪算法的2019CVPR的两篇最新工作的poster展示)
在这里插入图片描述
在这里插入图片描述


http://www.ppmy.cn/news/543838.html

相关文章

MySQL面试知识点汇总

文章目录 数据库基础知识部分为什么要使用数据库什么是SQL什么又是MySQL数据库的三大范式是什么Mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别? 数据类型Mysql有哪些数据类型 引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引…

腾讯王者服务器性能,性能飙升!腾讯这一技术将使王者荣耀告别卡顿!

王者荣耀是腾讯旗下的一款现象级的国民手机游戏,自发布以来,迅速占领了各大手机游戏下载榜榜首的位置,游戏热度一直居高不下。但是随着版本的不断更迭,王者荣耀这款游戏的画面精细程度和技能打斗场景的复杂程度越来越高&#xff0…

王者荣耀服务器维护5月22,王者荣耀5月22日更新维护公告 更新内容汇总

【背包里的宝藏:体验卡兑换商店限时开启】 活动时间:5 月 22 日更新后~ 5 月 28 日 热门英雄、皮肤:甄姬-冰雪圆舞曲、阿轲-爱心护理、露娜-哥特玫瑰、宫本武藏-未来纪元、达摩-大发明家、公孙离、宫本武藏、张良、阿轲、东皇太一、太乙真人开…

清华大学计算机科学学院刘钊,王霞,PhD - 教研系列 - 清华大学药学院

王霞 研究员,博士生导师 2001年和2004年分别在大连海洋大学取得学士和硕士学位。2004-2009年,在中国科学院遗传与发育生物学研究所取得细胞生物学博士学位。2009-2012年,在美国哈佛大学医学院进行博士后研究,随后在杰克逊实验室基…

尚硅谷VUE项目-前端项目问题总结05【api-vuex-组件通信-面包屑-排序】

尚硅谷VUE项目-前端项目问题总结05 search模块开发1.静态页面2.api3.vuex4. search产品模块和search子组件SearchSelector模块5 面包屑【含组件兄弟通信$bus,子父自定义事件】6. 排序 search模块开发 1.静态页面 2.api //获取search数据 /api/list POST 需要传…

交互设计:界面尺寸设计大全

自从七月公开课开始以来,就有不少新加我们的小伙伴在问: “老师,请教下web端原型图长宽一般设置成多少啊?” “老师,web端的输入框一般设计的长宽是多少啊?” 下面,就把常见的原型设计中界面尺…

org.apache.http.NoHttpResponseException

文章目录 org.apache.http.NoHttpResponseException: 目标服务地址 failed to respond创建HttpClient对象 org.apache.http.NoHttpResponseException: 目标服务地址 failed to respond ​ 在使用Httpclient去使用get请求去调用其他服务的时候出的这个错,但是我直接使用浏览器访…

安卓引导用户设置APP运行后台保活

随着Android版本的更新, 又是基于安全!安全! 非系统层APP想要正大光明的或搞点小手段在后台长时间或者"永久"保活是愈发不可实现了(当然排除一些"黑技术"),大陆定制化的OS又为了更好的保证UI的流畅性也更是把此拿捏的死死的(除了QQ,微信,支付宝等这类占据市…