High Performance Visual Tracking with Siamese Region Proposal Network(SiamRPN)

news/2024/11/6 9:47:18/

High Performance Visual Tracking with Siamese Region Proposal Network(SiamRPN,CVPR2018)

主要贡献:

  • 提出了SiamRPN跟踪器,首次将端到端的离线训练方式,应用到了大尺度的图像跟踪任务上
  • 在在线跟踪过程中,提出了一种局部单点检测(local shot detection)的方法,可以有效地改善传统的多尺度检测方法
  • 以160FPS的速度在VOT2015、VOT2016、VOT2017上取得了领先性能

在这里插入图片描述

该网络结构整体可以分为两部分:

  • Siamese Network:与SiamFC基本一致,分为模板分支和搜索分支,两个分支共享权值。
  • Region Proposal Network:由两个分支组成,一个是分类分支,用于区分目标和背景;另一个是回归分支,用于微调候选区域,以实现精确定位。

anchor的本质就是输出一系列不同形状和尺寸的矩形。在RPN子网络中,特征图上的每个像素点都生成k个anchor(论文中k=5),通过这些anchor框对bounding box进行回归。

在RPN子网络中,经过特征提取网络得到的模板特征图和搜索特征图都会送入分类分支和回归分支中,而后在两个分支中,模板特征图分别经过一个3×3卷积层得到相应特征图4×4×(2k×256)和4×4×(4k×256),特征通道从256增加到了2k×256和4k×256。之所以要乘以2k,是因为特征图的每个像素点都生成k个anchor,同时每个anchor可以被分类为前景或背景;同理,乘以4k,是因为每个anchor可以用4个参数(x, y, w, h)进行描述。搜索特征图也会分别经过一个3×3卷积层得到相应特征图,这里的通道数保持不变,还是256。

对于分类分支,将2k个模板图像anchor的4×4×256作为卷积核,与搜索图像的20×20×256进行卷积操作(互相关),从而生成分类响应图17×17×2k,响应图上的每个点表示一个维度为2k的向量;对于回归分支,将4k个模板图像anchor的4×4×256作为卷积核,与搜索图像的20×20×256进行卷积操作(互相关),从而生成回归响应图17×17×4k,响应图上的每个点表示一个维度为4k的向量。

在训练过程中,使用Cross Entropy Loss作为分类分支的损失函数,使用Smooth L1 Loss作为回归分支的损失函数。Smooth L1相比于L1损失函数,可以收敛的更快;相比于L2损失函数,对离群点、异常值不敏感,梯度变化相对更小,训练时不容易跑飞。

正负样本选择策略:设置高低两个阈值,大于0.6的为正样本,小于0.3的为负样本,一个pair中有64个样本,其中正样本最多16个。

Tracking as one-shot detection:

在这里插入图片描述

模板分支使用第一帧预测RPN子网络在检测分支上的卷积核的权重(以灰色表示),然后修剪模板分支,仅保留检测分支。因此,该框架被修改为局部检测网络。

推理:选择分类响应图中top K个正样本,得出对应的anchors,然后得到与之对应的回归响应图中K个坐标偏移,最后通过anchors和这些偏移值得到预测值。由此我们得到K个proposals。
我们需要从K个proposals中进行选取,文章中给出了两个策略:

  • 作者认为相邻帧目标的位移不会太大,所以只选取分类特征图中心区域的点。
  • 使用余弦窗(cosine window)和尺度变化惩罚(scale change penalty)来re-rank proposals的得分,以获得最好的一个。

在这些操作之后,将分类分数乘以时间惩罚,对top K个proposals进行重新排序,然后执行非极大值抑制(NMS)以得到最终的跟踪边界框。在选择最终边界框后,通过线性插值法更新目标大小,以保持形状的平滑变化。


http://www.ppmy.cn/news/698668.html

相关文章

乱象丛生or一路光明,看SSD市场发展现状

乱象丛生or一路光明,看SSD市场发展现状 近年来,SSD固态硬盘的涌现无疑是主存储技术上的重大突破,它对传统的机械存储是具有颠覆性及破坏性,尤其体现在家用消费领域里。SSD任凭着革命性的多任务处理能力,卓越的读写性能…

C++中的vector使用详解及重要部分底层实现

本篇文章会对vector的语法使用进行详解。同时,还会对重要难点部分的底层实现进行讲解。其中有vector的迭代器失效和深拷贝问题。希望本篇文章的内容会对你有所帮助。 目录 一、vector 简单概述 1、1 C语言中数组的不便 1、2 C中的动态数组容器vector 二、vector的常…

Qt Example各例子技术点说明(六)

说明: 下面的XX.XX.XX为Qt的版本号,如:5.14.1。 下面总结的都是以Qt的5.14.1版本来说明的,未来的版本也许和这有些不同。 因为Qt自带的例子很多,本博文是第6部分,第1、2、3、4、5部分请参见如下链接&…

直击|OPPO宣布推出新系列Reno 产品将于4月发布

新浪科技讯 3月11日上午消息,OPPO副总裁、中国大陆事业部总裁沈义人今日在微博宣布,OPPO正式推出新系列Reno。 此前,沈义人曾在微博上回复新浪手机称,今年没有R19的发布,这引发了外界对OPPO旗下产品系列今年将发生调整…

HOT33-排序链表

leetcode原题链接:排序链表 题目描述 给你链表的头结点 head ,请将其按 升序 排列并返回 排序后的链表 。 示例 1: 输入:head [4,2,1,3] 输出:[1,2,3,4]示例 2: 输入:head [-1,5,3,4,0] 输出…

OPPO K9试水“捆绑销售”,消费者“赚了”还是“亏了”?

【原创】 号称“充电5分钟,开黑两小时”的OPPO新品K9于5月6日正式发布,这句“似曾相识”的OPPO“过气”广告语,又重新出现在了江湖,说是词穷也好,为了突出手机卖点也罢,反正新品是上了。 出了新品&#x…

天玑1200来了,2021年旗舰手机迎体验新趋势

旗舰手机芯片越来越追求5G式的极致体验了。1月20日,联发科发布了天玑1200,这款芯片定位于“天玑旗舰”,通过搭载更先进的5G和AI技术,在拍照、视频和游戏等多媒体场景下,能够为用户提供非同寻常的优秀使用体验。 天玑旗…

「2024」预备研究生mem-利润与利润率增长率问题

一、利润与利润率 二、增长率问题 易错题: 三、课后题