(论文阅读22/100)Learning a Deep Compact Image Representation for Visual Tracking

news/2025/1/15 15:23:31/

文献阅读笔记

简介

题目

Learning a Deep Compact Image Representation for Visual Tracking

作者

N Wang, DY Yeung

原文链接

Learning a Deep Compact Image Representation for Visual Tracking (neurips.cc)

关键词

Object tracking、DLT、SDAE

研究问题

tracking the trajectory of a moving object in a video with possibly very complex background

在尽可能复杂背景的视频中跟踪目标的移动轨迹

研究方法

DLT:deep learning tracker

试图结合生成性跟踪器和判别性跟踪器的思想,开发一个鲁棒的判别性跟踪器。

更强调无监督的特征学习问题;

Specifically, by using auxiliary natural images, we train a stacked denoising autoencoder (SDAE) offline to learn generic image features that are more robust against variations.

通过使用辅助的自然图像,我们离线训练一个堆叠的去噪自编码器,以学习对变化更稳定的通用图像特征。

This is then followed by knowledge transfer from offline training to the online tracking process.

随后是知识转移从线下培训到线上跟踪的过程。

Online tracking involves a classification neural network which is constructed from the encoder part of the trained autoencoder as a feature extractor and an additional classification layer.

在线跟踪涉及一个分类神经网络,该网络由训练好的自编码器的编码器部分作为特征提取器和一个额外的分类层构建而成。

Both the feature extractor and the classifier can be further tuned to adapt to appearance changes of the moving object.

特征提取器和分类器都可以进行进一步的调整以适应移动对象的外观变化。

研究结论

相比其他跟踪器,在保持低计算成本和实时性的情况下更准确

创新不足

it would be an interesting direction to investigate a shift-variant CNN.

目前的跟踪器中的分类层只是一个线性分类器。将其扩展到更强大的分类器中,就像在其他判别跟踪器中一样,可能会为进一步的性能提升提供更大的空间。

额外知识

生成式和判别式方法:

生成式:假设被跟踪的对象可以用某种生成式过程来描述,因此跟踪相当于在可能无限多的候选对象中找到最可能的候选对象。关键是开发更加稳定的图像表示。灵感来源于robust estimation and sparse coding,such as the alternating direction method of multipliers (ADMM) and accelerated gradient methods。Some popular generative trackers include incremental visual tracking (IVT) , which represents the tracked object based on principal component analysis (PCA), and the l1 tracker (L1T)。

判别式:,判别式方法将跟踪视为一个二分类问题,学习将被跟踪对象与其背景明确区分开来。Some representative trackers in this category are the online AdaBoost (OAB) tracker [6], multiple instance learning (MIL) tracker [3], and structured output tracker (Struck).

对比:由于使用了更丰富的图像表示,生成式跟踪器通常在较不复杂的环境下产生更准确的结果,而判别式跟踪器由于明确地将背景考虑在内,因此对强遮挡和变化具有更强的鲁棒性。

The particle filter framework:粒子滤波框架

一种基于序列观测值估计动力系统潜在状态变量的序贯蒙特卡洛重要性采样方法。它通过一组粒子来近似后验状态分布,而不仅仅是像模式这样的单点。对于视觉跟踪而言,这一特性使得跟踪器更容易从错误的跟踪结果中恢复

Kalman filter卡尔曼滤波:

比较先进的跟踪器:MTT, CT , VTD , MIL, a latest variant of L1T, TLD, and IVT.


http://www.ppmy.cn/news/1212881.html

相关文章

JUL日志

文章目录 JUL日志JUL日志讲解Properties配置文件编写日志配置文件Lombok快速开启日志Mybatis日志系统 JUL日志 如果使用System.out.println来打印信息,项目中存在大量的控制台输出语句,会显得很凌乱,而且日志的粒度是不够细的,假…

前端开发引入element plus与windi css

背景 前端开发有很多流行框架,像React 、angular、vue等等,本文主要讲vue 给新手用的教程,其实官网已经写的很清楚,这里再啰嗦只是为了给新手提供一个更加简单明了的参考手册。 一、打开element plus官网选则如图所示模块安装命令…

Redis五种数据类型及命令操作(二)

🎈个人公众号:🎈 :✨✨✨ 可为编程✨ 🍟🍟 🔑个人信条:🔑 知足知不足 有为有不为 为与不为皆为可为🌵 🍉本篇简介:🍉 本篇记录Redis五种数据类型及命令操作,如…

C语言进阶

数组 在基础篇说过,数组实际上是构造类型之一,是连续存放的。 一维数组 定义 定义格式:[存储类型] 数据类型 数组名标识符[下标]; 下面分模块来介绍一下数组的定义部分的内容。 1、初始化和元素引用: 可以看到数组是连续存储…

英文字符大小写转换函数

C语言标准库中提供了许多函数可以实现将字符串转为大小写。你可以使用以下函数进行转换&#xff1a; #include<ctype.h> int toupper(int c)&#xff1a;将一个小写字符转换为大写字符。 int tolower(int c)&#xff1a;将一个大写字符转换为小写字符。#include<stri…

进阶SQL——数据表中多列按照指定格式拼接,并将多行内容合并为map拼接

示例&#xff1a; str_to_map(concat_ws(,,collect_set(concat_ws(:,modelname,score)))) as score_map, 这条语句是一个Spark SQL的语句&#xff0c;用于将字符串转换为Map类型。下面是对这条语句的详细解释和教程&#xff1a; 1. collect_set(concat_ws(:,modelname,scor…

c++类对象内存模型(一)

C对象模型可以概括为以下2部分&#xff1a; 1. 语言中直接支持面向对象程序设计的部分&#xff0c;主要涉及如构造函数、析构函数、虚函数、继承&#xff08;单继承、多继承、虚继承&#xff09;、多态等等。 2. 对于各种支持的底层实现机制。在c语言中&#xff0c;“数据”和…

【MySQL系列】第二章 · SQL(上)

写在前面 Hello大家好&#xff0c; 我是【麟-小白】&#xff0c;一位软件工程专业的学生&#xff0c;喜好计算机知识。希望大家能够一起学习进步呀&#xff01;本人是一名在读大学生&#xff0c;专业水平有限&#xff0c;如发现错误或不足之处&#xff0c;请多多指正&#xff0…