MetaPoint_速读

devtools/2024/9/23 17:33:31/

Meta-Point Learning and Refining for Category-Agnostic Pose Estimation

https://arxiv.org/abs/2404.14808https://github.com/chenbys/metapoint

abstract

这篇文章介绍了一种名为Meta-Point Learning and Refining的框架,用于实现类别不可知的姿势估计。该框架利用所谓的元点(meta-points)来提高姿势估计的准确性。通过渐进式可变形点解码器和松弛回归损失,该方法优于现有方法。文章重点讨论了如何利用元点改进类别不可知的姿势估计,以及可学习嵌入在捕获关键信息用于关键点预测中的作用。此外,渐进式可变形点解码器如何有助于更好地进行预测和监督也是文章的重要内容。

contribution

本文的主要创新点包括:

  1. 首次提出了用于类别不可知姿势估计的元点学习方法,通过学习类别不可知的潜在关键点来改进姿势估计的准确性。
  2. 引入了渐进式可变形点解码器和松弛回归损失,以实现更好的预测和监督,从而超越了现有方法。
  3. 提出了一种新颖的框架,利用元点学习和细化的方法来改善类别不可知的姿势估计,揭示了关键点的内在性质并取得了优越的性能。

related work

本文的相关工作可以从类别特定姿势估计和类别无关姿势估计两个方面概括如下:

  1. 类别特定姿势估计:

    • 传统的姿势估计方法通常针对特定类别,如人类、动物和车辆等。
    • 方法包括基于回归、基于热图和基于查询的技术。
    • 以往研究主要集中在特定类别的姿势估计上,对于新类别的适应性较差。
  2. 类别无关姿势估计:

    • 针对类别无关的姿势估计,研究者开始探索使用少量支持图像来估计任意类别的关键点位置。
    • 元点学习方法是本文的创新之处,通过学习潜在的关键点来提高关键点预测的准确性。
    • 本文引入了渐进式可变形点解码器和松弛回归损失,以实现更好的预测和监督,取得了优于现有方法的性能。

metalearning_40">meta-learning

本文的方法与元学习(meta-learning)之间存在一定的联系和区别:

  1. 元学习是一种机器学习范式,旨在通过从先前任务中学到的知识或经验,来加速学习新任务。通常涉及在训练阶段模拟快速学习过程,以便在测试阶段能够快速适应新任务。
  2. 本文提出的元点学习方法并非典型的元学习方法,而是针对类别不可知姿势估计问题提出的一种新颖框架。该方法通过学习潜在的关键点(元点)来提高关键点预测的准确性,从而改进类别不可知的姿势估计。
  3. 虽然本文的方法也涉及从支持图像中学习信息以改进关键点预测,但其重点在于利用元点学习和细化的方法来提高类别不可知姿势估计的性能,而非典型的元学习任务。

method

本文方法的步骤可以详细介绍如下:

  1. 元点学习

    • 提出了元点学习的概念,即学习类别不可知的潜在关键点(meta-points)来改进姿势估计的准确性。
    • 维护可学习的嵌入以捕获各种关键点的内在信息,这些嵌入与图像特征图相互作用,无需任何支持信息即可生成元点。
  2. 元点生成和细化

    • 在给定查询图像的情况下,元嵌入将通过变换器解码器与其特征图相互作用,挖掘内在信息,从而生成元点。
    • 利用二部匹配的分配方法,根据支持信息为期望的关键点分配最佳的元点。
    • 利用支持特征向量和挖掘的内在信息,通过另一个变换器解码器对分配的元点进行细化。
  3. 渐进式可变形点解码器

    • 提出了渐进式可变形点解码器,逐步挖掘细粒度特征,以在最后一个点作为参考的基础上解码点。
    • 该解码器利用变形注意力来提高关键点的预测精度。
  4. 松弛回归损失

    • 引入了松弛回归损失,以减少辅助解码器层的不成熟梯度,从而提高模型的训练效果。

experiments

本文的实验可以概括如下:

  1. 数据集和指标

    • 在 Multi-category Pose (MP-100) 数据集上进行实验评估,该数据集包含100个类别和8个超类别,是用于类别不可知姿势估计最大的基准数据集之一。
    • 数据集包含超过18,000张图像和20,000个注释,关键点数量在不同类别之间的范围为8到68个。
    • 将100个类别划分为非重叠的训练/验证/测试集,比例为70:10:20,使用五个随机划分以减少随机性的影响。
    • 使用概率正确关键点(PCK)作为定量指标,并报告了不同阈值下的PCK@0.2结果以及更全面的mPCK评估。
  2. 实验设置

    • 遵循先前工作的实验设置,包括1-shot和5-shot设置。
    • 在推理阶段,使用最后一个解码器层的结果作为估计关键点。
    • 对于N-shot设置,对不同拍摄的支持关键点特征进行平均处理,以获得更好的分配和信息增强。
  3. 实验结果

    • 在MP-100数据集上进行1-shot和5-shot设置的实验,总结了PCK@0.2结果,并在表格中报告了mPCK结果。
    • 实验结果展示了本文方法在类别不可知姿势估计任务上的性能优势,证明了元点学习方法的有效性和优越性。

通过这些实验,作者验证了他们提出的方法在类别不可知姿势估计任务中的有效性和性能优势。

metric

本文实验中使用了以下评价指标:

  1. 概率正确关键点(PCK)

    • PCK 是一种常用的姿势估计评价指标,用于衡量预测关键点与真实关键点之间的匹配准确度。
    • 在本文中,使用 PCK@0.2 表示在阈值为0.2时的概率正确关键点,即预测关键点与真实关键点之间的距离小于图像尺寸的20%。
  2. 平均概率正确关键点(mPCK)

    • mPCK 是对 PCK 指标的扩展,通过在不同阈值(如0.05、0.1、0.15、0.2)下计算 PCK 并取平均值,以更全面地评估关键点匹配的准确度。

这些评价指标帮助评估模型在类别不可知姿势估计任务中的性能表现,从而验证了元点学习方法的有效性和优越性。


http://www.ppmy.cn/devtools/58110.html

相关文章

【Qt】QTableWidget设置可以选择多行多列,并能复制选择的内容到剪贴板

比如有一个 QTableWidget*m_tbwQuery m_tbwQuery->installEventFilter(this); //进行事件过滤处理//设置可以选择多行多列 m_tbwQuery->setSelectionMode(QAbstractItemView::MultiSelection); m_tbwQuery->setSelectionBehavior(QAbstractItemView::SelectItems); …

C++ Lambda表达式第二篇, Lambda表达式

C Lambda表达式 Lambda 捕获含有模板参数的Lambda表达式无模板参数的Lambda表达式 Lambda 捕获 captures是零个或多个捕获的逗号分隔列表,可以选择以capture-default开头。捕获列表定义可从 lambda 函数体内访问的外部变量。唯一的捕获默认值是 &,…

MySQL 进阶(一)【存储引擎】

1、存储引擎 1.1、MySQL 体系结构 自上而下可以分为 连接层 接受客户端的连接,完成连接的处理、认证授权、安全方案和最大连接数等服务层 绝大部分的核心功能都是在服务层完成的,比如SQL 接口(DDL、DML、视图、触发器、存储过程&#xff09…

用R在地图上绘制网络图的三种方法

地理网络图与传统的网络图不同,当引用地理位置进行节点网络可视化时,需要将这些节点放置在地图上,然后绘制他们之间的连结。Markus konrad的帖子(https://datascience.blog.wzb.eu/2018/05/31/three-ways-of-visualizing-a-graph-on-a-map/)&…

ERP、CRM、MRP、PLM、APS、MES、WMS、SRM系统之间的关系

ERP系统是企业运营的神经中枢,整合了财务、人力资源、供应链等关键业务流程。CRM系统作为客户关系管理的专家,帮助企业深入了解客户需求,提升服务质量。MRP是物料需求的规划师,确保生产所需材料及时供应。PLM系统守护着产品从设计…

【CT】LeetCode手撕—31. 下一个排列

目录 题目1- 思路2- 实现⭐31. 下一个排列——题解思路 3- ACM 实现 题目 原题连接:31. 下一个排列 1- 思路 思路 ① 从右边找出一个尽可能大的数,和左边的数进行交换 ——> 交换后得到的数 就是 字典序更高② 字典序高,但不代表其就是…

C++:继承

✨✨✨学习的道路很枯燥,希望我们能并肩走下来! 文章目录 目录 文章目录 前言 一.继承的概念及定义 1.1 继承的概念 1.2 继承定义 1.2.1 定义格式 1.2.2 继承关系和访问限定符 1.2.3 继承基类成员访问方式的变化 二.基类和派生类对象赋值转换 三.继承中的…

代码随想录训练第十一天|二叉树基础理论、二叉树递归遍历、二叉树迭代遍历、二叉树统一迭代法、LeetCode102.二叉树层序遍历

文章目录 二叉树理论基础二叉树种类满二叉树完全二叉树二叉搜索树平衡二叉搜索树 二叉树存储方式二叉树遍历方式二叉树的定义总结 二叉树的递归遍历思路前序遍历后序遍历中序遍历 二叉树的迭代遍历思路前序遍历(迭代法)中序遍历(迭代法&#…