few-shot object counting论文汇总

news/2025/3/31 11:48:29/

文章目录

  • 2021
    • OBJECT COUNTING: YOU ONLY NEED TO LOOK AT ONE
  • 2022
    • CounTR: Transformer-based Generalised Visual Counting
    • Few-shot Object Counting with Similarity-Aware Feature Enhancement
  • 2023
    • CAN SAM COUNT ANYTHING? AN EMPIRICAL STUDY ON SAM COUNTING

2021

OBJECT COUNTING: YOU ONLY NEED TO LOOK AT ONE

摘要: 本文旨在解决一个热门对象计数的挑战性任务。给定一个包含新颖的、以前未见过的类别对象的图像,该任务的目标是只使用一个支持的边界框示例来计算所需类别中的所有实例。为此,我们提出了一个计数模型,通过该模型,您只需要查看一个实例(LaoNet)。首先,一个特征相关模块结合了自我注意和相关注意模块来学习内部关系和相互关系。它使网络对不同实例之间的旋转和大小的不一致性具有鲁棒性。其次,设计了一种尺度聚合机制来帮助提取具有不同尺度信息的特征。与现有的少镜头计数方法相比,LaoNet在学习收敛速度较快的同时,取得了最先进的结果。
在这里插入图片描述

2022

CounTR: Transformer-based Generalised Visual Counting

摘要:在本文中,我们考虑了广义视觉对象计数问题,目的是开发一个计算模型来计算任意语义类别的对象数量,使用任意数量的“范例”,即零射击或低射计数。为此,我们做出了以下四个贡献: (1)我们引入了一种新的基于transformer的架构,用于一般化视觉对象计数,称为计数transformer(CounTR),它明确地捕捉图像补丁之间的相似性或给定的“样本”;(2)采用两阶段训练机制,首先用自监督学习对模型进行预训练,然后进行监督微调;(3)我们提出了一个简单的、可扩展的管道,用于合成具有大量实例或来自不同语义类别的训练图像,明确地迫使模型使用给定的“范例”;(4)我们对大规模计数基准进行了彻底的消融研究,如FSC- 147,并在零镜头和少镜头设置上展示了最先进的性能。
在这里插入图片描述

Few-shot Object Counting with Similarity-Aware Feature Enhancement

code: https://github.com/zhiyuanyou/SAFECount

摘要:这项工作研究了少镜头对象计数的问题,它计数在查询图像中发生的范例对象(即,由一个或几个支持图像描述)的数量。主要的挑战在于,目标对象可以密集地打包在查询图像中,这使得很难识别每一个对象。为了解决这一障碍,我们提出了一种新的学习模块,包括相似度比较模块和特征增强模块。具体地说,给定一个支持图像和一个查询图像,我们首先通过比较它们在每个空间位置上的投影特征来得到一个得分图。关于所有支持图像的得分图被一起收集,并跨范例维度和空间维度进行归一化,生成一个可靠的相似性图。然后,我们利用所开发的点向相似性作为加权系数,利用支持特征来增强查询特征。这种设计鼓励模型通过更多地关注类似于支持图像的区域来检查查询图像,从而使不同对象之间的边界更加清晰。在各种基准和训练设置上的广泛实验表明,我们以足够大的优势超过了最先进的方法。例如,在最近的一个大规模的FSC-147数据集上,我们通过将平均绝对误差从22.08提高到14.32(35%↑),超过了最先进的方法。
在这里插入图片描述
在这里插入图片描述

2023

CAN SAM COUNT ANYTHING? AN EMPIRICAL STUDY ON SAM COUNTING

code: https://github.com/Vision-Intelligence-and-Robots-Group/count-anything

摘要:Meta AI最近发布了“分段任何东西模型”(SAM),该模型因其在类不可知分割方面令人印象深刻的表现而获得了关注。在本研究中,我们探讨了使用SAM进行具有挑战性的少镜头对象计数任务,即通过提供几个边界框来计数一个看不见类别的对象。我们将SAM的性能与其他少量的镜头计数方法进行了比较,发现目前没有进一步的微调,它并不令人满意,特别是对于小的和拥挤的对象。
在这里插入图片描述
在这里插入图片描述


http://www.ppmy.cn/news/388543.html

相关文章

【Java基础学习打卡08】Java语言跨平台原理

目录 引言一、Java程序运行机制二、Java虚拟机三、Java跨平台总结 引言 Java语言编程的一大优势便是跨平台,本文将介绍Java语言是如何实现跨平台的。 一、Java程序运行机制 计算机高级语言按照程序的执行方式可以分为编译型语言和解释型语言。 编译型语言&#x…

JavaScript之ES6高级语法(二)

本文是我在学习过程中记录学习的点点滴滴,目的是为了学完之后巩固一下顺便也和大家分享一下,日后忘记了也可以方便快速的复习。 TOC 前言 今天学习的主要是关于ES6知识的理解和应用 一、构造函数 注:实践中为了从视觉上区分构造函数和普通函…

一.《UE5夜鸦》被动技能名字CALL和描述CALL

被动技能名字描述CALL 搜索名字寻找名字库的名字对象 1.搜索我们找名字,肯定是需要用CE搜索名字拉,由于是韩文,我们用翻译器截图获取韩文字符串 2.开始截图获取 3.我们用CE搜索字符串,这里注意是UTF-16勾上,找到了4个完全一样的结果, 我们修改确认哪一个才是真正技能库的名字 4…

58、基于51单片机GPS定位自动报站时间显示语音播报公交车系统设计(程序+原理图+PCB源文件+参考论文+开题报告+任务书+元器件清单等)

摘 要 1831年,英国的沃尔特汗考为他的国家制造出了世界上第一辆装载发动机的公共汽车,至今,公交车已经经历过近200年的发展过程。从刚开始“闷罐头”样式到如今配套空调系统;从专人售票至无人售票;从人工报站至半自动…

雷神加速器 误识别为海外用户解决方案

雷神加速器 勿识别为海外用户,只能加速国内游戏,需要修改配置文件。 以下来自官方的解决方案,记录一下,防止忘记了 修改程序目录,proto.ini 增加: [geoip] prov_codesh

github加速器

下载地址: https://github.com/dotnetcore/FastGithub/releases 解压运行 FastGithub.exe 安装证书 双击 CACert/FastGithub.cer 完成

github国内加速器

1.GitHub 镜像访问 这里提供两个最常用的镜像地址(别登录账号):https://github.com.cnpmjs.orghttps://hub.fastgit.org 也就是说上面的镜像就是一个克隆版的Github,你可以访问上面的镜像网站,网站的内容跟Github是完整…

解决关于加速器加速热点连不上,或者没有网络失效问题

在使用加速器加速后可能会出现电脑热点功能丢失同时热点能连上或者连上没网的现象。 本人在网上试过了很多方法发现都没有用。 最后经本身测试大部分是加速器的问题,本人使用的是AK加速器,所以以AK加速器举例。 解决方法:点开ak加速器右上…