【SAM系列】CAN SAM COUNT ANYTHING? AN EMPIRICAL STUDY ON SAM COUNTING

news/2025/1/18 4:41:46/

论文链接:https://arxiv.org/abs/2304.10817
代码链接:https://github.com/vision-intelligence-and-robots-group/count-anything

目的

探索SAM在few-shot setting的object counting的能力。

结论

它目前落后于最先进的few-shot object counting方法,特别是对于小而拥挤的物体。两个主要原因。首先,SAM倾向于使用单个掩码分割同一类别的拥挤对象。其次,SAM 使用缺乏语义类注释的掩码进行训练,这可能会阻碍其区分不同对象的能力。

如何将SAM用到few-shot object counting

不使用额外的zero-shot detector(grounding DINO)或者zero-shot classifier(CLIP),使用SAM的原始图像特征来区分不同的物体。这样做是为了节省计算资源。

  1. 首先,通过使用SAM的图像编码器(ViT-H)提取给定的密集图像特征图像。
  2. 我们利用给定的边界框作为提示来生成参考示例的分割掩码。然后将这些掩码与密集图像特征相乘,然后平均以生成参考对象的特征向量。
  3. 我们使用点网格(每边 32 个点)**作为提示来分割所有内容,输出掩码与密集图像特征相乘,然后平均以生成所有掩码的特征向量**。
  4. 我们计算了预测掩码的特征向量与参考示例之间的余弦相似性。如果余弦相似度超过预定阈值,我们将它视为目标对象。

实验数据

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


http://www.ppmy.cn/news/73742.html

相关文章

代码随想录算法训练营第48天 |198、213、337

198. 打家劫舍 题目描述 你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统,如果两间相邻的房屋在同一晚上被小偷闯入,系统会自动报警。 给定一…

车规级MCU芯片

作为车辆控制的核心器件,MCU主要用于车身控制、驾驶控制、信息娱乐和驾驶辅助系统。 8位MCU :提供低端控制功能:风扇控制、空调控制、雨刷、天窗、 车窗升降、低端仪表盘、集线盒、座椅控制、门控模块。 16位MCU :提供中端控制功能:用于动力…

STM32G4xx USB CDC 基础教程

目录 USB CDC 简介 准备工作 USB CDC配置 代码实现 数据发送 数据接收 数据传输测试 总结 大家好,今天我们来讨论一下如何在STM32G4xx系列微控制器中实现USB CDC(Communication Device Class)通信。USB CDC协议通常用于模拟串口通信,它使我们能够…

读书|林曦:她把自己的生活,过成了无用但丰盈的美学

时代在以加速度的方式变化,让人难以从容。而当我们陷于横向的比较系统,权衡着卷、躺、润时,也有人在探寻另一条纵向的路——向古人学习,以传统美学关照和滋养当下生活。      立夏之际,水墨画家林曦的新作《无用之…

c++ 11标准模板(STL) std::set(十)

定义于头文件 <set> template< class Key, class Compare std::less<Key>, class Allocator std::allocator<Key> > class set;(1)namespace pmr { template <class Key, class Compare std::less<Key>> using se…

【Java EE】Springboot

Springboot Springboot 核心功能SpringBoot的相关好处 Springboot 核心功能 1、 可独立运行的Spring项目&#xff1a;Spring Boot可以以jar包的形式独立运行。 2、 内嵌的Servlet容器&#xff1a;Spring Boot可以选择内嵌Tomcat、Jetty或者Undertow&#xff0c;无须以war包形…

系统学习大模型的20篇论文

【引子】“脚踏实地&#xff0c;仰望星空”&#xff0c; 知其然还要知其所以然。读论文是一条重要的途径&#xff0c;这一篇文章https://magazine.sebastianraschka.com/p/understanding-large-language-models非常值得借鉴&#xff0c;不敢私藏&#xff0c;编译成文。 大型语言…

Java操作MongoDB

上一篇文章: http://blog.csdn.net/gaowenhui2008/article/details/40045719 介绍到了在MongoDB的控制台完成MongoDB的数据操作&#xff0c;通过前一篇文章我们对MongoDB有了全面的认识和理解。现在我们就用Java来操作MongoDB的数据。 开发环境&#xff1a; System&#xff1a…