3D 生成重建032-Find3D去找到它身上的每一份碎片吧

news/2024/12/13 5:44:24/

3D 生成重建032-Find3D去找到它身上的每一份碎片吧


文章目录

    • 0 论文工作
    • 1 论文方法
    • 2 实验结果

0 论文工作

该论文研究三维开放世界部件分割问题:基于任何文本查询分割任何物体中的任何部件。以往的方法在物体类别或部件词汇方面存在局限性。最近人工智能的进步在二维图像中展现了有效的开放世界识别能力。受此启发,提出了一种开放世界直接预测模型,用于三维部件分割,可对任何物体进行零样本应用。该方法叫FIND3D,在一个大型互联网三维资产数据集上训练了一个通用类别点嵌入模型,无需任何人工标注。它结合了一个由基础模型驱动的用于数据标注的数据引擎和一种对比训练方法。
实际上这个当法的策略跟我们前面提到的将SAM知识蒸馏到3D空间的工作相近,主要体现在目标上的不同。不同的是该方法借助这种标注结果去训练一个3d分割大模型
paper
github
相关论文
langsplat
LERF
gaussian grouping
feature 3DGS
SA3D

1 论文方法

请添加图片描述
请添加图片描述

FIND3D旨在解决现有三维部件分割方法在物体类别和部件词汇上的局限性问题。它通过以下三个关键步骤实现目标:
数据引擎: 利用2D基础模型(SAM和Gemini)自动标注来自互联网的大规模三维资产,生成包含150万个部件标注的数据集。这个数据引擎无需人工标注,极大提升了数据获取效率。
模型训练: 基于标注数据,训练一个基于Transformer的点云模型。采用对比学习方法,解决部件层次结构和歧义问题,提高模型的泛化能力。
零样本预测: FIND3D能够对任何物体和任意文本查询进行零样本预测,直接输出部件分割结果。
自动数据标注: FIND3D的数据引擎实现了对三维数据的自动标注,避免了耗时的人工标注过程,极大地降低了数据获取成本,并使得训练大规模模型成为可能。
基于Transformer的点云模型和对比学习: 使用基于Transformer的架构处理点云数据,能够有效地捕捉点与点之间的长程依赖关系。同时,采用对比学习方法,有效地解决了部件层次结构和歧义问题,提高了模型的鲁棒性和准确性。

2 实验结果

请添加图片描述


http://www.ppmy.cn/news/1554678.html

相关文章

前端实现在线预览excel文件

在前端开发中,经常会遇到需要在线预览各种文件的需求。本文将介绍如何使用前端技术实现在线预览 Excel 文件的功能。 一、基于微软office服务的excel预览 获取要预览的 Excel 文件的 URL(例如存储在 OneDrive 或 SharePoint 上的文件)。 使…

基于Couchbase的数据构建方案:数仓分层

初步方案是将公共层和报表层分别放在不同的bucket中,这种设计从存储和访问优化的角度是合理的,但仍有以下细节需要考虑: 1. 数仓公共层设计(origin bucket) 合理性分析: 将ODS、DWD、DWS层的数据放在一个b…

2024-2025关于华为ICT大赛考试平台常见问题

一、考生考试流程 第一步:收到正式考试链接后点击考试链接并登录; 第二步:请仔细阅读诚信考试公约,阅读完成后勾选“我已阅读”,并点击确定; 第三步:上传身份证人像面进行考前校验&#xff0…

CTF-WEB: php-Session 文件利用 [第一届国城杯 n0ob_un4er 赛后学习笔记]

step 1 搭建容器 教程 A5rZ 题目 github.com Dockerfile 有点问题,手动修复一下 FROM php:7.2-apacheCOPY ./flag /root COPY ./readflag / COPY ./html/ /var/www/html/ COPY ./php.ini /usr/local/etc/php/php.ini COPY ./readflag /readsecretRUN chmod 755 /var/www…

Spring Boot微服务架构:从入门到精通

引言 在当今快速发展的软件开发领域,微服务架构以其灵活性和可扩展性成为了构建大型应用的首选。Spring Boot作为Spring家族的一员,以其简化配置和快速开发的特点,成为了实现微服务架构的热门选择。本文将带你从Spring Boot微服务的入门知识…

ThinkPHP 5.1 的模板布局功能

ThinkPHP 5.1 的模板布局功能,包括全局配置、模板标签以及动态方法布局三种方式。以下是对这三种方式的要点概括和补充,以便于更好地理解和使用: 方式一:全局配置方式 适用于全站使用相同布局的情况,配置简单且统一。…

长短期记忆神经网络(LSTM)介绍

1、应用现状 长短期记忆神经网络(LSTM)是一种特殊的循环神经网络(RNN)。原始的RNN在训练中,随着训练时间的加长以及网络层数的增多,很容易出现梯度爆炸或者梯度消失的问题,导致无法处理较长序列数据,从而无…

9. Win11上原生运行Ubuntu

本文介绍如何在win11原生系统上运行ubuntu,不需要额外安装虚拟机,以及如何配置网络等。 1.安装正版Win11 由于正版Win11需要钱,网上能破解的win11可能有问题,但是它们的破解工具,却是能正常用的,所以&…