3D 生成重建030-SV3D合成环绕视频以生成3D

server/2024/12/16 7:36:59/

3D 生成重建030-SV3D合成环绕视频以生成3D


文章目录

    • 0 论文工作
    • 1 论文方法
    • 2 实验结果

0 论文工作

论文提出了Stable Video 3D (SV3D)——一个用于生成围绕三维物体的高分辨率图像到多视角视频的潜在视频扩散模型。最近关于三维生成的文献提出了将二维生成模型应用于新视图合成 (NVS) 和三维优化的技术。然而,这些方法由于视角有限或 NVS 不一致而存在一些缺点,从而影响了三维物体的生成性能。在这项工作中,作者提出了SV3D,它采用图像到视频的扩散模型进行新视图合成和三维生成,从而利用视频模型的泛化能力和多视角一致性,并为 NVS 添加显式相机控制。作者还提出了改进的三维优化技术,利用 SV3D 及其 NVS 输出进行图像到三维生成。在包含二维和三维指标的多个数据集上的大量实验结果以及用户研究表明,与之前的工作相比,SV3D 在 NVS 和三维重建方面具有最先进的性能。
就目前看到的一些工作来说,在测试中,一半以上的情况视频扩散模型在3D数据上的微调效果没有明显超过直接生成多视图。
paper
github
相关论文
video LDM

1 论文方法

请添加图片描述
SV3D 旨在解决现有图像到三维重建方法中新视角合成(NVS)不一致和三维优化效率低下的问题。它主要包含两个阶段:
新视角合成 (NVS): 首先,利用一个预训练的、图像到视频的潜在视频扩散模型 (SVD),从单张输入图像生成围绕目标物体的多视角一致的视频帧。该模型具有良好的泛化能力和多视角一致性,并通过显式控制相机参数来实现可控的新视角生成。
三维模型优化: 然后,利用改进的三维优化技术,结合生成的视频帧,优化三维模型(例如NeRF或DMTet网格)。该优化过程使用了改进的遮挡感知分数蒸馏采样(SDS)损失函数,以提高不可见区域的三维重建质量。
利用潜在视频扩散模型进行新视角合成: 这是SV3D最主要的创新点。它不同于以往使用图像扩散模型生成新视角的方法,而是巧妙地利用了潜在视频扩散模型(SVD)的优势。视频模型天生具有时间一致性和泛化能力强的特点,这使得SV3D生成的新视角在一致性和质量上都优于现有方法,并且对不同类型的输入图像具有更好的鲁棒性。
显式相机参数控制: SV3D在生成新视角时,可以显式控制相机参数(例如,方位角和仰角),从而实现对生成视角的精确控制,这在以往的图像到三维重建方法中并不常见,极大提升了可控性。
改进的三维优化技术和遮挡感知SDS损失: SV3D采用改进的三维优化技术,并结合遮挡感知SDS损失函数,能够更有效地利用多视角信息进行三维重建,特别是对于在输入图像中不可见的部分,提高了重建的精度和完整性。

2 实验结果

感觉生成结果在很多种类上不是很好。应该说不如理想那么好,首先视频扩散模型在3d数据上微调的时候,可能造成计算量大很多倍,微调后后3D感知还是不够。请添加图片描述


http://www.ppmy.cn/server/150565.html

相关文章

小程序开发中的插件生态与应用-上

更多精彩内容都在公zhong号:小白的大数据之旅 在小程序的开发过程中,插件作为扩展功能、提升效率的重要工具,扮演着不可或缺的角色。它们不仅能够帮助开发者快速集成复杂的功能模块,还能优化开发流程,缩短项目周期。 …

基于小程序实现日历课表、排班表、月份切换、快捷周切换、自定义课程内容、课程颜色、Mock数据开箱即用

目录 引言小程序开发背景本文目标:实现日历课表/排班表适用场景:学生课表、员工排班、日程安排等需求分析支持日历视图和课表/排班视图可以查看、添加、编辑、删除课表/排班项支持按周、月查看总结说明参考代码数据Mock引言 本文将介绍如何基于小程序实现一个日历课表和排班表…

数据结构题集-第三章-栈和队列-Ackerman函数

Ackerman函数 说明3.27 已知Ackerman函数的定义如下(1)递归算法如下(2)非递归算法如下(3) a k m ( 2 , 1 ) akm(2,1) akm(2,1)时栈的变化过程如下 说明 本文参照严蔚敏《数据结构(C语言版)题集》一书中包含…

@Repository

Repository 是 Spring 框架中用来标识数据访问对象(DAO)层的注解。以下是关于 Repository 注解的一些关键点: Bean 注册:Repository 注解会自动将使用该注解的类注册为 Spring 容器中的 Bean,无需在 XML 配置文件中显式…

UE4_贴花_贴花基础知识一

贴花可以将材料和各种材料元素投影到表面上。您可以使用它们来添加独特的效果。贴花 是一种可以投射到网格体(包括静态网格体和骨骼网格体)上的材质。无论这些网格体的移动性(Mobility)是静态(Static)还是可…

oracle网络架构

Oracle 网络配置文件 Oracle 的网络配置主要涉及三个关键的文件:listener.ora、tnsnames.ora 和 sqlnet.ora。这些文件通常位于 $ORACLE_HOME/network/admin/ 目录下,$ORACLE_HOME 是 Oracle 安装目录的环境变量,通常为 /u01/app/oracle/pro…

MIF格式详解,javascript加载导出 MIF文件示例

MIF 格式详解 MIF(MapInfo Interchange Format)是由Pitney Bowes Software开发的一种文本格式,用于存储地理空间数据。它通常与地图可视化和地理信息系统(GIS)相关联。MIF文件通常成对出现,一个.mif文件用…

基于SpringBoot的疫苗在线预约功能实现十

一、前言介绍: 1.1 项目摘要 随着全球公共卫生事件的频发,如新冠疫情的爆发,疫苗成为了预防和控制传染病的重要手段。传统的疫苗预约方式,如人工挂号或电话预约,存在效率低、易出错、手续繁琐等问题,无法…