英伟达 Magic3D:一句话生成3D模型,分辨率清晰8倍,速度快2倍,编辑文本还可直接修改...

news/2024/11/23 10:01:29/
丰色 发自 凹非寺  量子位 | 公众号 QbitAI

一句话生成3D模型,英伟达也来“秀肌肉”了~

来看它最新捣鼓出的Magic3D AI,效果是这样儿的。

输入“坐在睡莲上的蓝色箭毒蛙”,就能得到这样一个细节丰富的3D模型:

baa5434bd6fc789789cdd2e98fc8f796.gif

“摆满了水果的银盘”也难不倒它:

bbf7e25c6a10129fab5a54b293799689.gif

还有诸如“鸟瞰角度的城堡”、“用寿司做的汽车”、“装着蛋的鸟巢”、“用垃圾袋做的裙子”……

4b23b707d7bd8602855f7fd6fbfdb1ce.gif

精准程度可见一斑。

除了这个主要本领,它还可以通过编辑文本完成模型的修改:

a9b1a5edb909e9585fe6417fb79ff5fb.gif

或者在输入中携带一些图片,最终成果就可以保留图中的风格或者主要“人物”。

9d0d758b4d596c7a7eef0b885d0d8f5c.png
b7dcc0e111dd2cf618c1ab3419334cb0.png

不知道这把有没有打到你的心巴上?

反正建模师看了都要喊失业了……

f3cc8f78fb017ee0410e3295373d7339.png
fd5f870afac6ae3f976428e6cadf9a9f.png

如何做到?

据介绍,Magic3D快速、高质量地得到结果所采用的策略是“从粗到细”,一共经过两阶段:

低分辨率优化和高分辨率优化。

af94f4a6c35b7ef4be8eecf24340167e.png

它使用eDiff-l作为模型的低分辨率文本到图像扩散先验(diffusion prior)。

首先,第一阶段,采用英伟达今年推出的3D重建模型Instant NGP,并对其优化,生成初始3D模型。

具体来说,就是通过重复采样和渲染低分辨率图像,计算出SDS损失,让Instant NGP给出结果。

注:SDS全称得分蒸馏采样(Score Distillation Sampling),是谷歌提出的一种新的采样方法,它无需对扩散模型进行反向传播更新。

这步完成后,就使用DMTet提取出初始3D mesh,作为第二阶段的输入。

第二阶段采用高分辨率文本到图像潜(latent)扩散先验。

还是使用同样的方法,对高分辨率图像进行采样和渲染,并使用相同的步骤进行更新,得到最终结果。

唯一的不同,就是本阶段的操作都是在第一阶段得出的初始“糙”模型上进行的。

比DreamFusion分辨率高8倍,速度快2倍

关注这一领域的朋友知道,一句话生成3D模型的AI中,目前最受关注的当属谷歌今年9月刚发布的DreamFusion

0b688af10bcc94bc1591e71deb123502.gif

它通过一个预先训练的二维文本到图像扩散模型来完成最终的文本到三维合成,效果惊艳。

那么,英伟达刚推出的这个Magic3D,与之相比如何?

经实验对比发现,后来者显然更胜一筹,主要表现在分辨率和速度上:

Magic3D的分辨率比DreamFusion高8倍,速度快2倍——只需在40分钟之内即可完成一次渲染。

而在具体效果上,Magic3D的生成结果也更细节一些,比如下面的“仙人掌”、“房子”和“草莓”等(左为Magic3D,右为DreamFusion)。

49eb3544c073593e30f3b0019be54c5b.png
999e98ef37eb7fe6c3d2c21f01ea625a.png

不过,遗憾的是,Magic3D还并未像DreamFusion一样已开源。

关于作者

一共有10位。

ca0cee9c37ab3127c381934adaeeadc6.png

前5位都具有同等贡献,包括:

现英伟达研究科学家、博士毕业于CMU机器人专业的Lin Chen-Hsuan,他曾在Facebook人工智能研究部和Adobe实习;

正在多伦多大学读博士的Gao Jun,北大计算机本科毕业;

正在多伦多读博士的Zeng Xiaohui,香港科技大学毕业;

以及同样来自该大学的Towaki Takikawa;

最后是正在康奈尔大学读博士的唐路明,清华大学物理和数学专业本科毕业。

论文地址:
https://arxiv.org/abs/2211.10440

项目主页:
https://deepimagination.cc/Magic3D/

参考链接:
https://twitter.com/_akhaliq/status/1594505474774278147?s=46&t=Dc0f1ExmRsdk_PHz2JX-IA

猜您喜欢:

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

3ea9f48e2789a6aceade77d47c2982c4.png 戳我,查看GAN的系列专辑~!

一顿午饭外卖,成为CV视觉的前沿弄潮儿!

最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云:独学而无友,则孤陋而寡闻

欢迎加入 GAN/扩散模型 —交流微信群 !

扫描下面二维码,添加运营小妹好友,拉你进群。发送申请时,请备注,格式为:研究方向+地区+学校/公司+姓名。如 扩散模型+北京+北航+吴彦祖

3ccf2b31e973458f2ec47be2b3ab6eca.jpeg

请备注格式:研究方向+地区+学校/公司+姓名

b7824377bc0ab944e9f484b4e9a03a0b.jpeg

点击 一顿午饭外卖,成为CV视觉的前沿弄潮儿!,领取优惠券,加入 AI生成创作与计算机视觉 知识星球!


http://www.ppmy.cn/news/715184.html

相关文章

至尊无上“武林神话”——下载最强3dmax插件神器|高效顶级3dmax插件神器“王者荣耀”加冕?满血拉二胡,开挂横着走!

找各种软件、办公、装机帮助手册——点击进入引申热文——各行业软件大全更新中【19年11月“一设计群”整理】 上为设计办公系统装机自助方法步骤手册(每个版本进入后都有下载链接,请选中后复制到浏览器、再输入提取码下载)。下为正文内容&am…

FairMOT配置(笔记本3060显卡+VS2017+Win10+CUDA11.1)

来记录一下自己艰难的配置过程。 配置环境 Win10 VS2017 CUDA11.1 Pytorch1.7 配置步骤: 1、vs2017安装 安装vs2017community版本,默认路径安装,只安装了红框中的“使用C的桌面开发”。 安装完成后,环境变量的配置如下。W…

3DMAX下载、3dmax2014下载、3dmax2020下载亲测有效

3DMAX下载-3dmax2014-2020下载 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 3DMAX下载、3dmax2014下载、3dmax2020下载亲测有效一、3dmax是什么?二、3dmax2014-3dmax20201.下载链接2.安装教程 总结 …

Python递归算法从入门到精通

递归是一种常见且重要的算法设计和解决问题的方法。它通过将问题分解为规模更小的子问题,并通过解决子问题来解决原始问题。递归算法的关键在于找到递归终止条件和递归调用的方式。本文将介绍递归的基本原理、应用场景,并通过相关的Python代码示例详细讲…

【Mysql】Explain深入分析(三)

Explain工具介绍 使用EXPLAIN关键字可以模拟优化器执行SQL语句,分析你的查询语句或是结构的性能瓶颈 在 select 语句之前增加 explain 关键字,MySQL 会在查询上设置一个标记,执行查询会返回执行计划的信息,而不是执行这条SQL 注意…

软路由修改ip地址

1.进入Virtual Box。 2.启动KoolShare 软路由虚拟机,如下图 3.软路由启动后,类似下图,点击回车,出现命令行, 编辑 /etc/config/network 文件。 4.编辑 config interface ‘lan 部分的 option ipaddr 为 “192.168.66.…

IP地址变更流程

业务升级和迁移时,我们常常需要变更IP地址,要怎样程式化的变更呢?今天分享更改IP地址的一般流程。 1.和业务方确认要更换的IP地址 2.将原来IP地址所在服务器上的业务切走(可以切走也可以重新搭建) 3.提交工单&#xff…

修改IP的cmd命令

修改IP的cmd命令 设置固定IP 1.打开运行(winr) 2.键入cmd 3.输入命令:netsh interface ip set address “以太网” static 192.168.2.221 255.255.255.0 192.168.2.254 netsh i i set address “以太网” static 192.168.0.3 255.255.255.0 …