3D 生成重建033-对3D-head进行风格化编辑

news/2024/12/15 14:32:37/

3D 生成重建033-对3D-head进行风格化编辑


文章目录

    • 0 论文工作
    • 1 论文方法
    • 2 实验结果

0 论文工作

今天想分享的是跟我们之前在做的一个任务比较像的工作,对avatar生成不同风格的外观。
三维头部风格化将逼真的面部特征转换成艺术化的表达形式,从而提升了游戏和虚拟现实等应用的用户参与度。虽然三维感知生成器取得了显著进展,但许多三维风格化方法主要提供近正面视图,并且难以保留原始人物的独特身份特征,常常导致输出缺乏多样性和个性。本文通过利用PanoHead模型(该模型能够从360度视角合成图像)来解决这些挑战。改论文出了一种新颖的框架,该框架采用负对数似然蒸馏(LD)来增强身份特征的保持并提高风格化的质量。通过在三维GAN架构中整合多视图网格分数和镜像梯度,并引入一种分数等级加权技术。尝试推动了三维头部风格化的发展,也为扩散模型和GAN之间的有效蒸馏过程提供了宝贵的见解,重点关注身份特征的保持问题。
paper
github

1 论文方法

3dc425b7a7354519a4969cc0dfb041f8.png" alt="请添加图片描述" />
简单来说就是用不同结构的sds来优化PanoHead模型。
该论文提出了一种基于PanoHead模型的多视图分数蒸馏方法,来解决这一问题。PanoHead模型能够生成360度视角的图像,为实现高质量的三维风格化提供了良好的基础。
这篇论文的主要工作在于以下几个方面:
多视图分数蒸馏: 论文的核心创新在于利用多视图分数蒸馏技术来进行风格化。以往的方法通常只使用单一视图或近正面视图进行风格化训练,这导致生成图像缺乏多样性和个性,并且难以保持身份特征。该论文利用PanoHead模型生成的360度视角图像,并通过分数蒸馏技术将扩散模型的风格化能力迁移到GAN模型中,从而实现了高质量的多角度风格化,同时保留了原始身份特征。
分数等级加权和镜像梯度: 为了进一步提升风格化效果和身份保持能力,论文提出了分数等级加权技术和镜像梯度技术。分数等级加权技术对不同维度上的分数进行加权,从而更好地保留重要特征,例如发型、眼镜等。镜像梯度技术则利用了人脸的镜像对称性,从而进一步提高了风格化效果和身份保持能力。
结合扩散模型和GAN: 论文巧妙地结合了扩散模型和GAN模型的优点。扩散模型擅长生成多样化的图像,而GAN模型擅长生成高质量的图像并保持身份特征。论文提出的多视图分数蒸馏方法将扩散模型的风格化能力迁移到GAN模型中,从而实现了在保证图像质量的同时,提升图像多样性和身份保持能力。

2 实验结果

请添加图片描述


http://www.ppmy.cn/news/1555317.html

相关文章

快速进行tmux及vim配置,打造终端IDE

代理配置 IP"192.168.X.X" PORT"XX" export http_proxy"http://$IP:$PORT" export https_proxy"http://$IP:$PORT"关于tmux部分的快速配置使用 yum install -y tmux git config --global http.sslverify false git clone https://gi…

rabbitmq问题,消费者执行时间太长,超过心跳时间,消费者消失,任务堆积

rabbitmq问题,消费者执行时间太长,超过心跳时间,消费者消失,任务堆积 1.python多线程使用rabbitmq包地址 flask_rabbitmq 2.解决后的包 import json import logging import signal import sys import threading import time i…

算法学习——双指针

今天我来分享下算法中的双指针 概念: 双指针是一种常见的算法技巧,通常用于解决数组和链表相关的问题的。 它通过使用两个指针来遍历数据结构,从而在一次遍历中完成某些任务,提高了效率。 注意这里的指针,可不是C语…

GIGABYTE技嘉主板电脑前端耳机接口无声音输出

一、基本情况 今年5月份,台式机电脑配有外放音响,接在主机后端耳机口。使用外放音响多,很少使用前置耳机接口。今天感觉外放效果不明显,想用耳机。拔掉外放音响后,耳机插入前端接口,发现没有声音输出。于是…

python学opencv|读取图像(九)用numpy创建黑白相间灰度图

【1】引言 前述学习过程中,掌握了用numpy创建矩阵数据,把所有像素点的BGR取值设置为0,然后创建纯黑灰度图的方法,具体链接为: python学opencv|读取图像(八)用numpy创建纯黑灰度图-CSDN博客 在…

状态管理实战:一次 Redux 到 React Query 的重构之旅

"老师,我们的后台管理系统状态管理好混乱啊!"上周二的代码评审会上,小王一脸苦恼地说道。我打开代码仓库看了看,确实问题不小 - Redux store 里堆满了各种数据,有本地状态,有服务器数据,还有一些缓存,导致代码难以维护,性能也受到影响。 说实话,这个问题…

XML 在线格式化 - 加菲工具

XML 在线格式化 打开网站 加菲工具 选择“XML 在线格式化” 输入XML,点击左上角的“格式化”按钮 得到格式化后的结果

ERC论文阅读(03)--instructERC论文阅读笔记(2024-12-14)

instructERC论文阅读笔记 2024-12-14 论文题目:InstructERC: Reforming Emotion Recognition in Conversation with Multi-task Retrieval-Augmented Large Language Models 说明:以下内容纯属本人看论文及复现代码的记录,如想了解论文细节&…