【 AIGC 研究最新方向(下)】面向平面、视觉、时尚设计的高可用 AIGC 研究方向总结

embedded/2024/9/24 8:23:31/

目前面向平面、视觉、时尚等设计领域的高可用 AIGC 方向有以下 4 种:

  1. 透明图层生成
  2. 可控生成
  3. 图像定制化
  4. SVG 生成

本篇(下篇)介绍 3、4,上篇在:https://blog.csdn.net/weixin_44212848/article/details/138035279?spm=1001.2014.3001.5501

图像定制化 - InstantID

代表性论文:InstantID: Zero-shot Identity-Preserving Generation in Seconds
论文链接:https://arxiv.org/abs/2401.07519
代码仓库:https://github.com/InstantID/InstantID

核心功能:可以将输入人脸图片作为生成结果的主体,实现在一般文生图过程中实现不了的定制化效果,正所谓“一图胜千言”。此外,和一般 LoRA 等方法不同之处是,(1)不需要再次微调(Tuning-free),(2)需要的图像一张就足以(Zero-shot)。

在这里插入图片描述

研究背景:使用Texture Inversion、DreamBooth和LoRA等方法在个性化图像合成方面取得了重大进展。然而,它们在现实世界中的适用性受到高存储需求、漫长的微调过程以及对多个参考图像的需求的阻碍。

现存挑战:相反,现有的基于ID嵌入的方法虽然只需要单一的前向推理,但面临着挑战:它们要么需要对众多模型参数进行广泛的微调,要么与社区预先训练的模型缺乏兼容性,要么无法保持高的人脸保真度。

InstantID 是一个即插即用模块,仅使用一张人脸图像即可熟练地处理各种风格的图像个性化,同时确保高保真度。为了实现这一点,我们设计了一个新颖的IdentityNet,通过强加强语义和弱空间条件,将面部和地标图像与文本提示相结合来引导图像生成。InstantID展示了卓越的性能和效率,在身份保护至关重要的现实应用程序中证明了这一点。此外,我们的工作与流行的预训练文本到图像扩散模型(如SD1.5和SDXL)无缝集成,作为一个适应性插件。

SVG 生成 - SVGDreamer

代表性论文:SVGDreamer: Text Guided SVG Generation with Diffusion Model (CVPR 2024)
论文地址:https://arxiv.org/abs/2312.16476
代码地址:https://github.com/ximinng/SVGDreamer

不做设计的同学平时可能不太会接触到矢量图 SVG(Scalable Vector Graphics),矢量图(SVG)和位图(如PNG)是两种不同的图像格式,对于真实的设计应用场景来说:SVG图像可以轻松编辑,因为它们基于数学公式,可以通过文本编辑器或专用的矢量图形编辑软件进行修改。而位图图像在编辑时会受到限制,因为它们是基于像素的,需要使用像素编辑软件,而且编辑时容易失真或损失质量。

在这里插入图片描述

研究背景:最近,文本引导的可扩展矢量图形(SVG)合成在图像学和素描等领域显示出了前景。然而,现有的文本到SVG的生成方法缺乏可编辑性,并且难以获得视觉质量和结果的多样性。

具体方法:SVGDreamer 结合了语义驱动的图像矢量化(SIVE)过程,该过程能够将合成分解为前景对象和背景,从而增强可编辑性。

  1. 具体而言,SIVE过程引入了基于注意力的基元控制和注意力掩码丢失函数,用于有效控制和操纵单个元素。
  2. 此外,我们提出了一种基于矢量化粒子的分数蒸馏(VPSD)方法,通过将SVG建模为控制点和颜色的分布,来解决现有文本到SVG生成方法的形状过平滑、颜色过饱和、多样性有限和收敛缓慢的问题。
  3. 此外,VPSD利用奖励模型对矢量粒子进行重新加权,这提高了美学吸引力并加速了收敛。

结论:进行了大量实验来验证SVGDreamer的有效性,证明了其在可编辑性、视觉质量和多样性方面优于基线方法。


http://www.ppmy.cn/embedded/21877.html

相关文章

常用的Git和Linux命令

Git命令: Git是一个分布式版本控制系统,它可以帮助开发者跟踪和管理代码的变化。 git init:初始化一个Git仓库 git clone:克隆一个已有的Git仓库到本地 git add:将当前目录下的修改添加到暂存区 git commit&#xff1…

Ansible自动化运维工具主机清单配置

作者主页:点击! Ansible专栏:点击! 创作时间:2024年4月24日12点21分 Ansible主机清单文件用于定义要管理的主机及其相关信息。它是Ansible的核心配置文件之一,用于Ansible识别目标主机并与其建立连接。 …

前端复习资料

前端复习资料 落叶的位置,谱出一首诗,时间在消逝,我们的故事。 这篇文章呢,整理写给需要的前端同学的。 核心知识,必须掌握的,也是最基础的,譬如浏览器模型,渲染原理,JS…

LabVIEW飞机机电系统综合测试平台

LabVIEW飞机机电系统综合测试平台 在现代航空领域,机电系统的准确性与可靠性对飞行安全至关重要。针对飞机机电管理计算机(UMC)复杂度增加、测试覆盖率低、效率不高等问题,开发了一套基于LabVIEW的机电系统综合测试平台。平台通过…

有效三角形的个数 ---- 双指针

题目链接 题目: 分析: 这道题的意思就是将数组的元素, 拿出三个数, 能构成三角形就是有效的判断是否能构成三角形的条件: 两边之和大于第三边, 我们只需找到三个数中最小的两个数之和是否大于第三边, 大于则可以构成三角形解法一: 暴力解法, 即找到所有的三元组, 并挨个判断,…

MybatisPlus 页数page过大数据溢出问题

最近在修改公司代码时前端报了个奇怪的bug,即某个分页接口明明数据量只有42条,但是使用page 500 size 10 的配置时仍然可以查出数据 如下图所示 可见 total 属性只有 42条数据,页数都到500了但是很夸张的还是查出来10条数据 查询后端…

C语言-atoi和atof函数的使用

人生应该树立目标,否则你的精力会白白浪费。💓💓💓 目录 •🌙知识回顾 🍋知识点一:atoi函数的使用和实现 • 🌰1.函数介绍 • 🌰2.代码演示 • 🌰3.atoi函数的…

【电路笔记】-Colpitts振荡器

Colpitts振荡器 文章目录 Colpitts振荡器1、概述2、基本Colpitts 振荡器电路3、示例14、使用运算放大器的Colpitts振荡器5、总结Colpitts 振荡器设计使用两个中心抽头电容器与并联电感器串联,形成产生正弦振荡的谐振储能电路。 1、概述 在许多方面,Colpitts 振荡器与我们在上…