【 AIGC 研究最新方向(上)】面向平面、视觉、时尚设计的高可用 AIGC 研究方向总结

news/2024/10/20 11:57:18/

目前面向平面、视觉、时尚等设计领域的高可用 AIGC 方向有以下 4 种:

  1. 透明图层生成
  2. 可控生成
  3. 图像定制化
  4. SVG 生成

本篇(上篇)介绍 1、2,而下篇将介绍 3、4。

透明图层生成 LayerDiffuse

代表性论文:Transparent Image Layer Diffusion using Latent Transparency
论文链接:https://arxiv.org/abs/2402.17113
代码仓库(暂未完全开源):https://github.com/layerdiffusion/LayerDiffuse?tab=readme-ov-file

核心功能:可以在文生图基础模型(SD1.5,SDXL)之上,实现前后景的分层生成。使得生成图像能够更加适配 ps、 ai 等专业设计软件中的分层格式,让 SD 生成的图像更加适用于实际的设计工作中。
在这里插入图片描述
在这里插入图片描述
论文摘要:我们提出了LayerDiffuse,这是一种使大规模预训练的潜在扩散模型能够生成透明图像的方法。该方法允许生成单个透明图像或多个透明层。该方法学习一个“潜在透明度”,将阿尔法通道透明度编码到预训练的潜在扩散模型的潜在流形中。它通过将添加的透明度作为潜在偏移进行调节,使预训练模型的原始潜在分布变化最小,从而保持了大扩散模型的生产就绪质量。以这种方式,任何潜在扩散模型都可以通过利用调整后的潜在空间对其进行微调而转换为透明图像生成器。我们使用人在环采集方案采集的1百万个透明图像层对来训练模型。我们表明,潜在透明度可以应用于不同的开源图像生成器,也可以适用于各种条件控制系统,以实现前景/背景条件层生成、联合层生成、层内容的结构控制等应用。一项用户研究发现,在大多数情况下(97%),用户更喜欢我们原生生成的透明内容,而不是以前的特定解决方案,如生成然后抠图。用户还报告说,我们生成的透明图像的质量与Adobe Stock等真正的商业透明资产相当。

可控生成 ControlNet

代表性论文:Adding Conditional Control to Text-to-Image Diffusion Models
论文链接:https://arxiv.org/abs/2302.05543
代码仓库:https://github.com/lllyasviel/ControlNet

核心功能:可以在文生图基础模型(SD1.5,SDXL)之上,实现生成图像的结构控制。同样,也是让 SD 生成的图像更可控,更方便用于实际的设计工作中。
在这里插入图片描述

论文摘要:我们提出了ControlNet,这是一种神经网络架构,用于将空间条件控制添加到大型预训练的文本到图像扩散模型中。ControlNet锁定了可用于生产的大型扩散模型,并将其用数十亿张图像预训练的深度和稳健的编码层重新用作学习一组不同条件控制的强大骨干。神经架构与“零卷积”(零初始化卷积层)相连,该卷积层从零开始逐步增长参数,并确保没有有害噪声会影响微调。我们使用稳定扩散测试各种条件控制,例如边缘、深度、分割、人体姿势等,使用单个或多个条件,无论是否提示。我们证明了ControlNets的训练对于小(<50k)和大(>1m)数据集是稳健的。广泛的结果表明,ControlNet可以促进控制图像扩散模型的更广泛应用。


http://www.ppmy.cn/news/1442675.html

相关文章

eclipse 如何创建python文件

一、准备 1.平台要求&#xff1a; 电脑除了要安装eclipse软件和Python语言包之外&#xff0c;还需要将Python集成到eclipse软件中&#xff0c;网上有很多的方法&#xff0c;这里就不细细介绍如何集成了。 在下面界面中可以看到自己已经安装了继承插件。具体方法见步骤2&…

自動重啟Debian

要自動重啟Debian系統&#xff0c;你可以使用以下幾個方法&#xff1a; 使用crontab&#xff1a;編輯crontab文件&#xff0c;並添加以下行以設定定期重啟系統&#xff1a; reboot /sbin/reboot保存並退出文件。這將在系統重新啟動後運行/sbin/reboot命令&#xff0c;從而自動…

《HCIP-openEuler实验指导手册》1.4 Apache MPM工作模式调整

MPM介绍 二、配置步骤 查看MPM当前工作模式 方法一&#xff1a; httpd -M | grep mpm方法二&#xff1a; 浏览器访问&#xff1a;http://IP:端口/server-status 方法三&#xff1a; cat /etc/httpd/conf.modules.d/00-mpm.conf查看 LoadModule mpm_event_module modules/mo…

重庆思庄技术分享——Bug 12861117 RMAN 会话旋转

Bug 12861117 RMAN 会话旋转 现象&#xff1a; CPU 使用 率过高 挂起&#xff08;进程旋转&#xff09; RMAN-2005 / RMAN-565 / LFI-5 RMAN &#xff08;Recovery Manager&#xff09; 描述&#xff1a; 在某些情况下&#xff0c;如果写入日志文件时遇到磁盘已满的情况 或输入…

【设计模式】使用策略模式优化表单校验逻辑

什么是策略&#xff1f; 所谓策略&#xff0c;就是根据已知条件决定要做出怎样的行为。 举个栗子&#xff1a;我要实现一个表单校验功能&#xff0c;要求 name 不能为空且长度必须大于 2 且小于 4&#xff0c;age 不能为空且必须为纯数字。 这样的判断逻辑直接用 if-else 就…

wow-string-list文件说明

wow-string-list文件说明 项目地址&#xff1a;https://gitee.com/wow-iot/wow-iot7本文件主要功能用于字符串链表相关操作&#xff0c;主要涉及创建、销毁、插入、获取、分隔、格式转换&#xff1b; 初始化与退出: StringList_T* wow_stringlist_new(void) {return (String…

P44,45 属性预处理,执行后游戏效果回调,附录指定区域内修改变量

这节课主要是怎么对Attribute进行在进行到游戏角色前先进行处理,以及游戏效果如何回调 AuraAttributeSet.h // Fill out your copyright notice in the Description page of Project Settings.#pragma once#include "CoreMinimal.h" #include "AttributeSet.h&…

Docker搭建MySQL Workbench

MySQL Workbench 是一款图形界面工具&#xff0c;用于数据库设计、开发、管理和维护MySQL、MariaDB和Percona Server数据库。它提供了SQL开发、数据库设计、服务器配置等功能。 实际应用场景 数据库设计&#xff1a;创建ER模型&#xff0c;生成数据库架构。SQL开发&#xff1…