Stable Diffusion XL:更快,更强

news/2024/11/22 16:22:02/

Stable Diffusion XL:更快,更强

今天,Stability AI 的创始人兼首席执行官 Emad Mostaque 发推宣布,Stable Diffusion XL 进入公测阶段。

核心信息总结起来有2点:

  1. “XL”不是新模型的官方名称,Stability AI后面会官宣正式名称;
  2. 图片生成质量得到了进一步提升;
  3. 图像生成速度比之前版本快很多。

实际效果到底怎么样,我给大家做了一个对比。

Stable Diffusion XL is here — What’s new?

文章目录

    • 效果对比
    • 如何获取
    • 价格分析
    • 总结

效果对比

Prompt: Luxury sports car with aerodynamic curves, shot in a high contrast, high key lighting with shallow depth of field, exotic, detailed, sporty, studio lighting, HQ, 4k

Stable Diffusion 2.1Stable Diffusion XL
在这里插入图片描述在这里插入图片描述

∗ ∗ ∗ \ast\ast\ast

Prompt: Bowl of steaming hot ramen with a perfect egg in the center, surrounded by thin slices of meat, green onions, and nori, with a flavorful broth and perfect noodles, high detail, focused on texture and steam

Stable Diffusion 2.1Stable Diffusion XL
在这里插入图片描述在这里插入图片描述

∗ ∗ ∗ \ast\ast\ast

Prompt: Enchanting waterfall in a lush jungle, surrounded by exotic plants and wildlife, tranquil, serene, high detail, tropical landscape

Stable Diffusion 2.1Stable Diffusion XL
在这里插入图片描述在这里插入图片描述

坦白说,我真的没有看到新模型有在图像生成质量上有令人眼前一亮的改进。 在某些情况下,XL生成的图片整体上会更好看一些,但这见仁见智,没有显著的差异。也许需要在设置中进行一些调整才能产生令人惊叹的效果。

在生成速度方面,确实有所提高,但不像Emad Mostaque说的那样“大幅提高”,可能与硬件环境有关。

上面图片你认为哪个更好,可以评论区点评,或文章末尾参与投票。

如何获取

Stable Diffusion XL(测试版)可在新的 Dreamstudio 网站上访问。

Deamstudio new website

旧版网站上似乎现在也可以访问了:

Deamstudio legacy website

价格分析

官网依然是根据点数向你收费。

$10 = 1000 点

具体消耗多少点数取决于图像的大小和生成步数,下表是Stability AI的价格模型:

步数512×512512×768512×1024768×768768×10241024×1024
150.10.30.40.50.71.0
300.20.50.81.01.41.9
500.40.91.31.62.33.2
1000.71.72.63.14.56.4
1501.02.53.94.66.79.5

如果将所有设置设为默认值,那么 1000 点大约可生成 5000 张图片。

总结

总的来说,新模型并没有给我留下深刻印象。 MidJourney、Leonardo AI 和 Microsoft Image Generator 仍然有更好看的生成效果。

尽管 Stable Diffusion XL 与之前的 AI 模型相比似乎没有显着进步,但它仍然向前迈进了一步,并且肯定还有进一步改进的空间。

我期待Stability AI官方能够公布更多细节,而且我坚信最终正式发布的产品会比预览模型更好。


http://www.ppmy.cn/news/52646.html

相关文章

【cuda】Nsight System 下载,安装与使用

Nsight System 下载 nsys 是 NVIDIA Nsight Systems 的命令行工具,可以用于分析 CUDA 应用程序的性能和行为。以下是在 Linux 上安装 nsys 的步骤: 下载 NVIDIA Nsight Systems 安装程序。您可以在 NVIDIA 的官方网站上下载适用于您的系统的安装程序。…

手推A Unified Solution to Constrained Bidding in Online Display Advertising论文

A Unified Solution to Constrained Bidding in Online Display Advertising:一种对在线展示广告约束出价问题的通用解决方案 未开放但是可以搜到 NeuralAuction: 电商广告中的端到端机制优化方法 https://arxiv.org/abs/2106.03593 一种使用真负样本的在线延迟反…

【LPC55s69】使用FAL分区管理与easyflash变量管理

文章目录 1.FAL组件1.1什么是FAL1.2 使用ENV配置FAL1.3 FAL SFUD 移植1.4 FAL SFUD 测试用例1.5 测试结果 2.DFS文件系统2.1 什么是DFS2.2 DFS架构2.3 使用ENV配置DFS2.4 DFS挂载到FAL分区测试2.5 测试结果 3.Easyflash移植到FAL分区3.1 简述EasyFlash3.2EasyFlash软件包使用3.…

【LeetCode】650. 只有两个键的键盘

650. 只有两个键的键盘(中等) 思路 不同于以往通过加减实现的动态规划,这里需要乘除法计算位置。因为粘贴操作是倍数增加,使一个一维数组 dp,其中位置 i 表示延展到长度 i 的最少操作次数。对于每个位置 j &#xff0c…

WMS是什么?

WMS(Warehouse Management System)中文译作仓库管理系统,是一种专用于物流仓储管理的IT系统。它主要应用于企业物流中心、配送中心、供应商物料储备中心、电子商务配送中心等仓库管理过程中。 WMS系统可以帮助企业管理和控制其物流仓储流程。…

HOG+SVM分类器实践

文章目录 HOGSVM分类器实践制作SVM分类器导入所需的库提取HOG特征读取正样本和负样本训练分类器定义主函数小结 测试SVM分类器相关疑问1. 提取HOG特征为什么不能彩色图像呢?2. 出现如下错误3. 测试代码中,当我传入100*100的图片时候,为什么im…

玩机搞机----mtk芯片机型 另类制作备份线刷包的方式 读写分区等等

前面分享了几期高通和mtk芯片机型备份字库的几种方法教程。这些针对与很多没有线刷包资源的手机机型玩机操作。前面对接一个友商的mtk芯片杂牌机。和另外一个国外mtk芯片级都是来制作线刷包。因为,这些机型没有固件流出。而同一批机型中安卓版本高低不固定。支持的资…

战争教育策略游戏 MiracleGame,开启新阶段重塑生态和玩法

香港 Web3 区块链周刚刚在一片喧嚣中结束。各路大V、KOL 们的 report 都对 GameFi 的前景非常自信。2021-2023年期间,大量资金涌入 GameFi 赛道,GameFi 一旦爆发将会是现象级的出圈事件。 MiracleGame 是一款基于 BNB Chain 构建的英雄和元神主题的战争教…