Stability AI 推出 SDXL 0.9:AI 图像生成的一次飞跃

news/2024/10/18 5:59:14/

点击上方蓝色“飞雪无情”关注我的公众号,设个星标,第一时间看文章

SDXL 0.9发布与特点

稳定AI公司宣布推出SDXL 0.9,这是Stable Diffusion文本到图像模型套件的重大升级。与其前身Stable Diffusion XL beta相比,新版本在图像和构图细节方面有了明显改进。目前可以通过ClipDrop访问,API即将推出。研究权重现已提供,开放版本定于7月中旬发布。

今天,稳定AI公司宣布推出SDXL 0.9,这是Stable Diffusion文本到图像模型套件的最先进的发展。继4月成功发布Stable Diffusion XL beta之后,SDXL 0.9在前身的基础上大大提高了图像和构图细节。

17ad2cf150d34cf7c08bb2d0866a92ae.png
(Left - SDXL Beta, Right - SDXL 0.9)

Prompt: A wolf in Yosemite National Park, chilly nature documentary film photography

Negative prompt: 3d render, smooth, plastic, blurry, grainy, low-resolution, anime, deep-fried, oversaturated

应用场景与功能

SDXL 0.9能够为电影、电视、音乐、教学视频以及设计和工业用途生成超现实的图像。它还提供了诸如图像到图像提示、修补和扩展等功能。

SDXL 0.9在创意应用方面具有很大的潜力,可以为电影、电视、音乐和教学视频等产生超现实的作品,同时还为设计和工业应用提供了先进的技术支持,使SDXL成为AI图像实际应用的先驱。

f87577047c36d263e92cdbb55c92c38d.png
(Left - SDXL Beta, Right - SDXL 0.9)

Prompt~aesthetic~~ manicured hand holding up a take-out coffee, pastel chilly dawn beach instagram film photography

Negative prompt: 3d render, smooth, plastic, blurry, grainy, low-resolution, anime

技术细节与优势

新模型具有显著更高的参数计数,具有3.5B参数基本模型和6.6B参数模型集成管道。它使用两个CLIP模型,包括迄今为止训练过的最大的OpenCLIP模型,即OpenCLIP ViT-G/14。尽管输出强大,SDXL 0.9仍可以在现代消费者GPU上运行。

SDXL 0.9的关键优势在于其比beta版本大幅增加的参数计数(模型训练所依赖的神经网络中所有权重和偏差的总和),该参数计数为3.5B参数基本模型和6.6B参数模型集成管道。

068acd08b2b2beaee77003bd17a6dad2.png

Prompt: beautiful scenery nature glass bottle landscape, purple galaxy bottle (SDXL 0.9 - 1024x1024)

反馈与应用情况

自4月份的beta版本发布以来,近7,000名用户已经使用SDXL生成了超过700,000张图片。 SDXL 0.9目前已在Clipdrop by Stability AI平台上提供,计划在7月中旬推出完整的开放版本SDXL 1.0。

自SDXL beta版本于4月13日发布以来,我们的Discord用户社区(近7,000人)对此反响热烈。这些用户共生成了超过700,000张图片,日均超过20,000张。在Discord社区的“Showdowns”中,已有54,000多张图片参与,3,521张SDXL图片被提名为优胜者。

c1abb3f4c7f6e514f1fdbcc85e95c7e7.png

Prompt: magical realism; manicured fingers holding a piece of white heart-shaped sea glass up against the setting sun realistic film photography (SDXL beta - 480x480)

获取方式与未来计划

目前,SDXL 0.9已在Clipdrop by Stability AI平台上提供。Stability AI API和DreamStudio客户将于6月26日(周一)可访问该模型,以及其他领先的图像生成工具,如NightCafe。

SDXL 0.9将在有限期限内仅用于研究目的,以收集反馈并在其公开发布前完善模型。在Github上运行的代码将可供公众使用。

如果研究人员希望访问这些模型,请使用以下链接申请:SDXL-0.9-Base model,和SDXL-0.9-Refiner。请使用您的学术电子邮件登录HuggingFace帐户以申请访问权限。请注意,目前SDXL 0.9仅限于研究用途。

81a46fb9d074fd773ee07ae21a100fbd.png

扫码关注

分享、点赞、在看就是最大的支持


http://www.ppmy.cn/news/581089.html

相关文章

操作系统——Windows 线程的互斥与同步

一、实验题目 Windows 线程的互斥与同步 二、实验目的 (1) 回顾操作系统进程、线程的有关概念,加深对 Windows 线程的理解。 (2) 了解互斥体对象,利用互斥与同步操作编写生产者-消费者问题的并发程序,加深对 P (即 semWait)、V(即 semSig…

【技术选型】Redis的几种集群方案、及优缺点对比

文章目录 背景一、主从模式二、哨兵模式三、Redis Cluster四、各大厂的Redis集群方案客户端分片代理分片Codis 五、Redis集群方案解决方案六、Redis集群方案原理总结 背景 在服务开发中,单机都会存在单点故障的问题,及服务部署在一台服务器上&#xff0…

Windows XP SP3英文版镜像

链接:https://pan.baidu.com/s/1q4Yu6UFXNMIqAaTz_xGyhQ 提取码:09ik

xplorer2 的注册码

425F080378ABC40101110AAF37BA192D8FFDA5C938C82BB729087DD4D824ED7851C9055689ED78A3EF0E577B45BB8880AE5675C4081801376A3BC03B294E67CD0A74816BA96A64B0524E64F015B84EAA5E34F8E5A3457F6237AA30F1E3DF5E69FEE7E50B

Speex for Android

http://blog.csdn.net/chenfeng0104/article/details/7088138 在Android开发中,需要录音并发送到对方设备上。这时问题来了,手机常会是GPRS、3G等方式上网,所以节省流量是非常关键的,使用Speex来压缩音频文件,可以将音…

speex版本下载

speex 作为一个开源的语音编码库,很值得研究。在官网,基本只能下载最新的版本,要了解SPEEX发展脉络,可以在以下地址下载: http://downloads.xiph.org/releases/speex/

Speex之一-介紹Speex

Speex之一-介紹Speex 介紹Speex Speex編解碼器(www.speex.org)存在是因為有這麼一個需求,即是開源同時專利版權也是免費的。這應該也是各開源軟體的必要條件。本質上講,Speex是針對語音的,vorbis是針對語音/音樂的。不像很多基它…

Proxifier v3.21 standard edition 激活码

5EZ8G-C3WL5-B56YG-SCXM9-6QZAP G3ZC7-7YGPY-FZD3A-FMNF9-ENTJB YTZGN-FYT53-J253L-ZQZS4-YLBN9 【Portable Edition】 D5Z6C-U2PGU-5RKWX-D8D7T-HD4UL ZMZ2W-JWTPN-WNP2S-YWTWA-2ZUH6 GYZCP-N3WL7-FETY3-AG7HZ-25THV SDZA7-SY6QA-9GM3K-7U9ZE-29QAD 2BZF4-LWTUS-CJV27-4L…