Stability AI 推出 SDXL 0.9：AI 图像生成的一次飞跃

点击上方蓝色“飞雪无情”关注我的公众号，设个星标，第一时间看文章

SDXL 0.9发布与特点

稳定AI公司宣布推出SDXL 0.9，这是Stable Diffusion文本到图像模型套件的重大升级。与其前身Stable Diffusion XL beta相比，新版本在图像和构图细节方面有了明显改进。目前可以通过ClipDrop访问，API即将推出。研究权重现已提供，开放版本定于7月中旬发布。

今天，稳定AI公司宣布推出SDXL 0.9，这是Stable Diffusion文本到图像模型套件的最先进的发展。继4月成功发布Stable Diffusion XL beta之后，SDXL 0.9在前身的基础上大大提高了图像和构图细节。

(Left - SDXL Beta, Right - SDXL 0.9)

Prompt: A wolf in Yosemite National Park, chilly nature documentary film photography

Negative prompt: 3d render, smooth, plastic, blurry, grainy, low-resolution, anime, deep-fried, oversaturated

应用场景与功能

SDXL 0.9能够为电影、电视、音乐、教学视频以及设计和工业用途生成超现实的图像。它还提供了诸如图像到图像提示、修补和扩展等功能。

SDXL 0.9在创意应用方面具有很大的潜力，可以为电影、电视、音乐和教学视频等产生超现实的作品，同时还为设计和工业应用提供了先进的技术支持，使SDXL成为AI图像实际应用的先驱。

(Left - SDXL Beta, Right - SDXL 0.9)

Prompt: ~aesthetic~~ manicured hand holding up a take-out coffee, pastel chilly dawn beach instagram film photography

Negative prompt: 3d render, smooth, plastic, blurry, grainy, low-resolution, anime

技术细节与优势

新模型具有显著更高的参数计数，具有3.5B参数基本模型和6.6B参数模型集成管道。它使用两个CLIP模型，包括迄今为止训练过的最大的OpenCLIP模型，即OpenCLIP ViT-G/14。尽管输出强大，SDXL 0.9仍可以在现代消费者GPU上运行。

SDXL 0.9的关键优势在于其比beta版本大幅增加的参数计数（模型训练所依赖的神经网络中所有权重和偏差的总和），该参数计数为3.5B参数基本模型和6.6B参数模型集成管道。

Prompt: beautiful scenery nature glass bottle landscape, purple galaxy bottle (SDXL 0.9 - 1024x1024)

反馈与应用情况

自4月份的beta版本发布以来，近7,000名用户已经使用SDXL生成了超过700,000张图片。 SDXL 0.9目前已在Clipdrop by Stability AI平台上提供，计划在7月中旬推出完整的开放版本SDXL 1.0。

自SDXL beta版本于4月13日发布以来，我们的Discord用户社区（近7,000人）对此反响热烈。这些用户共生成了超过700,000张图片，日均超过20,000张。在Discord社区的“Showdowns”中，已有54,000多张图片参与，3,521张SDXL图片被提名为优胜者。

Prompt: magical realism; manicured fingers holding a piece of white heart-shaped sea glass up against the setting sun realistic film photography (SDXL beta - 480x480)