Stability AI最近发布了SDXL 0.9,这是其稳定扩散文本到图像模型套件中最先进的开发。SDXL 0.9在其前身的基础上大幅提高了图像和构图的细节。该模型现在可以通过ClipDrop访问,API将很快推出。研究权重现已可用,我们计划在7月中旬向公众开放发布,以便我们迈向1.0。

尽管SDXL 0.9可以在现代消费者GPU上运行,但它在生成AI图像的创造性用途上带来了飞跃。它能够为电影、电视、音乐和教学视频生成超现实的创作,同时也为设计和工业用途提供了进步,这使SDXL成为AI图像在现实世界应用的前沿。

SDXL 0.9的关键驱动力

SDXL 0.9在构图方面的进步的关键驱动力是其参数数量(模型训练的神经网络中所有权重和偏差的总和)相比beta版本有了显著增加。SDXL 0.9拥有开源图像模型中最大的参数数量之一,拥有35亿参数的基础模型和66亿参数的模型集成管道(最终输出是通过在两个模型上运行并聚合结果创建的)。管道的第二阶段模型用于为第一阶段生成的输出添加更细致的细节。

系统要求

尽管SDXL 0.9的输出强大且模型架构先进,但它能够在现代消费者GPU上运行,只需要Windows 10或11,或Linux操作系统,配备16GB RAM,Nvidia GeForce RTX 20图形卡(或同等或更高标准)配备至少8GB的VRAM。Linux用户也可以使用配备16GB VRAM的兼容AMD卡。

可用性

SDXL 0.9现在可以在Stability AI的Clipdrop平台上使用。Stability AI API和DreamStudio客户将能够在6月26日(星期一)访问该模型,以及其他领先的图像生成工具,如NightCafe。在有限的时间内,SDXL 0.9将仅供研究目的使用,以收集反馈并完全优化模型,然后进行公开发布。运行它的代码将在Github上公开。

下一步计划

SDXL 0.9将由SDXL 1.0的全面公开发布接替,目标定在7月中旬(时间待定)。SDXL0.9以非商业、仅供研究的许可证发布,并受其使用条款的约束。

联系方式

如果您需要进一步的信息或希望对SDXL 0.9提供反馈,欢迎您通过research@stability.ai与我们联系。

总结

Stability AI的SDXL 0.9是一个重大的进步,它在图像生成和构图细节上大大超越了其前身。尽管它的硬件需求相对较低,但其在生成超现实图像和设计应用方面的能力却非常强大。此外,它的参数数量也大大增加,使其成为开源图像模型中参数数量最大的一个。SDXL 0.9现已在Stability AI的Clipdrop平台上提供,而且很快就会有API推出。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注