Stability AI 推出文字生成图片模型 SDXL 0.9

时间：2023-06-25 23:40:16

StabilityAI近日宣布，旗下文字生成图片模型SDXL0.9已经正式推出。该版本在图像内容与构图细节方面做了大幅改进，并可以在消费级GPU上运行。据悉，SDXL0.9在所有开源图像模型中参数数量位居前茅，其具备一个35亿参数的基础模型和一个66亿参数的附加模型。围绕这两个模型，SDXL的工作原理即，使用基础模型创建粗略的细节，再使用附加模型精细化生成的图片，如果的小伙伴们有使用过StableDiffusion的话，应该可以注意到这一渐进式的工作过程。SDXL0.9中使用了两个CLIP模型，其中包括OpenCLIPvitg14，这是迄今为止体积最大的OpenCLIP模型。凭借该模型，StableDiffusion可以创建深度更广分辨率更高的逼真图像。StabilityAI同时表示，SDXL团队将发布一篇研究博客，详细介绍SDXL0.9的模规范和更多参数细节，预计该模型将在7月迎来1.0正式版本，并将在GitHub开源。

SD-XL 0.9-base和SD-XL 0.9-refiner。其中，SD-XL 0.9-base模型在多个纵横比的1024^2分辨率图像上进行了训练，使用了OpenCLIP-ViT/G和CLIP-ViT/L进行文本编码；而SD-XL 0.9-refiner模型则训练用于去噪高质量数据中的小噪声水平，因此不适用于文本到图像的模型，只能用作图像到图像的模型。如果你想要访问这些模型进行研究，请使用以下链接申请：SDXL-0.9-Base模型和SDXL-0.9-Refiner模型。这意味着你可以申请这两个链接中的任意一个，如果获得批准，你将可以访问两个模型。他们计划很快进行全面发布（在7月）。

Stanford的Alpaca、Nomic-AI的gpt4all、RyokoAI的ShareGPT52K数据集、Databricks labs的Dolly和Anthropic的HH。他们将发布这些模型作为StableLM-Tuned-Alpha。

综上所述，StabilityAI推出了文字生成图片模型SDXL0.9，该模型在图像内容与构图细节方面有大幅改进，并可在消费级GPU上运行。

查看更多相关的资讯

《Stability AI 推出文字生成图片模型 SDXL 0.9》不代表本网站观点，如有侵权请联系我们删除

精彩图文

精彩推荐

点击排行