首页 / 知科普 / 正文

Stability AI 推出文字生成图片模型 SDXL 0.9

时间:2023-06-25 23:40:16

StabilityAI近日宣布,旗下文字生成图片模型SDXL0.9已经正式推出。该版本在图像内容与构图细节方面做了大幅改进,并可以在消费级GPU上运行。据悉,SDXL0.9在所有开源图像模型中参数数量位居前茅,其具备一个35亿参数的基础模型和一个66亿参数的附加模型。围绕这两个模型,SDXL的工作原理即,使用基础模型创建粗略的细节,再使用附加模型精细化生成的图片,如果的小伙伴们有使用过StableDiffusion的话,应该可以注意到这一渐进式的工作过程。SDXL0.9中使用了两个CLIP模型,其中包括OpenCLIPvitg14,这是迄今为止体积最大的OpenCLIP模型。凭借该模型,StableDiffusion可以创建深度更广分辨率更高的逼真图像。StabilityAI同时表示,SDXL团队将发布一篇研究博客,详细介绍SDXL0.9的模规范和更多参数细节,预计该模型将在7月迎来1.0正式版本,并将在GitHub开源。

SD-XL 0.9-base和SD-XL 0.9-refiner。其中,SD-XL 0.9-base模型在多个纵横比的1024^2分辨率图像上进行了训练,使用了OpenCLIP-ViT/G和CLIP-ViT/L进行文本编码;而SD-XL 0.9-refiner模型则训练用于去噪高质量数据中的小噪声水平,因此不适用于文本到图像的模型,只能用作图像到图像的模型。如果你想要访问这些模型进行研究,请使用以下链接申请:SDXL-0.9-Base模型和SDXL-0.9-Refiner模型。这意味着你可以申请这两个链接中的任意一个,如果获得批准,你将可以访问两个模型。他们计划很快进行全面发布(在7月)。

Stanford的Alpaca、Nomic-AI的gpt4all、RyokoAI的ShareGPT52K数据集、Databricks labs的Dolly和Anthropic的HH。他们将发布这些模型作为StableLM-Tuned-Alpha。

综上所述,StabilityAI推出了文字生成图片模型SDXL0.9,该模型在图像内容与构图细节方面有大幅改进,并可在消费级GPU上运行。

《Stability AI 推出文字生成图片模型 SDXL 0.9》不代表本网站观点,如有侵权请联系我们删除

科技在线 广州云媒派信息技术有限公司 版权所有 粤ICP备2021127029号