文生图大模型SD3.5终于来了, 能否打败flux?

项目名称 Stable Diffusion 3.5
项目类型 开源文生图模型
项目地址 Hugging Face
项目简介 由Stability AI开发的最新一代图像生成模型,包含多个变体,能在消费级硬件上运行,并免费提供给社区使用。

项目的优势

Stable Diffusion 3.5(简称SD3.5)是Stability AI推出的最新图像生成模型,具有以下优势:

  1. 风格多样性提升:SD3.5「large」版本在风格多样性上有所提升,用户可以通过修改提示词调取更多的图像风格。
  2. 图像质量优化:图像生成的AI质感降低,光影和材质更自然,使生成的图像更具真实感。
  3. 参数量与速度的平衡:发布了两个版本,Large版本拥有80亿参数,适合1 MP分辨率的专业用例;Large Turbo版本为精简版本,生成速度快于Large版本。
  4. 商业友好:SD3.5开放了商业用途,允许用户每年获利不超过100万美元的前提下自由商用。

项目的使用场景

SD3.5适用于多种场景,包括但不限于:

  • 专业图像生成:适用于需要高分辨率图像的专业设计师或有高级绘画需求的用户。
  • 快速图像生成:Large Turbo版本适合对生成速度要求高的用户,可以在几乎不损失太多质量的前提下,快速出图。
  • 低配置设备:即将发布的Medium版本适合电脑配置较低的用户,能够在质量和易定制性之间取得平衡。

项目的详细情况

SD3.5模型详细介绍如下:

  • Stable Diffusion 3.5 Large:拥有80亿参数,适合1百万像素分辨率的专业用例。
  • Stable Diffusion 3.5 Large Turbo:Large版本的精简版本,生成速度快于Large版本。
  • Stable Diffusion 3.5 Medium:拥有25亿参数,设计为可在消费级硬件上“开箱即用”。

添加相关链接

总结

SD3.5在人物手部细节上仍有问题,但有时出图更写实。与FLUX相比,SD3.5在皮肤绘制上更细腻真实,长文本和提示词遵循的效果两者差不多。美学方面SD3.5有时更好,但性能方面不如FLUX,出图慢且显存占用多。目前FLUX生态更完善,SD3.5短时间内难以超越FLUX。