美国初创公司黑森林实验室(BlackForestLabs)在 8 月 1 日推出了 AI 文生图模型 FLUX.1,该模型据称在“潜在扩散、稳定扩散及对抗性扩散蒸馏”方面较为突出,能够即时根据用户提示词生成各种图像。
官方将该模型与其他友商产品进行比拼,结果显示系列模型的 Elo 评分(IT之家注:Elo 评分系统是一种在国际象棋等竞技游戏中广泛使用的评分方法,主要用于计算比赛对手实力等级)“凌驾” Stable Diffusion 3 Ultra、Ideogram、Midjourney 6.0、DALL・E 3 等竞品。
IT之家获悉,FLUX.1 目前提供了三种版本以满足不同用户的需求(项目地址点此访问),用户可以通过不同平台试用这些模型,探索其在实际应用中的表现,三款模型具体如下:
FLUX.1 pro:该模型定位商业版,支持企业定制解决方案,强调高精度提示遵循、出色的视觉品质、丰富的图像细节及多样化的输出格式。
FLUX.1 dev:该模型定位科研(开源)版,主要面向非商业用途,开放权重,适合研究和开发者使用。
FLUX.1 schnell:这是一款“小模型”,在 FLUX.1 基础上进行精简版,适合本地开发和个人使用,采用 Apache 2.0 授权。
官方表示,所有版本的模型均支持生成不同比例的画面,最高支持生成 200 万像素的图像。虽然目前 FLUX.1 只支持通过提示词生成图像,但官方提到他们未来计划扩展模型,让模型能够通过提示词生成视频片段。