日前,美国AI创企Stability AI发布了Stable Cascade预览版。这个模型是基于Würstchen架构的文本到图像扩散模型,可以在消费级硬件上进行训练和微调。该模型的发布是根据非商业许可证,只允许用于非商业目的。这意味着用户可以在自己的项目中免费使用这个模型,但不能用于商业用途。
Stable Cascade是一个神经网络模型,与其他模型相比,它使用更小的潜在空间进行训练和推理。这种高度压缩的潜在空间使得推理速度更快,训练也更高效。
该模型在人类评估中表现出色,无论是在提示对齐还是美学质量上,Stable Cascade几乎在所有比较中表现最佳。与其他模型相比,它具有更高的效率和更快的推理速度。
Stable Cascade采用了三个模型:阶段A、S。尽管最大的模型参数比Stable Diffusion XL多14亿,但它仍具有更快的推理时间。这表明稳定级联的关注点在于其架构和更高度压缩的潜在空间。
总的来说,Stable Cascade是一个非常高效和性能出色的神经网络模型,适用于各种用途。它在训练和推理方面取得了令人印象深刻的结果,展现出其在效率方面的优势。