英伟达近日开源了图像生成模型Sana,凭借仅0.6亿个参数和高达4096×4096分辨率的生成能力,极大降低了使用门槛。
该模型在16GB显卡上可在不到1秒内生成高质量图像,表现出色。
Sana采用了深度压缩自编码器和线性扩散变换器,提升了生成速度和质量,并支持多种语言提示,方便用户创作。
高效生成:Sana可以快速生成高达4096×4096分辨率的高质量图像,适合在普通笔记本GPU上使用。
创新设计:深度压缩自编码器和线性扩散变换器大幅提升了生成速度和质量。
卓越性能:Sana在多项测试中表现优异,吞吐量显著高于其他先进模型,支持快速内容创作。