Stability AI 最近宣布了一个激动人心的消息:其开发者平台API现已支持最新版本的Stable Diffusion3(SD3)及其增强版本Stable Diffusion3Turbo。这一发布标志着Stability AI在文字到图像生成领域的技术进步,其性能已经达到甚至超越了行业内的一些领先模型,如DALL-E3和Midjourney v6。
SD3模型的亮点在于其对字体和提示的遵循能力,这一点在人类偏好评估中得到了突出体现。为了实现这一目标,SD3采用了新的多模态扩散变换器(MMDiT)架构,该架构改进了对图像和语言表示的权重分离处理,从而显著增强了模型的文本理解和拼写能力。这使得SD3在理解和执行用户的文本提示时更为精准,生成的图像更加符合用户的预期。
除了模型本身的改进,Stability AI还在不断提升服务质量。尽管SD3模型已经通过API对外提供,但公司仍在持续对模型进行优化。Stability AI计划在不久的将来开放模型权重,允许拥有Stability AI会员资格的用户自行托管。这一举措将进一步增强用户的自主性和灵活性。
此外,Stability AI与Fireworks AI的合作确保了API平台的高速和可靠性。公司承诺提供99.9%的服务可用性,这对于企业用户来说尤为重要,因为他们在使用开发者平台进行关键的生成型AI工作时,需要确保服务的稳定性和可靠性。