Stability AI,以其稳定扩散文本到图像生成器而著称的公司,近日宣布推出新的基础图像到视频模型——稳定视频扩散(Stable Video Diffusion,SVD),并已在其开发者平台上通过应用程序编程接口(API)提供。
这一举措允许第三方开发者将该模型整合到他们的应用程序、网站、软件和服务中。
该公司在一篇博客文章中写道:“这一新功能提供了对专为各个领域设计的最先进视频模型的编程访问……我们发布此版本的目标是为开发人员提供一种有效的方法,将高级视频生成无缝集成到他们的产品中。”
虽然这一版本为希望生成AI视频的企业提供了新的选择,但也引起了一些担忧。此前,Stability AI因在名为LAION-5B的开源AI数据集上训练其模型而受到批评。该数据集被发现包含至少1,008个涉及儿童性虐待的视频实例,因而在本周被下线。
尽管存在争议,但Stability的新SVD API插件在视频生成方面提供了领先的选择之一,可以生成包括25个生成的帧和24个生成的帧在内的“2秒视频”, FILM插值,平均时间为41秒。
此外,Stability还计划为其视频生成器推出面向用户的网络体验,尽管尚未透露推出时间。该公司正在邀请用户加入等待名单,成为第一批试用该界面的用户。
值得注意的是,尽管存在争议,但Stability AI的开发者平台API提供对所有公司模型的访问,从稳定扩散XL文本到图像生成器到新的SVD模型。该公司还提供会员资格,帮助客户在本地托管模型。