科技魔方

Stable AI向开发者开放视频生成模型SVD的API服务

大模型

2023年12月22日

  Stability AI 是一家以 Stable Diffusion 文本到图像生成器而闻名的公司,宣布其新的基础图像到视频模型 Stable Video Diffusion (SVD) 现已在其开发者平台上并通过其应用程序编程接口提供( API),允许第三方开发者将其整合到自己的应用程序、网站、软件和服务中。

  该公司写道:“这一新功能提供了对专为各个领域设计的最先进视频模型的编程访问……我们发布此版本的目标是为开发人员提供一种有效的方法,将高级视频生成无缝集成到他们的产品中。”

  虽然该版本可以帮助希望生成 AI 视频的企业,但它也可能引起一些担忧,因为 Stability AI 已经因在 LAION-5B 上训练其模型而受到批评,LAION-5B 是一个开源 AI 数据集,已被发现包含至少1,008个视频儿童性虐待材料的实例,因此本周被下线。

  尽管存在争议,但StableAI的SVD API插件在视频生成的质量上仍然是领先的选择。据Stable AI在LinkedIn页面上发布的消息称:“每个视频由25帧生成的画面和24帧的FILM插值组成,在平均41秒的时间内生成2秒的视频。”尽管这对于主要的视频广告活动可能不够,但对于制作具有特定信息的GIF,包括表情包,无疑是非常方便的。

  竞争方面,Stable AI与Runway和Pika Labs等竞争对手展开竞争。值得一提的是,与这些竞争对手不同的是,StableAI计划推出用户界面,以提供更多多样化的视频生成功能。虽然目前尚未公布具体的推出时间,但公司呼吁用户加入等待名单成为第一批尝试界面的用户。

  尽管存在关于训练数据来源的质疑,Stable AI的SVD模型推出为企业提供了一种便捷的方式,将视频生成功能集成到其产品中。

  最近,斯坦福互联网观察中心的一份报告发现,用于训练AI文本到图像生成器的免费LAION-5B数据集含有至少1,008个儿童性虐待材料实例,该数据集的出版者已将其下线。

  与此同时,StableAI的开发者平台API为用户提供了对所有公司模型的访问权限,从Stable Diffusion XL文本到图像生成器到新的SVD模型。此外,公司还提供会员服务,帮助客户在本地托管模型。

+1

来源:站长之家

延展资讯