科技魔方

谷歌发布新大语言模型:零样本生成10秒视频达SOTA

大模型

2023年12月21日

  谷歌最新大语言模型VideoPoet可以通过AI生成逼真的视频和动画,甚至能零样本实现SOTA。VideoPoet的背后原理是通过LLM和其他现有的大模型进行改进,它的优势表现在画面稳定、动作逼真、清晰度高。

  它具备全面的能力,包括文本到视频、图像到视频转换,视频编辑和风格化处理,以及视频长度和风格的调整等功能。它还可以根据视频内容生成配乐,创新性地实现音频的生成。

+1

来源:DoNews

延展资讯