谷歌最新大语言模型VideoPoet可以通过AI生成逼真的视频和动画,甚至能零样本实现SOTA。VideoPoet的背后原理是通过LLM和其他现有的大模型进行改进,它的优势表现在画面稳定、动作逼真、清晰度高。
它具备全面的能力,包括文本到视频、图像到视频转换,视频编辑和风格化处理,以及视频长度和风格的调整等功能。它还可以根据视频内容生成配乐,创新性地实现音频的生成。
谷歌最新大语言模型VideoPoet可以通过AI生成逼真的视频和动画,甚至能零样本实现SOTA。VideoPoet的背后原理是通过LLM和其他现有的大模型进行改进,它的优势表现在画面稳定、动作逼真、清晰度高。
它具备全面的能力,包括文本到视频、图像到视频转换,视频编辑和风格化处理,以及视频长度和风格的调整等功能。它还可以根据视频内容生成配乐,创新性地实现音频的生成。