智谱开源CogVideoX-5B视频生成模型老显卡也能带得动

首页 更多场景 正文: 智谱开源CogVideoX-5B视频生成模型老显卡也能带得动; 更多场景

2024年08月28日

652
点赞; 　　魔搭ModelScope社区近日宣布，其国产开源Sora视频生成模型CogVideoX的更大尺寸版本——CogVideoX-5B已正式开源。新模型在视频生成的质量和视觉效果上都有显著提升，采用了3D因果变分自编码器和专家Transformer技术，结合文本和视频嵌入，使用3D-RoPE作为位置编码，并利用3D全注意力机制进行时空联合建模。模型还采用了渐进式训练技术，能够生成具有显著运动特征、连贯且长时间的高质量视频。

　　新模型CogVideoX-5B在视频生成质量和视觉效果上有显著提升。

　　CogVideoX-5B基于大规模DiT模型，专为文本到视频生成任务设计。

　　模型采用了3D因果变分自编码器和专家Transformer技术，结合文本和视频嵌入，使用3D-RoPE作为位置编码，并利用3D全注意力机制进行时空联合建模。

653 +1; 智谱开源大模型模型显卡; 来源：科技魔方