Meta AI团队推出了LongVU,一种新型的时空自适应压缩机制,旨在提升长视频的语言理解能力。
FIFO-Diffusion 项目最近引发了广泛关注,这个项目展示了在无需额外训练的情况下生成无限长视频的强大能力。通过对角去噪技术,FIFO-Diffusion 实现了高质量且具有一致性的长视频生成。
近期,微软Azure AI发布了MM-Vid,这是一项结合GPT-4V与专用工具的创新,致力于解读长视频并为视障人士提供更好的体验。
-------------没有了-------------