阿里图像生成视频模型I2VGen-XL代码发布_科技魔方-中文AI大模型门户网站

首页 大模型 正文: 阿里图像生成视频模型I2VGen-XL代码发布; 大模型

2023年12月15日

点赞; 　　阿里在11月份发布了论文，宣布将开源I2VGen-XL图像生成视频模型。如今，他们终于发布了具体的代码和模型。这一模型可以生成没有大幅人物动作的视频演示。

　　I2VGen-XL模型分为两个阶段。首先是基础阶段，该阶段通过使用两个分层编码器来保证连贯的语义，并保留输入图像的内容。其次是优化阶段，该阶段通过整合额外的简短文本来增强视频的细节，并将分辨率提高到1280x720。

　　为了优化模型，研究团队收集了约3500万个单镜头文本视频对和60亿个文本图像对。通过这些数据，I2VGen-XL模型可以提高生成视频的语义准确性、细节的连续性和清晰度。

+1; 阿里图像; 来源：站长之家

延展资讯

: Spotify测试人工智能生成播放列表功能引发用户好奇

: 蛋糕快被OpenAI们分完了，AI初创公司陷融资困境

: Mistral AI宣布与Google Cloud合作，并发布新的开源LLM

: LLM360: 首个完全开源和透明的大语言模型

: GoLinks发布企业人工智能搜索引擎GoSearch 支持多模态搜索

: 微软发布LLMLingua:压缩长提示并加快模型推理速度

最热新闻最新新闻 更多>

用户推荐最热产品 更多>

倾城

小新

张影

创维电视（SKYWORTH）55V40

创维电视（SKYWORTH）55V40

小米全面屏电视E43K

小米全面屏电视E43K

康佳（KONKA）55D6S

康佳（KONKA）55D6S

荣泰S60按摩椅

荣泰S60按摩椅

自媒体头条更多>: 极致听感智能降噪三星Galaxy Buds Pro诠释非同凡“响”

未来科技范试驾摩灵MOi｜视频

品牌专区更多>

产品与服务

联系站长

反馈邮箱

news#keji100.net（发邮件时把#换成@）

关于我们