智源研究院推出新一代无编码器视觉语言多模态大模型EVE_科技魔方-中文AI大模型门户网站

首页 更多场景 正文: 智源研究院推出新一代无编码器视觉语言多模态大模型EVE; 更多场景

2024年07月17日

点赞; 　　近期，智源研究院联合大连理工大学、北京大学等高校推出了新一代无编码器的视觉语言模型EVE，通过精细化训练策略和额外的视觉监督，解决了多模态大模型训练分离导致的视觉归纳偏置问题，表现优异于基于编码器的主流多模态方法。EVE展示了无编码器原生视觉语言模型的潜力，为多模态模型的发展提供了新思路。

　　EVE采用无编码器架构，处理任意图像长宽比，表现优异于同类型模型。

　　EVE使用公开数据预训练，训练时间短，数据和训练代价低。

　　EVE提供透明高效的探索路径，在多个视觉-语言基准测试中表现优异。

+1; 智源研究院大模型模型; 来源：科技魔方

延展资讯

: 无图NOA开启全量推送全国都能开！理想汽车正式推送OTA 6.0

: 智谱AI宣布开源视频理解模型CogVLM2-Video

: AI搜索助手“心流”上线

: OpenAI这个盘，阿里云们能接得住吗？

: 华为仓颉预览版试用申请已超 1.1 万人，ACM 主席称“中国正在编程语言领域逐渐崭露头角”

: 催促升级：微软宣布 90 天内终止 Win11 初始版本 21H2/22H2 支持

最热新闻最新新闻 更多>

用户推荐最热产品 更多>

倾城

小新

张影

创维电视（SKYWORTH）55V40

创维电视（SKYWORTH）55V40

小米全面屏电视E43K

小米全面屏电视E43K

康佳（KONKA）55D6S

康佳（KONKA）55D6S

荣泰S60按摩椅

荣泰S60按摩椅

自媒体头条更多>: 极致听感智能降噪三星Galaxy Buds Pro诠释非同凡“响”

未来科技范试驾摩灵MOi｜视频

品牌专区更多>

产品与服务

联系站长

反馈邮箱

news#keji100.net（发邮件时把#换成@）

关于我们