科技魔方

开源多模态模型Molmo 能够识别图像中的物体并生成准确描述

多模态

2024年09月26日

  Molmo是一款开源多模态人工智能模型,基于Qwen2-72B和OpenAI的CLIP,以高效性能和创新功能挑战传统商业模型。其突出特点在于小巧高效、引入指向功能、性能优异、开源性质和全面功能。

  Molmo的成功归功于高质量训练数据和多样性,展现出色的多模态交互能力。

  Molmo以小巧高效的设计理念挑战传统商业模型

  Molmo引入指向功能,拓展人机交互和增强现实应用可能性

  Molmo在性能评估中表现亮眼,仅次于GPT-4o,排名第二

+1

来源:科技魔方

延展资讯