科技魔方

元乘象Chatimg3.0来了,赶超GPT-4V,还给出产业升级新打法

大模型

2023年10月30日

  本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心。

  最近,AI 领域都在思考一件事:多模态大模型落地产业,好的打法应该是什么?

  通用人工智能时代正在到来,AI 大模型技术已成为数字经济下基础设施建设的重要支撑,也成为产业智能化转型的核心「引擎」,AI 大模型 + 产业应用迎来了前所未有的发展机遇。

  在10月28日举办的 CNCC2023「超智融合 AI 大模型应用落地发展论坛」上,智子引擎发布了「元乘象Chatimg3.0」,展示了多模态通用生成模型「元乘象 Chatimg3.0」的最新进展与落地探索。

  Chatimg3.0核心技术的升级迭代

  元乘象 Chatimg3.0是一个超精细识别、少幻觉的多模态大模型,同时支持多图理解、物体定位、OCR 等功能。Chatimg3.0给硬件设备装上了大脑,可实现更自然更流畅的人机交流,为 AI 多模态大模型赋能产业应用打下了坚实的基础。

  与 Chatimg2.0相比,Chatimg3.0主要进行了两方面的升级,包括第一阶段的预训练(描述、检测、OCR 等多任务训练)以及第二阶段的指令微调(高质量的人工精筛指令集)。

  为更好的评估多模态大模型的能力,智子引擎构建了一个全新的多模态对话测试集,从描述、推理、检测、问答、业务五个方面对模型能力进行评测,而且在问答和业务两个方面的能力上赶超GPT-4V,展现出了国产大模型优秀的发展潜力。

+1

来源:机器之心

延展资讯