科技魔方

长文本、语音、视觉、结构化数据全覆盖,中国移动九天善智多模态大模型震撼发布

多模态

2024年10月14日

  10月12日,在第十二届中国移动全球合作伙伴大会主论坛上,中国移动发布了最新的九天善智多模态基座大模型,全面解析了九天系列大模型的亮点能力、特色技术。

  中国移动将新发布的多模态大模型命名为 “善智”,在人工智能高速发展的时代,平衡 “大善” 与 “大智” 至关重要。这一命名体现了中国移动追求技术卓越与社会责任并重的理念,使大模型不仅文理兼修、德艺双馨,更能普惠应用,进而创造人类文明新的福祉。

  据了解,中国移动九天系列大模型包括九天善智多模态大模型、九天众擎语言大模型、九天智绘视觉大模型、九天语荷语音大模型、九天数童结构化数据大模型等,可以提供1.5B、3B、8B、13.9B、100B、200B 等不同参数量的模型版本,模型性能实现整体飞跃!

  在国际竞赛中,中国移动九天模型表现可谓十分突出。不仅在2024年 INTERSPEECH 语音合成声码器赛道中获得国际第一名,也在2023年获得 CVPR VSS(视觉语义分割)赛道中视觉理解方面的第一名。

  此外,大模型多项关键技术指标在国际主流榜单中取得优秀名次。根据最新测评数据,多任务语言理解能力在权威BBH 榜单上名列第二名,图像内容理解对话、视频内容理解对话、文生视频分别在 MME-P 榜单、MVBench 榜单和 VBench 榜单位列第三名,代码生成在 MBPP 榜单位列第二名,数学推理排名第四,综合能力在司南 Opencompass 多模态模型评测榜单(闭源模型)名列前茅,平均分64.2。

  长文本、全双工、机器视觉和结构化数据等多模态是走向通用智能的必经之路。这次九天善智多模态基座大模型的全面升级在这四个赛道均取得了不俗的技术突破:

  长文本理解与生成,赋能产业态势感知

  九天善智多模态基座大模型能够支持处理复杂的任务资料收集并深度解析给出专业报告,目前已拓展至128K 超长上下文的理解与生成。

  在本次大会主论坛上,九天善智多模态大模型展示了其基于可信数据的高效文档信息收集与秒级分析能力。该模型能够迅速提炼行业资料中的关键信息,并以直观的文字、柱状图、折线图等可视化形式生成通信产业月报。不仅如此,它还能解读国内外及地方政府发布的相关政策,并通过自动化专家访谈机制不断完善报告内容,确保报告修订过程透明可追溯,助力企业实现高效决策。

+1

来源:科技魔方

延展资讯