近日,vivo AI正式开源了BlueLM-7B 基础 (base) 模型和7B 对话 (chat) 模型,同时开源了支持32K 的长文本基础 (base) 模型和对话 (chat) 模型。
具体特性如下:
更大量的优质数据:高质量语料库进行训练,规模达到了2.6万亿 的 token 数,该语料库包含中文、英文以及少量日韩数据;
更优的效果:其中 BlueLM-7B-Chat 在 C-Eval 和 CMMLU 上均取得领先结果,对比同尺寸开源模型中具有较强的竞争力;
长文本支持:BlueLM-7B-Base-32K 和 BlueLM-7B-Chat-32K 均支持32K 长文本,在保持基础能力相当情况下,能够支持更长上下文理解;
协议说明:BlueLM 系列欢迎开发者进行学术研究和商业应用;
vivo表示,后续还将开源13B 模型和支持多模态的7B-vl 模型。
2023年11月1日,vivo开发者大会上,vivo正式发布vivo自研大模型矩阵“蓝心大模型”。蓝心大模型包含十亿、百亿、千亿等不同参数规模五款大模型,vivo自研操作系统OriginOS4将首发搭载,vivo称其大模型矩阵将全面开源。