清华大学人工智能产业研究院(AIR)和北京水木分子生物科技有限公司昨日宣布推出升级版的生物医药多模态开源基础大模型 BioMedGPT-R1。该模型基于此前发布的百亿参数大模型 BioMedGPT,采用了 DeepSeek R1 蒸馏版本模型更新文本基座模型,显著提升了文本推理能力。
BioMedGPT-R1 实现了生物模态与自然语言文本模态在同一个特征空间的统一融合,通过跨模态特征对齐,增强了生物多模态场景下的深度推理能力。训练过程中,首先仅训练对齐翻译层 Translator,使其将编码后的生物模态表征映射到语义表征空间;随后微调 Translator 和基座大语言模型,以激发其在下游任务上的多模态推理能力。
研究团队表示,BioMedGPT-R1 在化学分子理解任务上已观察到性能提升超过 15%,并将继续优化 OpenBioMed 开源平台,为生物医药企业提供更强大的药物研发工具。