科技魔方

字节跳动发布Seed-Thinking-v1.5大模型

更多动态

2025年04月14日

  字节跳动旗下豆包大模型团队今日公开了最新思考模型Seed-Thinking-v1.5的技术细节。

  该模型将于4月17日通过火山引擎开放接口供用户使用。Seed-Thinking-v1.5在数学推理、编程竞赛及科学推理等专业领域表现卓越,同时兼顾创意写作等通用任务需求。其采用MoE架构,总参数达200B,激活参数为20B,单位推理成本较DeepSeek R1降低50%,实现了性能与效率的平衡。

  模型数据体系融合可验证与非可验证数据,优化处理策略以提升生成质量。训练方法结合监督精调与强化学习,确保模型具备长思考链能力。底层架构支持20B MoE复杂训练需求,稳定性高达95%。Seed-Thinking-v1.5的推出标志着大模型技术的新突破。

527 +1

来源:科技魔方

延展资讯