字节跳动旗下豆包大模型团队今日公开了最新思考模型Seed-Thinking-v1.5的技术细节。
该模型将于4月17日通过火山引擎开放接口供用户使用。Seed-Thinking-v1.5在数学推理、编程竞赛及科学推理等专业领域表现卓越,同时兼顾创意写作等通用任务需求。其采用MoE架构,总参数达200B,激活参数为20B,单位推理成本较DeepSeek R1降低50%,实现了性能与效率的平衡。
模型数据体系融合可验证与非可验证数据,优化处理策略以提升生成质量。训练方法结合监督精调与强化学习,确保模型具备长思考链能力。底层架构支持20B MoE复杂训练需求,稳定性高达95%。Seed-Thinking-v1.5的推出标志着大模型技术的新突破。