上海阶跃星辰推出了其自研的推理模型Step Reasoner mini(Step R-mini),该模型以其超长推理能力在逻辑推理、代码和数学等领域表现出色。
Step R-mini通过大规模强化学习训练,能够兼顾文理科双向能力,展现了在复杂问题解决和内容创作上的卓越性能。
Step R-mini是首个推理模型,擅长主动规划和反思,提供准确可靠的回复。
在数学和逻辑推理任务中,Step R-mini展现出色的解题能力,能够处理复杂问题并提供多种解法。
该模型在内容创作中深入理解用户需求,具备创新表达风格,能够生成富有情感的文学作品。