科技魔方

阿里云百炼上线Qwen百万长文本模型

通义千问

2024年11月22日

  11月21日消息,Qwen2.5-Turbo上线阿里云百炼平台,模型上下文长度扩展至百万tokens。据介绍,Qwen2.5-Turbo是通义千问团队回应社区对处理更长序列的需求推出的全新版本模型。该模型支持100万超长上下文,相当于100万个英文单词或150万个汉字。

  据网经社云计算台(CC.100EC.CN)获悉,全新的Qwen2.5-Turbo在1M长度的超长文本检索(Passkey Retrieval)任务中的准确率可达到100%,在长文本评测集RULER上获得93.1分,超越GPT-4;在LV-Eval、LongBench-Chat等更加接近真实场景的长文本任务中,Qwen2.5-Turbo在多数维度超越了GPT-4o-mini。

  此外,在MMU、LiveBench等短文本基准上Qwen2.5-Turbo的表现也非常优秀,在大部分任务上的表现显著超越之前上下文长度为1M tokens的开源模型。

+1

来源:网经社

延展资讯