幻方DeepSeek-V2系列模型已在魔搭社区开源_科技魔方-中文AI大模型门户网站

: 幻方DeepSeek-V2系列模型已在魔搭社区开源; 更多场景

2024年05月08日

585
点赞; 　　魔搭ModelScope社区宣布，DeepSeek-V2系列模型现已在魔搭ModelScope社区开源。

　　据悉，幻方公司在5月6日推出了第二代 MoE 模型 DeepSeek-V2，并开源了技术报告和模型权重，该模型引入了 MLA 架构和自研 Sparse 结构 DeepSeekMoE，以236B 总参数、21B 激活，实际部署在8卡 H800机器上，输入吞吐量超过每秒10万 tokens 输出超过每秒5万 tokens。

　　性能方面，在目前大模型主流榜单中，DeepSeek-V2均表现出色:

　　中文综合能力(AlignBench)开源模型中最强，与GPT-4-Turbo，文心4.0等闭源模型在评测中处于同一梯队

　　英文综合能力(MT-Bench)与最强的开源模型LLaMA3-70B同处第一梯队，超过最强MoE开源模型Mixtral8x22B

　　知识、数学、推理、编程等榜单结果也位居前列

　　支持128K上下文窗口

　　和DeepSeek67B相比，DeepSeek-V2节约了42.5%训练成本，推理的KV Cache节约了93.3%，最大吞吐是之前的576%。

　　DeepSeek-V2的推理代码和模型下载链接已经在魔搭 ModelScope 社区开源，用户可以通过该平台直接下载模型。

586 +1; 模型大模型魔搭社区开源开源; 来源：站长之家

延展资讯

: 幻方DeepSeek-V2系列模型已在魔搭社区开源

: 魅族科技宣布三款全新AI产品将于本月发布

: 我们开源啦！一键部署免费使用！Kubernetes上直接运行大数据平台！

: 大模型2024：追求变现，加速洗牌

: 具身智能机器人技术的落地实践

: 月之暗面：Kimi 大模型API 已支持 Tool Calling 功能

最热新闻最新新闻 更多>

用户推荐最热产品 更多>

倾城

小新

叶紫

创维电视（SKYWORTH）55V40

创维电视（SKYWORTH）55V40

小米全面屏电视E43K

小米全面屏电视E43K

康佳（KONKA）55D6S

康佳（KONKA）55D6S

荣泰S60按摩椅

荣泰S60按摩椅

自媒体头条更多>: 极致听感智能降噪三星Galaxy Buds Pro诠释非同凡“响”

未来科技范试驾摩灵MOi｜视频

品牌专区更多>

产品与服务

联系站长

反馈邮箱

news#keji100.net（发邮件时把#换成@）

关于我们