2025年截止到现在,人工智能领域最重磅的事件,莫过于DeepSeek在全球的爆火。
2024年12月,DeepSeek推出了DeepSeek-V3模型,2025年1月20日,又相继发布了参数规模达6710亿的DeepSeek-R1、DeepSeek-R1-Zero以及参数范围覆盖15亿至700亿的DeepSeek-R1-Distill系列模型。
2025年1月27日,DeepSeek又新增了基于视觉的Janus-Pro-7B模型。这些模型均已开源,据称其成本效益比同类模型高出90%-95%。官方表示,该系列模型通过强化学习等创新训练方法,在推理能力方面具有显著优势。
对普通用户来说,想要感受DeepSeek的效果,可以直接手机端下载APP进行体验。据QuestMobile数据显示,DeepSeek的日活跃用户数在2月1日突破3000万大关,成为史上最快达成这一里程碑的应用。
但对企业来说,使用DeepSeek却并不简单。部署首先需要价格不菲的硬件,其次需要提供稳定的API,再者还需要构建面向用户端的应用并实施托管,更高阶的要求,还有针对企业私有数据的定制优化,此外,还需要考虑数据和模型的安全问题。
甚至由于企业的需求过于旺盛,在2月6日,DeepSeek暂停了API服务充值。对此官方声明称“当前服务器资源紧张,为避免对您造成业务影响,我们已暂停 API 服务充值。存量充值金额可继续调用,敬请谅解!”
对于希望通过DeepSeek模型来构建生成式AI的企业来说,转向云服务是不错的选择。早在1月31日,作为全球云计算领域的领头羊,亚马逊云科技就在Amazon Bedrock和SageMaker AI中上线了DeepSeek-R1模型。
据了解,目前亚马逊云科技提供了4种部署方式:在Amazon Bedrock Marketplace部署DeepSeek-R1模型 通过Amazon SageMaker JumpStart部署DeepSeek-R1模型 利用Amazon Bedrock的自定义模型导入功能部署DeepSeek-R1-Distill模型 使用Amazon EC2 Trn1实例部署DeepSeek-R1-Distill模型。
具体来说,通过Amazon Bedrock Marketplace部署DeepSeek-R1,可选实例包括EC2 P5e的48xlarge型号,单个实例包含8颗H200 GPU,以及3200Gbps的网络带宽,充分满足DeepSeek-R1的性能需求。
在Amazon SageMaker Jumpstart中也可以快速部署DeepSeek模型。
下图则是在Amazon Bedrock模型定制页面部署DeepSeek 8BLlama Model。
对许多企业来说,云服务是运用生成式AI最好的方式。