金山云在公有云场景和国资云/政务云场景已支持DeepSeek-R1/V3。
场景一 公有云场景针对DeepSeek-R1蒸馏模型的多种镜像服务
金山云已正式发布基于DeepSeek-R1蒸馏模型的多种镜像服务,用户可以在金山云官网,进入“金山云控制台”免费体验。
通过金山云发布的DeepSeek镜像服务,用户可在公有云GPU云服务器、GPU裸金属服务器分别搭建推理服务并进行调参验证。
云服务器镜像获取方式
在云服务器控制台按需选择实例规格后,在“镜像配置-镜像市场-工具软件”模块选择DeepSeek-R1系列的镜像创建云服务器,登录实例进行部署验证。
镜像内置DeepSeek模型的使用方法
vLLM 部署提供支持,适用于高性能大语言模型的推理和微调任务,支持DeepSeek系列模型运行。DeepSeek模型部署推荐的实例规格配置以及详细验证方法,可参考金山云官网文档内置DeepSeek模型的使用方法:https://docs.ksyun.com/documents/44126?type=3
裸金属镜像获取方式
当前,金山云裸金属GPU系列机型均能高效支持DeepSeek-R1蒸馏模型快速部署,部分机型可支持DeepSeek-R1满血版671B模型的快捷使用。针对DeepSeek蒸馏模型提供自定义镜像,开机即用,满血版模型可通过KS3快速下载部署使用。
在裸金属服务器的实例规格选择界面选择合适的机型后,进入“选择镜像”步骤,选取DeepSeek-R1系列镜像创建裸金属服务器实例。实例创建并成功启动后即可通过远程连接工具登录到该实例验证并使用。
金山云针对DeepSeek-R1蒸馏模型镜像服务的适用场景及特点
适用场景:
长文档分析、多轮对话、复杂代码项目理解等。
特点:
针对长上下文场景优化,支持 32K tokens 窗口。
使用 Positional Interpolation(位置插值)技术降低长文本推理的复杂度。
提供较小尺寸的 DeepSeek 蒸馏版本模型适用于基础公有云、中小型企业内部实时部署,也方便个人用户快速搭建对话服务。
*云服务器本次开放1.5B、32B两种尺寸模型镜像,其余尺寸模型镜像陆续更新中。金山云公有云自研平台推理部署模块即将接入DeepSeek,更多国产芯片适配工作也在加速推进中。
场景二 金山云国资云/政务云场景全面支持DeepSeek-R1/V3推理服务
金山云国资云/政务云平台已正式上架 DeepSeek-R1和 DeepSeek-V3模型。通过集成金山云自研的内容安全服务,客户可实现模型安全增强与企业级高可用保障。
金山云国资云/政务云平台具备优异的模型推理托管能力,支持vLLM、LMDeploy、TensorRT-LLM、SGLang等各类主流推理框架,可实现模型的自定义导入与部署,为开发者提供了高度灵活的开发环境。目前,金山云的人工智能技术已被多个央国企采纳,显著提升了其数据处理效率。
依托国资云/政务云平台,金山云通过模型市场构建丰富的模型资源,同时匹配包含数据加工、模型精调、模型评估、模型量化等关键环节在内的一站式模型工具链,始终致力于为用户提供全流程、一站式的AI服务,助力客户在实际业务场景中深度优化模型性能。
在人工智能浪潮下,金山云将继续坚持技术立业,加速技术创新落地,携手生态企业积极拥抱时代机遇,助力行业数智化转型。