- 天翼云获分布式数据库专利!技术创新助力企业发展
- 解锁分布式光纤传感技术的未来:DOFS2025大会全新启航
- Docker 容器化技术深度解析与实践
- 中国联通获Kubernetes存储技术专利:助力数字经济时代
- 用户破百万的鸿蒙原生版钉钉再进化!【邮箱】功能开启端云协同新范式
联系人:王经理
手机:13928851055
电话:13928851055
邮箱:sgbwre@163.com
地址:广州市天河南一街14-16号华信大夏四楼
全面适配!京东云将DeepSeek推理场景性能提升50%
京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。
作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。
京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。
此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。
针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。
在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。
在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。
在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。
目前,在河Kaiyun开云南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。
京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeeKaiyun开云pEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。
-
2025-03-15Docker 容器化技术深度解析与实践
-
2025-03-15中国联通获Kubernetes存储技术专利:助力数字经济时代
-
2025-03-14云原生与传统架构的对比:企业如何实现无缝迁移?
-
2025-03-14腾讯云推出云原生构建(CNB)多项免费算力资源助力开源协作
-
2025-03-14创维数字(000810)周评:本周跌295%主力资金合计净流出115亿元
-
2025-03-14华为云胡玉海:主机上云加速构筑金融云上新核心
-
2025-03-12存储战局:2024全球SDS上市公司年报拆解——谁在改写行业规则?
-
2025-03-11为什么要使用Docker容器化技术