DeepSeek致谢腾讯技术团队:对DeepEP的优化,是一次“huge speedup”代码贡献
创始人
2025-05-07 19:27:01

  Hehson科技讯 5月7日晚间消息,Hehson科技获悉,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。经测试,优化后的通信框架性能在RoCE网络环境提升100%,IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。该技术方案获得了DeepSeek公开致谢,称这是一次“huge speedup”代码贡献。

  自今年2月DeepSeek开源包括DeepEP在内的五大代码库以来,该团队便向业界展示了如何利用有限的硬件资源实现接近万卡集群的性能。在这些技术中,DeepEP凭借突破性的方法提升了300%的通信效率,成功解决了MoE架构大模型对英伟达NCCL的依赖问题。但该技术在成本较低、适用面更广的RoCE网络环境中表现不佳,限制了其在更广泛场景的应用。这一痛点引发了开源社区的持续讨论。

  据悉,腾讯星脉网络团队在DeepEP开源后便展开技术攻关,发现两大关键瓶颈:一是对于双端口网卡带宽利用率不足,二是CPU控制面交互存在时延。

  在腾讯的技术优化下,DeepEP不仅在RoCE网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原有通信效率再提升30%。

  目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构建的高性能环境中,这套方案展现出出色的通用性。(文猛)

相关内容

热门资讯

“零障”赛区全龄友好 湾区同心... (来源:千龙网)本届残特奥会,粤港澳三地同步推进无障碍提质改造,从设施无障碍到信息无障碍,为参赛运动...
万物云灵石发布,不动产管理迈向... 来源:风财讯12月12日,万物云睿见大会2025“睿见·灵石”在上海国际传媒港举行。大会汇聚近300...
退役军人创业 有何扶持? 转自:成都日报锦观退役军人创业 有何扶持? 随着经济社会的发展,退役军人群体创业规模持续扩大...
着眼全局,把握明年经济工作的总... 转自:成都日报锦观着眼全局,把握明年经济工作的总体要求和政策取向——论学习贯彻中央经济工作会议精神 ...
成都科创在柏林“实力圈粉” 转自:成都日报锦观储能、AI、生物科技……成都科创在柏林“实力圈粉” 本报讯 (成都日报锦观新...