我国科学家发明混合并行新算法,训练 AI 速度近乎翻倍
创始人
2025-05-29 11:13:18
0

IT之家 5 月 29 日消息,中国科学报今天(5 月 29 日)报道,我国科学家联合发明混合并行新算法 GroPipe,首次融合流水线模型并行与数据并行,训练 AI 速度近乎实现翻倍。

IT之家援引博文介绍,该算法由西北农林科技大学信息工程学院智能计算与农业信息系统团队刘斌教授带领,携手美国纽约州立大学和云南大学,相关论文联合发表在国际计算机体系结构领域权威期刊《IEEE Transactions on Computers》(TC,CCF A 类期刊)上。

西北农林科技大学信息工程学院教授刘斌担任第一作者,纪泽宇老师与云南大学副教授何臻力共同担任通讯作者,纽约州立大学教授李克勤(欧洲科学院院士,并行与分布式计算领域公认的顶尖学者,国家特聘教授)作为重要合作者。

研究指出,在训练大型深度卷积神经网络(DCNNs)方面,使用越来越大的数据集来提高模型精度已变得非常耗时,数据并行(DP)和流水线模型并行(PMP)等分布式训练方法虽然提供了可行解决方案,但面临负载不平衡和显著的通信开销等挑战。

为此团队提出了 GroPipe 算法架构,协同整合 PMP 和 DP,采用了基于性能预测技术的自动模型分割算法,确保负载平衡并便于在 PMP 中进行定量性能评估。

GroPipe 方法整体框架图。西北农林科技大学供图

该方法首次将流水线模型并行与数据并行相融合,构建“组内流水线 + 组间数据并行”的分层训练架构,并通过自动模型划分算法(AMPA)实现计算负载的动态均衡调度,大幅提升 GPU 资源利用率。

在一台 8-GPU 服务器上广泛测试后,发现在 ImageNet 数据集上,GroPipe 方法相较于主流方案(如 DP、Torchgpipe、DAPPLE 和 DeepSpeed)表现出卓越优势:ResNet 系列平均加速比达 42.2%,VGG 系列达 79.2%;在 BERT-base 模型训练中,性能提升最高可达 51%。

IT之家附上参考地址

相关内容

热门资讯

以军总参谋长:若被扣押人员无法... 当地时间8月1日获悉,以军总参谋长扎米尔当天在加沙地带视察了以军部队,并与以军南方司令部司令等以军高...
同比增长5.8% 转自:大湾区之声宏观政策持续发力适时加力 巩固拓展经济回升向好势头记者8月1日从国家发展改革委了解到...
港媒:全球AI治理,不能没有中...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:环球网资讯)...
ST应急等多家上市公司涉信披或... 投资快报记者关注到,近期,ST应急(维权)等多家上市公司因涉嫌信息披露违法违规或财务数据问题受到监管...
长沙博物馆暑期延长开放暨“魏晋...   长沙晚报8月1日讯(全媒体记者 任波 通讯员 曾麟 李雨蔚)千年画像砖在琵琶与灯影中苏醒,汉服舞...
传承红色基因 携手奋进未来   本报讯(记者 阴祖峰)8月1日,黑龙江省少先队校外实践教育营地内军歌嘹亮、誓言铿锵,来自哈尔滨、...
哈机场开通 “哈尔滨-上海空中...   本报讯(仇建 记者 刘希阳)8月1日,黑龙江机场集团联合东航开通“哈尔滨-上海空中快线”,实现双...
也门胡塞武装导弹再袭以色列机场... 转自:新华网  新华社耶路撒冷8月1日电(记者路一凡 王卓伦)以色列国防军1日晚发表声明说,以空军当...
小布说天气 | 没暑假硬度假~... 转自:郑州发布郑州市气象局提醒:今天白天到夜里:晴天间多云偏东风转偏南风:2-3级最高气温:36~3...
驻港公署:绝不接受、绝不容忍、... 据外交部驻港公署微信公众号8月1日消息,针对加拿大、新西兰外长以及欧盟对外行动署发言人等政客妄议香港...