凭借三大核心技术,壁仞科技完成Qwen3旗舰模型训练适配与优化
创始人
2025-05-15 14:31:40
0

近日,在高效适配Qwen3系列模型推理后,壁仞科技宣布完成旗舰版Qwen3-235B-A22B模型的训练适配和优化。由此,壁仞科技已实现Qwen3系列模型在国产GPU平台的高效全栈式训练与推理支持。

4月29日,阿里巴巴通义千问正式发布并开源8款新版Qwen3系列“混合推理模型”。从官方披露的数据来看,旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与DeepSeek-R1等顶级模型相比,表现出极具竞争力的结果。

壁仞科技在Qwen3发布后数小时内完成了全系列模型的推理支持。受益于前期适配DeepSeek-V3满血版训练的关键技术和成功经验,壁仞科技进一步升级快速实现Qwen3-235B-A22B旗舰版最大参数量模型的训练适配与优化支持。基于壁仞科技自研Megatron-LM-BR训练插件,用户可实现大模型零代码修改下无缝运行,开箱即用。

值得关注的是,Megatron-LM-BR融合了壁仞科技自主知识产权的三大核心技术:虚拟层+动态重排、Async Offload、多维算子融合,实现了适配通用性与训练性能的双重保障。

业界首创"虚拟层+动态重排"技术,显著降低流水线气泡

阿里开源的Pai-Megatron-Patch发布了Qwen3 MoE 模型的最佳实践,但Qwen3-235B-A22B模型包含94个Transformer Layer,其默认的策略如PP8无法均衡切分Layer导致无法使用Interleave with Virtual Pipeline高效流水线机制,因此造成流水线等待问题。壁仞科技基于Megatron-LM-BR自主研发了"虚拟层+动态重排"技术:通过插入两个虚拟层将总层数扩展至96层,实现均匀切分以支持Interleave with Virtual Pipeline机制;同时对部分Layer进行动态重排,使流水线计算通信负载均衡,从而显著降低流水线气泡率。

业界首创Async Offload技术,实现精度无损极速预训练

为发挥算力优势和提升显存效率,壁仞科技自主研发Async Offload(异步卸载)机制:将大量激活张量和优化器状态异步迁移至CPU内存,仅使用64张GPU卡即可支持Qwen3-235B-A22B精度无损的全参模型高效预训练;而业界其他已发布案例至少需要256卡,另外其他方案如FP8可以降低显存消耗,但容易对精度产生影响。壁仞科技同时还支持智能重计算策略,动态识别显存瓶颈层,实现"算力换空间"智能决策。通过Async Offload和重计算显存优化双擎技术,壁仞科技实现了算力开销和显存节约的最佳均衡。

融合算子多维加速体系,充分释放算力潜能

针对GroupedMLP、Permutation、Unpermutation等关键耗时算子,壁仞科技基于其GPU架构特点实现了泛化的图算/通算融合优化。支持多计算操作极致的片上融合、张量处理器与矢量处理器极致异步融合、多级缓存的流水融合、以及计算与通信融合,并进一步引入自动化的Kernel Selection技术,基于硬件计算/通信/访存建模的Cost Model针对不同工作负载自适应选择最优内核实现,将芯片综合能效发挥到极致,同时也确保了通用的泛化能力。在保持精度无损的同时,达成计算效率、硬件利用率与内存带宽的多维度协同优化。

相关内容

热门资讯

中集集团(02039)聘任高翔... 中集集团(02039)公布,2025 年 5 月 15 日,董事会同意根据董事长/执行董事麦伯良先生...
卡尔动力于洋:L4级无人驾驶通...   专用车产业创新发展大会暨专用车科技展(2025)于5月15日在十堰开幕。卡尔动力(北京)科技有限...
中央和国家机关五四青年交流会激... 转自:中工网5月15日,由中央和国家机关工委主办的中央和国家机关五四青年交流会在北京举行。获得中央和...
联合能源集团(00467.HK... 格隆汇5月15日丨联合能源集团(00467.HK)公告,于2025年5月15日,公司全资附属公司Un...
派能科技发生大宗交易 成交溢价... 派能科技5月15日大宗交易平台出现一笔成交,成交量15.00万股,成交金额682.50万元,大宗交易...
逆境向前 绽放光彩——推进残疾... 来源:新新华社北京5月15日电 题:逆境向前 绽放光彩——推进残疾人事业发展弘扬自强与助残精神新华社...
财政部:从事证券服务业务的资产... 中新网北京5月15日电 (记者 赵建华)2024年12月,财政部、中国证监会修订印发《资产评估机构从...
豪迈科技(002595.SZ)... 格隆汇5月15日丨豪迈科技(002595.SZ)于近期投资者关系活动表示,数控机床和电加热硫化机业务...
“职业打假人”调查:“盯牢”化... 文|IT时报记者 孙永会编辑|郝俊慧 孙妍职业打假人正在经历一场“变形记”。江西武宁“00后”职业打...
中国商务部介绍中美经贸磋商进展 中新社北京5月15日电 (尹倩芸)中国商务部新闻发言人何咏前15日表示,中方对通过对话沟通解决经贸关...
正荣地产(06158.HK):... 格隆汇5月15日丨正荣地产(06158.HK)公告,公司已接获英属处女群岛高等法院东加勒比海最高法院...
投资者提问:公司此前分别向深交... 投资者提问:公司此前分别向深交所提交了撤销退市风险警示和撤销其他风险警示。后公司在公告以及回复投资者...
永杉锂业(603399.SH)... 格隆汇5月15日丨永杉锂业(603399.SH)公布2025年度向特定对象发行A股股票预案,本次向特...
投资者提问:贵公司是否涉及财务... 投资者提问:贵公司是否涉及财务造假,是否涉及强制退市规则,现在对投资者有何赔偿打算?董秘回答(ST华...
航新科技(300424.SZ)... 格隆汇5月15日丨航新科技(300424.SZ)公布,公司原控股股东柳少娟女士拟在自公告披露之日起1...
ST华西:连续11个交易日跌停... 投资者提问:ST华西(维权)连续11个交易日跌停,年报遭审计保留意见且业绩由盈转亏,控股股东股份司法...
北京房山大石河三只黑鹳幼鸟出生... 【#北京房山大石河三只黑鹳幼鸟出生# 为国家一级保护动物】5月15日,北京青年报记者从北京黑豹野生动...
人民教育家于漪为山东高密学校赠... 中国教育报-中国教育新闻网讯(记者 魏海政 通讯员 董少校)近日,山东省高密市立新中学和柴沟中学相继...
光大银行5月15日大宗交易成交... 光大银行5月15日大宗交易平台出现一笔成交,成交量100.00万股,成交金额400.00万元,大宗交...
中集集团(02039.HK)聘... 格隆汇5月15日丨中集集团(02039.HK)公告,2025年5月15日,公司第十一届董事会2025...