转自:中国共青团网
在人工智能浪潮席卷全球的背景下,算力已成为数字时代的核心生产力,算力网则成为与电网、高速路网同样重要的基础设施。2022年,国家“东数西算”工程全面启动,构建全国一体化算力网络体系由此成为应对新一轮科技革命和产业变革的战略举措,由深圳鹏城实验室牵头推进的原创性科技计划“中国算力网”应运而生。
然而,立项之初,国外技术垄断的阴云仍笼罩在中国科技工作者心头。为全力突破这一原创性、前沿性技术难题,从鹏城实验室各研究线上抽调的156名青年组成的青年攻关团队,扛起研发和加速推进全国一体化算力建设的重任,整个攻关团队35岁以下青年占比高达82%,专业涉及光纤通信、光通信、系统、软件以及应用等多个领域。
“要让用户像用电一样方便地使用算力。”这是中国工程院院士、鹏城实验室主任高文对“中国算力网”建设提出的愿景,也是青年攻关团队锚定的目标。
攻克通信、网络、计算相融合的全链条核心技术难题,成了决定我国算力发展实现弯道超车的关键。“这是一个不允许失败的任务,我们既要做得快,还要做得一丝不苟。”团队负责人这句掷地有声的话,映照出这群青年科技工作者的决心。
“项目初期,我们面临诸多难题,其中最大的难点在于如何让用户稳定高效地使用各种异构算力。”负责云际互联异构算力调度算法开发的一名90后工程师说,对用户而言,他们并不关心背后复杂的算力架构和技术细节,只希望能够方便快捷地获取所需的算力资源。因此,平台首先要具备高效的算力需求调度能力,能够将用户的需求精准地匹配到最合适的算力中心。同时,由于不同算力中心在硬件架构、软件环境、资源管理方式等方面存在差异,平台还需要具备强大的适配能力。为了攻克这一系列技术难题,团队日夜奋战在研发一线,通过一次次实验测试,不断优化算法模型,提升系统的性能与稳定性。
团队另一名成员拿到博士学位后,选择加入鹏城实验室的空芯光纤攻关组。入职那天,团队前辈指着一根晶莹的玻璃管对这名新成员说,这是能改变信息时代的“光之隧道”,“你敢不敢挑战?”她点点头。攻关路上,她和队友曾遭遇光纤传输距离迟迟得不到突破的难题,直到发现某次异常数据中,特定频段的信号畸变随着传输距离呈现某种规律,于是,她连续两周“泡”在实验室,终于在某个夜晚成功构建出新的长距离传输模型。那晚,组员的欢呼声划破园区宁静的夜空。
经过无数个日夜和无数次反复运算,团队终于迎来突破性进展。2023年,青年攻关团队成功攻克异构智能算力集群系统的核心技术壁垒,创新性实现国产异构芯片的统一纳管技术突破,该系统可对昇腾、寒武纪、海光等10余款主流国产芯片进行云化整合,构建起具备弹性扩展能力的异构算力资源池,显著提升了国产芯片的协同计算效能。配套研发的异构算力云际互联系统,突破传统算力中心孤岛式运行的瓶颈,实现跨地域算力资源的动态调度,可将不同架构的独立算力中心无缝接入统一服务平台,为构建全国一体化算力网络提供了关键技术支撑。
在广东省、深圳市的大力支持下,经过9个月的高强度研发,青年攻关团队以“深圳速度”研制完成首个全国产E级人工智能算力平台“鹏城云脑Ⅱ”,并突破大规模并行训练技术,填补了国产智算上千亿级大模型高效率训练技术空白。正在研发的新一代“鹏城云脑Ⅲ”着力打造面向6G超宽带通信的云网合一智能化工具平台,建成后,算力将是“鹏城云脑Ⅱ”的16倍。
从2022年第一家算力中心接入“中国算力网”至今,“中国算力网”已跨地域接入近30个异构算力集群,覆盖全国20余座城市,形成的算力网络犹如一条条跃动的血脉,纵横交错、相互贯通,逐步编织成一张遍布全国主要区域的算力服务网络。
为了进一步验证和提升“中国算力网”的服务效能,依托核心枢纽“鹏城云脑Ⅱ”,青年攻关团队全力推进“鹏城·脑海”大模型技术攻关。团队从数据采集与优化着手,采用全自主、安全可控的国产软硬件体系进行模型开发与训练,并基于国内自主研发的AI框架,实现长期稳定的多维分布式并行训练。
2023年9月,团队成功基于全栈国产算力技术完成了2000亿参数规模的大语言模型基座——“鹏城·脑海”的稳定训练。团队成员小陶回忆道,那段日子充满了挑战与突破。面对算力网集群复杂多变的特性,他们不断探索、反复试验,历经无数次尝试与失败,终于成功设计完成基于算力网集群特点的细粒度自适应重算机制。这一创新机制,让“鹏城·脑海”大模型在通信网络、算力配置差异化的集群环境中,实现了前所未有的高效计算,不仅大幅提升了模型的训练速度,更使得算力协同效率显著提升40%。
如今,青年攻关队员仍穿梭于实验室与全国各地算力节点之间,行程紧凑,分秒必争。步履匆匆间,“中国算力网”研究计划由一纸蓝图逐步演变为触手可及的现实,在理论方法、关键技术与软硬件平台等方面均取得系统性突破,核心成果曾荣获国家和省部级科技奖励。青年攻关队员也真正做到了把论文写在祖国的大地上,把科研成果应用到建设科技强国的伟大事业中。
中青报·中青网记者 武欣中来源:中国青年报
2025年06月04日 01版