来源:中国新闻周刊
补齐基础研究短板
2025年开年,国内深度求索(DeepSeek)公司推出大语言模型DeepSeek R1引发全球轰动。这款开源模型在有限算力条件下,复现出OpenAI最先进的闭源o1模型的能力,让社会各界感受到AI富有“灵性”的深度思考能力,这是迈向通用人工智能的重要一步。
从技术角度看,DeepSeek实现了算法创新驱动的效率革命。DeepSeek团队在缺乏参考的情况下,成功复现媲美 OpenAI o1 模型的深度推理能力,而且应用程序接口(API)价格仅为后者的 1/30;此前DeepSeek V3 模型通过模型架构和基础软硬件的深度集成优化,实现与 GPT-4o 相当模型能力的同时,单次训练成本仅为同水平模型的 1/10。这些均证明国内团队已具备顶尖的算法创新能力,可以让大模型的训练和推理更加高效。
图/视觉中国此外,开源生态与普惠AI成为中国技术突围的战略支点。如果说2023年Meta开源大模型LLaMA为全球开发者带来ChatGPT水平的智能,那么DeepSeek R1则为大家带来OpenAI o1水平的智能。DeepSeek不仅公开模型并制定宽松的使用协议,还发布详尽的技术报告介绍实现方案,这种开源精神带来的“普惠冲击波”,打破了OpenAI尝试通过闭源建立的技术壁垒。开源生态将成为算法创新的加速器,推动全球开发者共同探索高效化路径。中国若能持续发挥开源优势,有望在AI普惠化进程中占据先机。
但值得注意的是,尽管DeepSeek R1模型效果媲美世界最先进的OpenAI o1并在计算效率上拥有巨大优势,但是OpenAI随后发布了o3模型,显著增强了在STEM(科学、技术、工程和数学)方面的高阶推理能力,这说明我国在大模型技术方面总体仍处于追赶状态。尽管中美 AI 差距不断缩小,但需要警惕诸如“中国AI已超越美国”“DeepSeek羞辱OpenAI”等极端乐观的说法。事实上,AGI新技术正处于快速演进期,未来发展路径尚不明朗,我们虽不再望尘莫及,但在人才储备、算力资源和创新生态等方面仍有差距,需要保持头脑清醒,走好后面更有挑战的路。
关于通向AGI的未来之路,DeepSeek的启示直指AI发展的两大命题:其一,高效和普惠是智能革命的必然选择。要让 AI 服务全人类实现 “人人可用”,高效性至关重要。DeepSeek通过模型架构、算法和算力的协同创新,成为大模型普惠AI发展的重要里程碑。芯片行业在“摩尔定律”的指引下,不断推进芯片制程提升芯片电路密度,从而实现计算设备的小型化和普惠化,推动实现信息革命。现有研究表明,大模型发展也呈现出类似摩尔定律的“密度定律”,根据统计,2023年以来大模型的能力密度大约每100天翻一倍,即每过100天只需要一半的算力和一半的参数就能实现相同的能力。最近,OpenAI的CEO 山姆·奥特曼也给出了类似的观察,“使用特定水平AI,成本每年大约变为原来的十分之一”。面向未来,追求更高能力密度、以更低成本实现大模型高效发展,将是实现智能革命的关键路径。
其二,自主创新需“结硬寨,打呆仗”。DeepSeek模型的极致高效,需要建立在高水平科研队伍、长期的研究和实验验证的基础上。DeepSeek有着一批极客式的优秀研发队伍,有充足的研发预算,专注研究和技术,没有商业化压力,算力资源也十分充足。这种专注和投入是自主创新的关键。未来AI创新发展需在三大方向发力:首先,探索人工智能的科学化技术方案,为极致高效实现人工智能提供理论指导。其次,推动计算系统的智能化,将大模型与底层芯片、操作系统、数据管理、编程开发、网络通信等软硬件深度融合,在计算层面以更低的成本更通用地将大模型应用于各个领域。最后,在各个领域探索人工智能的创新应用,服务高精尖制造、科学发现等高度专业化场景。
DeepSeek的成功让我们看到,用“小米加步枪”中国AI依然能够取得不错的进展。然而,AGI技术仍在快速演进,我们需发挥开源和工程创新优势,补齐基础研究短板,走出一条人工智能高质量发展之路,让 DeepSeek点燃的火种,成为推动智能革命的熊熊烈火。
(作者系清华大学计算机系长聘副教授、面壁智能首席科学家)
发于2025.2.24总第1176期《中国新闻周刊》杂志
杂志标题:高效普惠是人工智能革命的必然选择
作者:刘知远
编辑:杜玮
运营编辑:马晓轶
特别声明:以上内容仅代表作者本人的观点或立场,不代表Hehson财经头条的观点或立场。如因作品内容、版权或其他问题需要与Hehson财经头条联系的,请于上述内容发布后的30天内进行。