彭文生/文
2025年1月20日,中国DeepSeek公司发布DeepSeek R1大模型,其在数学推理等基准测试上超越了行业领先模型,性能和成本等指标令科技巨头刮目相看,有三个“没想到”引发热烈讨论。
第一个“没想到”,DeepSeek R1由一家从事量化投资的中国公司开发。传统观念认为,AI大模型的研发需要长期、持续、巨额的资金投入和技术积累,这似乎是科技巨头的专属赛道,同时一般认为科技创新由科技公司或科研机构承担,没想到这次创新由一家金融企业完成。DeepSeek打破了人们对AI研发主体和模式的固有认知。
第二个“没想到”,推理性能相对卓越的DeepSeek R1选择了开源。在竞争激烈的AI大模型领域,顶尖模型往往被视为核心资产和竞争优势,OpenAI、Google等领先公司通常选择对最先进的模型进行闭源或仅开放有限的API接口,以保持技术领先性和商业利益。DeepSeek R1作为一个性能比肩顶尖模型的存在,却反其道而行之,选择了开源方式。与闭源相比,开源模式的商业利润空间可能较小,但能吸引更多参与者,有利于更大规模的创新生态的形成。
第三个“没想到”,美国在AI领域的领先地位似乎并不牢固。此前比较普遍的观点认为,AI大模型的研发高度依赖规模的作用,即数据规模、参数规模和算力规模三者共同驱动模型性能的提升,形成所谓的“规模定律”(Scaling Laws)。如果这种观点成立,那么像美国这样拥有海量数据、顶级算力和雄厚资金的国家,将在AI竞赛中持续扩大领先优势,形成“赢者通吃”的局面,最终牢牢掌控AI领域的领导权。但是DeepSeek R1的出现,让很多人开始重新评估中美AI能力的差距,甚至全球的竞争格局。
上述这三个“没想到”都和规模的概念有关联,这也是我们理解DeepSeek对中国创新经济发展的启示的关键。
AI经济学:规模定律还是规模效应?
DeepSeek的“意外”爆红,打破了此前人们对AI大模型研发门槛要求的执念,尤其降低了算力推理的约束。历史上技术进步的扩散与应用一般都伴随着成本的下降,进而从“小众”走向“普惠”,这次DeepSeek是不是AI技术走向普惠过程的一个重要进展?背后的机制是什么?DeepSeek是不是意味着AI发展的规模定律不重要了,还是有更广的含义?要回答这些问题,关键是要理解AI领域中规模定律(Scaling Laws)和规模效应(Scale Effect)这两个关键机制的相互作用。当前就AI发展的经济学讨论,常常混淆了规模效应和规模定律这两个概念,由此带来一些认知上的偏差。
规模定律是一个技术可行性的概念,其核心观点可以概括为:在模型训练阶段,增加模型参数量、训练数据量、以及计算资源投入(算力),AI性能会提升,但在给定算法框架和特定任务下,边际性能提升幅度会逐渐递减。我们可以将数据、参数、算力视为AI生产函数的“投入要素”,更精确地说是AI模型训练的“投入要素”。在给定的算法框架下,这三要素的投入规模,直接决定了AI模型的产出性能。如同传统工业生产需要原材料、设备和能源一样,当前高性能AI大模型的研发也离不开数据、参数和算力。“Scaling is all you need(你只需规模)”,规模定律意味着通过不断扩大模型规模(增加参数)、增加训练数据、提升算力水平,AI模型的性能往往能够持续提升,甚至还会“涌现”出意料之外的能力。然而,规模定律也并非“万能公式”。当数据、参数、算力等要素的投入规模达到一定程度后,其边际收益会逐渐递减。由此带来一个问题,单纯依靠规模扩张虽然带来模型性能一定程度的提升,但在经济上并不一定是最优或可持续的,比如算力资源投入成本,模型训练与运行的能源消耗成本等。
“规模效应”是一个经济学概念,讲的是经济可行性,意味着规模越大,单位产出的成本越低。就AI大模型而言,规模效应至关重要,且可区分为内部规模效应和外部规模效应两种。内部规模经济效应体现于单个组织或企业的运营由于自身生产规模扩大而带来的成本降低和效率提升。例如,大型AI研发机构在长期运营过程中,会积累大量的研发经验、技术诀窍、代码库、模型库等知识资产。规模化的机构更有能力建立完善的知识管理系统,将这些知识资产有效地组织和沉淀下来,并在不同的研发项目中进行复用。这种知识的积累和复用,可以避免重复“踩坑”,缩短研发周期,降低研发成本,提高整体创新效率。外部规模效应指的是整个行业或特定区域的规模扩大,所带来的成本降低和效率提升。AI产业的蓬勃发展也展现出强大的外部规模经济效应,这种效应并非单个机构独享,而是整个AI产业规模扩张为所有参与者带来的共同收益。例如,完善的AI基础设施生态的构建,如专业的云算力平台和高速网络设施,降低了所有企业获取算力资源的成本;专业化AI服务生态降低了行业门槛和成本,成熟的AI人才市场促进了知识溢出和创新活力,AI应用场景的拓展和市场繁荣则为产业发展提供了更广阔的空间。
那么究竟该如何理解规模定律和规模效应对DeepSeek破局的含义?我们可以引入一个更深入的分析框架——AI生产函数。从经济学角度讲,可以将AI生产函数视为一个由四个关键组成部分构成的系统:算法框架(Algorithm Framework)、数据(Data)、参数(Parameters)和算力(Compute)。在这四个组成部分中,算法框架扮演着至关重要的角色,类似于“技术”或“生产工艺”。而数据、参数、算力则相当于“投入要素”,其规模投入固然重要,但最终的产出效率,很大程度上取决于“技术”的先进程度。在给定的算法框架下,数据、参数、算力遵循规模定律,总要素投入的增加会带来性能的提升,但也会表现出边际收益递减的趋势。
从动态的维度来看,由于算法框架的不断迭代,算力等“投入要素”的边际收益,并非如单一规模定律曲线所显示的那样持续递减,甚至有可能呈现出规模报酬递增的形态。规模定律所揭示的边际递减可以被周期性地打破,每一次重大算法框架(技术)的进步都可能带来新的“增量收益”。
以上分析显示,从AI技术发展的长周期来看,尽管在每一个既定的算法框架下,都存在着规模报酬递减的现象(Scaling Laws),但算法框架(技术)的创新,减弱了规模定律的约束。不是规模定律不重要了,甚至不能说规模定律的约束降低了,正是因为要素投入规模给定的约束,促使DeepSeek另辟蹊径,从技术(算法进步)来提升模型的性能。一个进一步的问题是,技术进步(算法进步)是怎么来的?算法创新背后有规模经济的支撑。算法研发本身就是一个持续“试错”的迭代过程,拥有更大规模的研发资源,就能展开更多“试错分支”,从而更高效地逼近算法创新的“无人区”,更快地找到“破局点”。规模越大,意味着试错的“广度”和“深度”就越大,算法创新也就更具确定性。这里的规模经济不仅是指单个企业的内部规模经济,更重要的是上下游协同,基于基础设施和人才池的外部规模经济。算法创新高度依赖于规模效应所构建的创新生态,站在前人研究的基础上,广泛吸收来自学术界、产业界、开源社区等各方智慧的“集体结晶”。“内部规模效应”与“外部规模效应”的相互协同,共同构成了AI研发规模效应的完整内涵。
总之,DeepSeek的成功,看似是一个降低规模定律约束、打破规模壁垒的故事,但从宏观角度来看,这反而是规模经济的体现,尤其得益于中国的大国规模提供的外部规模经济。也正因为此,AI领域的竞争,绝不仅仅是企业与企业之间的“单点竞争”,更是一场国家与国家之间的“体系化竞争”,因为只有国家层面的规模效应,才能构建起支撑持续性算法创新的“规模底座”,才能在长期的AI竞争中占据战略主动。
AI经济学:后发优势还是先发优势?
规模定律与规模效应的差异也为我们理解国家之间AI竞争格局提供了重要启示。规模定律揭示了AI性能提升的技术路径,但也指出了规模扩张面临的边际收益递减约束。这为后发者提供了追赶空间,类似新古典增长模型中的后发优势——落后者增长更快,领先者与落后者的差距可能收敛。可能正因为担心中国的追赶,美国试图通过对中国算力能力的限制来维持其领先优势。规模效应则暗示AI研发具有“赢者通吃”的特性,类似内生增长模型中的先发优势,规模报酬递增使得领先者的优势难以撼动,甚至持续扩大。那么,DeepSeek的突破究竟是后发优势的体现,还是中国作为AI领先者的规模效应使然?
在有关AI国际竞争的分析中,中金研究部和研究院出版的《AI经济学》基于各国在AI研发端和应用端的规模,计算了AI发展指数。结果显示,全球AI格局呈现显著的规模分化,美国和中国凭借压倒性的优势占据指数排行榜的前两位。其中,美国在研发端规模优势略高于中国,中国在应用端的规模优势略高于美国。规模效应不仅为AI技术的快速迭代提供了沃土,也塑造了全球AI研发的中心格局,这就解释了为什么AI先进大模型多诞生于中美两个大国。虽然DeepSeek显示先进大模型不必然出现在大型科技企业,但不能由此否定大型经济体的优势。
但还有一个进一步的问题,那就是中美之间又会是什么样的竞争格局?为什么DeepSeek出现在中国,而近期发布的Grok3出现在美国?这背后是两国在规模优势上的分野。规模优势并非是单一维度的,美国算力资源比中国多,但中国人才基数比美国多、应用场景比美国大,两国在规模上各有优势,带来发展路径的差异。2022年ChatGPT问世时,全球优秀AI人才主要工作地虽在美国,但培养人才最多的却是中国——中国优秀AI人才占全球比重从2019年的29%升至2022年的47%,在华工作的比例也从11%增至28%,而美国则从59%降至42%。也就是说,从全球AI优秀人才的角度看,过去几年不但是中国培养的人才数量大幅增加,中国对全球优秀AI人才的吸引力也显著增强。当然,对于中美AI人才谁更有优势,存在争议。但即使美国在算力与人才两个方面对中国都有优势,也就是美国对中国有绝对优势;相对来讲,中国在人才方面的约束比算力要小。从分工的比较优势来讲,中国适合更聚焦在算法等技术进步上,美国适合更聚焦在发挥算力优势上。这也就不难理解,为什么依靠大算力集群的Grok 3出现在美国,而注重算法效率的DeepSeek出现在中国。
美国对中国算力的限制,提高了中国面临的算力成本,起到了促进中国在算法技术研发方面加大投入的作用。未来如果美国加强在算力方面对中国的出口限制,因要素禀赋差异形成的比较优势将进一步影响中美之间的竞争格局。可以预见,中国在AI发展中将更侧重于算法的优化和商业模式的创新,而美国则更专注于算力基础设施的构建,两者或将呈现出差异化的发展路径。那么,中美两国差异化的AI发展路径孰优孰劣呢?从经济分析的角度看,要素投入的边际产出一般是递减的,技术进步才是发展更重要的推动力。经济发展史中,有一个词叫“资源诅咒”,讲的是某一方面的自然资源禀赋太强,反而不利于经济的发展。比如一国石油资源丰富虽然可以带来竞争优势,但也降低了其在其他方面创新的动力。当然半导体和算力本身也属于技术范畴,不能简单与石油类比,但在AI生产函数中算法才是真正驱动AI进步的核心技术。因此DeepSeek的成功还是提出了问题,美国在算力方面的出口限制对于中美AI发展到底起到什么作用?会不会带来意想不到的结果?这些问题都值得我们思考。
规模定律对应着AI领域的后发优势,而规模效应对应着先发优势。前者表明后发者可以通过要素累积实现追赶,后者则强调先发者可以通过规模报酬递增保持优势。跟其他国家相比,中美在AI领域都具备显著的规模优势,但中国的比较优势在于其庞大的人才储备和广阔的应用市场,因此在算法研发上更具潜力。美国限制中国算力的举措,或许是出于对中国后发优势的忌惮,但这恰恰可能会促使中国在算法领域投入更多资源,进一步强化其比较优势。从经济增长的视角看,算法技术的进步才是AI发展的核心驱动力。总而言之,AI竞争并非简单的“后发追赶”与“先发垄断”之争,而是规模优势与技术创新交织的博弈。在AI赛道上,规模奠定基础,创新决出高下——美国限制或许是中国AI崛起的阻力,但也可能是其超越的契机。这一博弈的答案,唯有时间能揭晓,对中国来讲,关键是如何发挥好大型经济体与人口大国相结合的规模优势。
AI经济学:开源促进外部规模经济
在有关AI国际竞争的分析中,《AI经济学》强调了中国在AI应用方面具有规模优势:普通用户层面,中国人口规模大,AI产业化潜在需求广阔;企业用户层面,中国工业体系完整、规模庞大,可为产业AI化提供丰富的应用场景。AI产业化与产业AI化有望带来一系列新产品新业态,共同推动AI应用层繁荣发展,既能够成为AI促进经济增长的载体,所带来的商业利润反过来也可以促进AI技术持续迭代创新。这个理想的发展模式,在过去一段时间受到了大模型原有技术路线的高算力依赖与闭源商业模式的约束,导致大模型在应用层的推广使用面临着较高的经济成本与商业壁垒。
DeepSeek的本次进步有望缓解这个约束。从技术路线来看,DeepSeek表明大模型可以通过算法优化的方式来弥补算力不足的制约,显著降低了大模型的算力成本,也在一定程度上缓解了算力“卡脖子”对于中国AI应用层发展的制约。更重要的是,DeepSeek的开源模式降低了应用层使用大模型的商业壁垒,有利于加速“人工智能+”进程。
虽然开源与闭源是大模型开发者基于自身利益考虑的商业竞争策略选择,但两者实现规模经济效应的方式不一样,因而对社会的含义也不一样。以苹果iOS与谷歌Android系统的比较为例,两者都存在一个围绕操作系统的第三方应用生态,均能实现一定程度的外部规模经济效应。但相对而言,苹果公司在生态中扮演着核心的主导者角色,因而依托闭源iOS的苹果生态更依赖内部规模经济。Android生态则不同,并不存在苹果这种占据绝对主导地位的系统开发者,生态延续与拓展更加具有外部规模经济效应。从经济影响来看,闭源的iOS获得了更多利润,开源的Android则赢得了更多客户。以2025年1月为例,iOS与Android分别占据全球手机操作系统市场份额的27%和72%,开源系统的用户数远超闭源系统。这一定程度上是因为开源系统的商业壁垒低于闭源系统,因而更有利于推广与应用。
DeepSeek似乎正在重现开源软件在推广应用方面的吸引力。在2025年1月11日正式发布后,DeepSeek APP在1月底即跻身全球AI产品日活总榜第二名,仅次于ChatGPT,并在157个国家和地区的苹果应用商店下载排名中位列第一名。根据中金公司研究部软件团队的报告,基于GPT-4级别的应用在2023-2024年没有达到市场预期,DeepSeek作为高性能、低成本的开源大模型,有望给应用层带来更多可能性,企业级应用、通用及垂类C端应用、手机汽车等端侧部署场景均有望受益。
规模经济效应下的应用层加速扩散,在经济的需求侧与供给侧都带来促进作用。一方面,根据《AI经济学》的研究,AI在应用端的潜在市场规模大约是算力层和模型层加总的两倍。技术进步叠加开源带来的应用层加速渗透,有望加快释放应用场景丰富的大国规模优势,从需求侧促进经济产出增加。另一方面,从供给侧角度来看,AI在应用层的加速渗透,尤其是产业AI化加快,会通过赋能现有生产要素的方式促进TFP(全要素生产率)增长,也可以节约现有产业的劳动力使用量,将更多劳动力配置到AI不太容易替代的其他产业中去,以此来增加经济的总产出。需求侧与供给侧扩张效应的互动,意味着即便DeepSeek没有显著突破大模型在技术层面的能力边界,以成本下降和开源为主要特点的技术进步也能够在应用层实现规模经济效应,进而将整体的经济产出边界外推,成为推动经济增长的重要力量。
更重要的是,与闭源有助于开发者在规模经济收益的分配中占据更大份额不同,开源是将规模经济的收益更多分配给了生态伙伴。如前述,开源的Android用户近三倍于闭源的iOS用户。但以2024年二季度的当季营收数据为例,谷歌旗下的Google Play约为112亿美元,不及同期苹果旗下App Store营收的一半(约为246亿美元)。也就是说对于开发者而言,开源的社会收益远大于个体收益,能够更好实现创新之于社会的正外部性。按此逻辑,作为高性价比的开源大模型,DeepSeek不但可以通过外部规模经济更好发挥中国在应用层的规模优势,进而助力整体的经济增长;也有助于实现创新经济收益的更平衡分配,在一定程度上弱化技术进步的贫富分化效果,从需求侧为可持续增长带来积极影响。
创新发展:从“重视供给与资产”到“重视需求与人才”
在DeepSeek引发的讨论中,有一项是为什么高校科研院所没有做出来这样的创新?这可能需要结合着科技创新与产业创新的划分来理解。从创新链角度看,创新成果纵向扩散路径大致可以划分为从基础研究、应用研究,到试验开发,最后进入到大规模生产等四个阶段。其中,前两个阶段通常统称为科学研究,产生的科研成果可以被看成是科技创新;后两个阶段属于科技创新成果的产业化阶段,或者说是产业创新阶段。从正外部性的角度看,越往基础研究等科技创新的上游阶段走,研发成果的正外部性越强,更多需要由公共资金支持的机构,例如高校科研院所作为创新主体;越往试验开发、大规模生产等下游的产业创新阶段走,离市场需求越近,创新成果盈利手段越多、可能性越大,因而正外部性相对越小,企业尤其是民企在这一阶段的创新活动中更具优势。我们认为,DeepSeek等大模型是以市场需求为导向的技术创新,正外部性低于基础研究,因而更可能由(民营)企业而非高校科研院所研发出来。
DeepSeek的突破对于我们思考科技创新与产业创新机制有什么启示?对于创新发展而言,产业创新与科技创新缺一不可,两者需要融合发展。在过去几十年的全球化中,这有赖于中美G2合作。美国更多做“0到1”的前沿创新,也即将基础研究、应用研究等科技创新成果,通过试验开发推进到产业创新初步成功阶段。中国更多在做“1到10”的产业创新。全球智能手机产业链、新能源汽车产业链,正是这种创新链G2合作的典范。
中国由此形成的物美价廉产能,增进了中美两国和全球人民福利,但地缘竞争意味着中美G2合作模式难以为继,“卡脖子”意味着中国难以继续顺利获得美国在供给侧的科技创新,去中心化意味着中国面临全球市场份额收缩的挑战。对于中国而言,应对这些挑战的根本出路在于实现科技创新与产业创新的融合发展。科技创新的核心生产要素是人才,无形资产的重要性也赶不上人才,机器设备等有形资产更是如此;决定产业创新是否成功的因素不仅是供给侧的科技创新含量,更是在于需求侧是否有客户愿意购买。
G2模式造成我国政策取向存在供给侧路径依赖问题,长期聚焦大规模生产阶段也一度导致重有形资产、轻无形资产的政策倾向。因此,对于当下的中国而言,要实现科技创新与产业创新融合发展,首要的是摆脱重供给轻需求、重资产轻人才的路径依赖。大市场与多元化的消费需求,是促进产业创新的根本驱动力,同时也是原创性研发资源投入的根本来源。事实上,不只是DeepSeek,去年火爆的中国第一款3A游戏《黑神话悟空》与今年火爆的动画电影《哪吒之魔童闹海》,均体现出大市场的需求优势对于产业创新的重要性。
另一方面要更多重视人才激励问题。与大规模生产不同,融合发展面临着技术路径、商业模式等多方面不确定性,需要不同类型、不同风格、不同偏好的研发人员乃至企业家等人才进行多样化探索。这意味着对于人才的激励无法由特定创新主体单独完成,而是有赖于生产关系高度多样化的创新生态。在DeepSeek引发的创新模式讨论中,也有为什么不是大型科技企业的疑问。
在科研人员数量、科研投入规模以及知识产权积累等量化指标衡量的创新能力方面,大企业具有显著优势。但庞大的资源基础也造成大企业内部交易成本高,导致其内部研究擅长于提升产品质量、巩固市场地位等方面实现渐进式创新,但往往开展颠覆式创新的活力不足。小企业没有在位优势带来的束缚,“船小好调头”,内部交易成本较小,更有动力从事颠覆式创新活动。
我们不应把大企业存在的局限性,扩大为对大型科技企业在创新中重要地位的否定。因为渐进式创新是创新发展中不可或缺的一环,甚至可以说创新发展是少数颠覆式创新与众多渐进式创新共同推动的。以DeepSeek为例,算法上取得的显著进展显示出小企业的生产关系优势;但频现的服务器资源紧张问题,也暴露出小企业在生产力方面的短板。从OpenAI与微软的合作来看,CVC(企业背景风投)是有望实现大企业生产力与小企业生产关系优势互补的可选方式。同时,大企业在创新人才培育方面有重要作用。作为一个大国,中国有丰富的人才等生产力要素,从人才培育到人才利用,需要公共投入与制度设计等多方面的努力,知识产权保护与个人破产制度尤为重要。知识产权保护能够为创新者提供更充分的物质激励,个人破产制度则有助于解除创业者的后顾之忧,提升各类人才的创新创业积极性。
创新发展:从金融科技到科技金融
近期社会各界关于DeepSeek的讨论也有关于金融与科技关系的反思。作为DeepSeek开发者的幻方,本身是金融领域的公司,而且在类型上属于过去一段时间因为盈利可观而受到一些争议的量化基金。事实上,如果没有量化基金业务成功运营积累的财富,难以想象幻方有能力给予具有吸引力的报酬以招募人才。但有意思的是,在有关DeepSeek的主流讨论中,似乎幻方作为金融领域公司身份被有意无意的忽视了,或者说没有那么受重视。这或许反映出有关金融与科技关系的一些认知偏差。例如,一种颇为流行的看法是只有实体企业才是科技创新的主体,金融机构在科技金融中的角色主要是给这些实体企业融资,而不应该与实体企业竞争人才。
问题是,如果科技金融的内涵可以简单化为将金融资源分配给科技企业,那么最有效的科技金融方式应该是要求银行给科技企业尽可能多的发放贷款,这意味着创新能力最强的国家或许是银行主导的日本或者德国。甚至可以说不需要金融的方式,直接通过财政将资源配置给科技企业,这意味着创新能力最强的国家应该是财政主导的前苏联。但事实上,无论是财政主导的前苏联,还是银行主导的日本与德国,在创新能力方面均逊色于资本市场主导的美国。资本市场是上市公司、投资机构,证券公司、法律事务所、会计事务所、审计机构等中介机构,监管部门乃至媒体记者、自媒体等分工协作的结果。只有大国的资本市场才能容纳数量、种类足够多的参与者,进而通过实现外部规模经济效应来支持创新生态。这样一种具有外部规模经济特点的金融模式,与高度多样化的创新生态更为契合。
作为资本市场实现外部规模经济的一份子,这一次在AI大模型方面实现突破的为什么是幻方,而不是其他的资本市场参与者?这是偶然事件,还是有一定的内在必然性?这涉及科技金融与金融科技的互动关系。由于种种原因,过去一段时间各界在强调科技金融的同时,对于金融科技不够重视,存在一些疑虑甚至是负面看法。与科技金融通常是强调金融在供给侧促进创新的作用不同,作为科技手段在金融领域的应用,金融科技展示了金融在需求侧对于创新的推动作用。以幻方为例,量化基金的业务特点即是金融与科技的结合,或者说量化基金是科技工具在金融领域的一个重要应用场景。AI大模型的算力、数据等要素与算法技术,也是量化基金重要的竞争力所在。
更一般地看,与电力、内燃机等以往的技术进步不同,以数字技术、人工智能为代表的这一轮信息技术革命,能够天然地与金融实现更紧密的联系。现代金融体系是构建在信息技术基础上的,金融活动尤其是资本市场的关键是要解决信息不对称问题,由此金融领域的一些创新本就是数字等信息科技创新的一部分。但金融科技作为新兴科技手段在金融领域的应用,与基于原有技术手段构建的监管框架之间的关系如何协调,是有待探讨的问题。以量化基金为例,市场下跌时期的超额收益容易引发舆情风险。
但考虑到其作为科技应用场景的意义,重点似乎应当主要放在是否存在操纵市场的欺诈等不当行为方面,而不是针对超额收益本身。由此延伸到近期金融科技新的动向,例如比特币等加密资产。这些金融活动存在被欺诈、洗钱等违法违规活动利用的风险,但也是区块链乃至先进算力等软硬件技术的重要应用场景。如何在保护消费者权益、经济金融稳定,与包容金融活动的动物精神之间平衡,是发挥金融科技积极作用的关键。
(作者为中金公司首席经济学家;内容有删节)
责任编辑:刘锦平主编:程凯