●钟时
我们可以将“词元”作为观察和分析智能时代知识参与经济活动的一个基础性的、工作性的概念工具。这一定位需要明确的是,它是一个在现实约束下、便于操作的近似工具,而非一把完美无缺的万能标尺。正如国内生产总值(GDP)是衡量经济总量的一个有力但并非完美(例如它不计量家庭劳动、环境影响)的工具一样,词元是我们理解知识参与经济活动的一个关键性切入点和测量基准。
将词元确立为一个分析单位,主要基于其三大实践优势。首先,它可测量,具有坚实的现实数据基础。每一次对大模型的调用,其输入的提示(即prompt,技术上解释是调用大模型的时候给大模型提出的要求,通俗讲就是调用大模型的时候告诉大模型要干什么)和获得的输出,都可以被转化为具体的词元数量。这与传统经济学中许多关于“知识”“创新”的模糊变量不同,词元数据是机器运行过程中自然产生的、客观的记录,为实证研究提供了前所未有的、高频率、细颗粒度的数据来源。其次,它可加总,具备宏观分析的潜力。个人的搜索、程序员的代码辅助、企业的智能客服,这些分散的经济活动所消耗的词元,理论上都可以在产业、区域乃至国家层面进行汇总,从而形成“知识流量”的宏观指标,让我们有可能绘制出一张国民经济中“知识要素”流动的动态图谱。最后,它可建模,能与现有经济理论框架衔接。经济学家可以尝试将“词元”作为一个新的生产要素变量(例如用T表示),引入从企业生产函数到宏观经济增长模型的分析框架中。这使得我们可以用量化的方式,去追问一些此前只能定性讨论的问题,例如:知识投入的边际产出是多少,它对传统劳动有何替代或互补效应,这对经济增长的长期路径将产生何种影响。
然而,我们必须清醒认识这一工具的核心局限。词元主要测量的是知识“调用”的规模与流量,而非其质量与价值。一万个词元,可能被用来生成一份结构严谨但内容平常的市场报告,也可能在一位科学家的关键性深思中,辅助催生了一个改变行业范式的突破性猜想。两者的“词元成本”或许相近,但其经济价值却有天壤之别。词元计数无法直接区分知识的深度、新颖度与应用效能。这就像一个电表能精确记录消耗了多少“千瓦时”的电能,但它无法告诉你这些电能是用于点亮一盏灯,还是驱动一台进行尖端药物研发的超级计算机。因此,词元是一个关于知识“经济能耗”的指标,而非直接的价值创造指标。我们不能过度聚焦于词元数量,可能会有“见量不见质”的风险,甚至可能激励出以刷词元流量为目的的无效知识生产。这是我们使用这一工具时必须警惕的。
尽管存在局限,但综合来看,词元为我们理解知识参与经济活动打开了一扇宝贵的、可操作的观测窗口,其价值是奠基性的。人工智能带来的三重突破,共同指向一个核心结论,即在智能时代,知识作为一种生产要素,其根本经济属性正在发生历史性变化。它因大模型而变得更像是可被直接调用的生产资料,因词元而变得可计量,因社会化的智慧集成而使其固有的社会性空前凸显。这三个特性——可直接用作生产资料、具有可计量性、生产使用社会化显现——构成了“词元经济学”研究的三个理论基石。
将“词元”作为一个基础的分析单位提出,意味着我们为研究智能时代的经济学找到了一个新的起点。我们不能说,通过词元就完全破解了知识参与经济活动的全部奥秘。知识中那些最精妙的灵感、最具突破性的创造,其过程可能永远带着一层神秘面纱。但人工智能的发展,确实为我们提供了一套前所未有的观测工具,让我们第一次能够对知识参与经济活动进行系统性的测量和分析。词元,就是这套工具中一把已经在实践中占有主导性的尺子。(据《中国经济时报》)