越来越多的人开始思考: 人工智能(AI)的真正经济价值是什么?
包括 Sam Altman(OpenAI)、Dario Amodei(Anthropic)和 Demis Hassabis(Google DeepMind)等在内的 头部大模型公司首席执行官们认为:AI 的经济价值主要体现在实现研发(R&D)自动化方面 。
具备强大数据分析能力、模式识别和预测能力的 AI,似乎是进行 R&D 的最佳选择。例如,在药物 R&D 领域,AI 能够通过分析大量的生物数据,筛选出有潜力的药物靶点,显著缩短 R&D 周期,提高 R&D 效率。
然而,来自 Epoch AI(专注于预测 AI 未来发展的非营利研究机构)的研究员 Ege Erdil 和 Matthew Barnett 却在一篇长文中反驳了上述观点 。
他们认为, AI 的经济价值主要源于广泛自动化而非 R&D ,并从多个方面进行了论证,主要观点如下:
学术头条在不改变原文大意的情况下,对整体内容做了精编,如下:
业内很多有影响力的人认为,AI 对经济的影响将通过「R&D 的 AI 自动化」来实现:
总体而言,尽管没有任何严谨的经济论证支持,这种观点却出人意料地产生了巨大的影响力。我们将在这篇文章中论证,这种观点也很可能是错误的。
R&D 的经济价值通常并不像人们认为的那么高。 提高生产力和发展新技术对于长期经济增长固然至关重要,但明确的 R&D 投入对这些进程的贡献比人们普遍认为的要小。此外,即使这种贡献大部分也是外部性的,并不体现在 R&D 公司的利润中,这从一开始便降低了部署系统进行 R&D 的积极性。这种组合意味着, 大多数 AI 系统实际上将部署在与 R&D 无关的任务中,并从中赚取收入,而且总体而言,这些任务在经济价值上也更高。
而且, R&D 工作的自动化也比想象中要难得多 ,因为研究人员工作中的大多数任务都不是“推理任务”,而是在很大程度上依赖于代理(agency)、多模态和长上下文一致性等能力。一旦 AI 的能力已经达到研究人员工作可以完全自动化的程度,那么经济中其他大多数工作的自动化也将是可行的。
综合以上两点,我们没有理由期待 AI 的大部分经济价值在未来任何时候都来自 R&D。一种更可信的情况是, AI 的价值将由广泛的经济部署所驱动 。虽然我们应该预期,由于规模回报的增加,这将导致生产力和人均产量的增加,但这种增加的大部分很可能并非来自明确的 R&D。
接下来,我们想要区分两个相关但稍有不同的主张,一个我们同意,另一个我们不同意:
要理解我们质疑第二种说法的论点,必须首先衡量 R&D 的实际经济价值。 R&D 的经济价值主要是通过提高生产率来实现的 ,因此,为了量化 R&D 的影响,我们可以问一下,过去劳动生产率的增长有多少是由 R&D 支出及其相关的溢出效应造成的。据美国劳工统计局估计,从 1988 年到 2022 年,由私营企业资助的 R&D 支出仅占美国全要素生产率(TFP)增长的 0.2%/年左右,而同期全要素生产率的增长约为 0.8%/年,劳动生产率的增长约为 1.9%/年。
虽然公共 R&D 支出仅占美国经济 R&D 支出总额的四分之一左右,但我们也可以预期它将产生更大的正外部效应,Fieldhouse 和 Mertens(2023)估计这两种效应大致相抵:公共 R&D 平均对美国全要素生产率的增长做出了四分之一的贡献,因此 R&D 对美国全要素生产率增长的总贡献率约为 0.4%/年,即占总量的一半。这意味着自 1988 年以来,美国劳动生产率的增长只有 20% 是由 R&D 支出推动的。
在此期间,资本深化(Capital deepening)约占劳动生产率增长的一半,而在剩余部分中,大部分是由其他生产率来源解释的,如更好的管理、从做中学、知识传播等。 R&D 所能解释的剩余部分相对于整个“增长蛋糕”的规模来说贡献较小,甚至大部分 R&D 可能需要研究人员以外的其他投入 ,如技术设备和实验室设施。
图|1988 年以后美国实际 GDP 增长率和劳动生产增长率,其中劳动生产率的增长只有 20% 来自 R&D。
我们对私人 R&D 对全要素生产率增长贡献的估计,也大致反映经济对 R&D 投资与资本积累投资的实际分配情况,至少在我们假设许多其他推动 TFP 增长的因素难以直接投资,而且 R&D 和资本形成在任何时候都面临同样急剧的收益递减。由于资本深化占生产率增长的 50%,而私人 R&D 占 10%,我们可以预期资本投资大约是 R&D 投资的 5 倍,事实证明这种直觉是正确的:美国的资本投资总额约为 500 万美元/年,私人 R&D 投资总额约为 100 万美元/年。
那么,如果 R&D 相对来说占比很小,我们究竟应该在哪里部署我们的 AI 系统,以加快增长速度呢? 最明显的渠道是广泛实现人类劳动自动化 ,因为在美国经济中,产出的劳动弹性约为 0.6,这可能超过“R&D 产出弹性”(R&D elasticity of output)约 5 倍。此外,我们在广泛应用劳动力方面的支出是用于明确 R&D 的劳动力支出的 20 倍左右。这个道理很简单:如果你想产生最大的经济价值,你就应该把当前经济中最赚钱的东西自动化,这就使劳动力成为一个显而易见的重点目标。由此产生的规模巨大的经济体可以将其产出再投资于资本,并通过正规 R&D 以外的许多其他渠道(如从做中学)加快全要素生产率的增长。从总体上看,我们有充分的理由相信,这将带来规模回报的增加,从而加速经济增长,其速度可能比现在快 10 倍或更多。
对这一观点的反驳是, 数据低估了 R&D 对经济增长的影响 ,而 R&D 支出相对于资本投资的低水平是由 R&D 中巨大的正外部性和更强的“踩脚效应”效应共同造成的。这些论点并非不可信,但从数量上看,当全要素生产率因许多其他原因而在空间和时间上发生变化时,似乎很难说 R&D 本身就能解释全要素生产率的大部分增长。此外,即使我们效仿 Bloom 等人(2020)等有影响力的论文,毫无根据地假设全要素生产率(TFP)增长完全由 R&D 投入驱动,他们的参数估计也意味着 R&D 支出对产出的弹性约为 0.3,约等于资本,仅为劳动力的一半。
总之, 目前绝大多数经济增长并非来自 R&D ,我们需要一个令人信服的理由,才能相信 AI 将扭转这一格局。有两个理由经常被提起:R&D 对 AI 特别重要,因为 AI 系统有可能实现自身 R&D 的自动化;一般来说,R&D 任务对 AI 来说会更容易,因此会比其他经济领域更早实现自动化。我们认为这两个理由都缺乏说服力。
虽然 R&D 的广泛经济价值并没有我们预期的那么大,但对于 AI 技术而言,仍有一个特定的理由让我们相信自动化 R&D 可能会产生“主导效应”。如果 AI 系统能够实现自身软件 R&D 过程的自动化,那么“纯软件奇点”就有可能出现:在固定的计算资源上,我们可以运行 AI 程序,让其寻找改进自己算法的方法,这将使我们能够运行更多的虚拟研究人员,以取得更多的软件进步,等等。
这种反馈循环是否可行, 关键取决于我们在提高软件效率的过程中,“想法越来越难找”的速度有多快。 在之前的工作中,我们已经对多个软件领域的这种效应的大小进行了定量估算,并得出结论:如果研究人员的努力是 R&D 的唯一投入,那么“纯软件的奇点”可能会出现,也可能不会出现。然而,一个关键假设——即仅凭研究人员的努力就能实现软件 R&D 的多个数量级进步——是整个论证的基础,但这一假设很可能并不成立。
一个更可信的模型是,研究进展既需要认知努力,也需要数据,而这两种投入之间存在一定程度的互补性。支持这一观点的另一个事实是,在各种软件领域中,AI 既是实验计算扩展最快的领域,也是软件进步速度最快的领域,目前两者的年增长率都在 3-4 倍左右。这种巧 合表明,使用实验计算生成数据至少对软件的进步很重要,尽管我们无法仅凭这 一点来判断它在多大程度上是研究人员工作的补充投入。
如果这两种投入确实是互补的,那么任何软件驱动的加速都只能持续到我们在计算方面遇到瓶颈,最终不得不去做获取更多 GPU 的物理工作,以便运行更多实验。当然,AI 也可以加快这一进程,但前提是它必须广泛应用于整个半导体供应链,甚至可能更广泛地应用于经济领域,为这一行业提供所需的其他投入。
“纯软件奇点”能持续多少数量级,才能阻止瓶颈的出现,这在很大程度上取决于 AI R&D 中实验与洞察力之间的互补性,遗憾的是,我们对这一关键参数还没有很好的估计。然而,在经济的其他领域,存在非对等互补性是很常见的,这也为我们评估 AI R&D 领域的情况提供了参考。仅举一例,Oberfield 和 Raval(2014)估计,美国制造业中劳动力与资本之间的替代弹性为 0.7,这已经足以让任何“纯软件奇点 ”在效率提高不到一个数量级后消失。
支持 R&D 过程中存在瓶颈的另一个证据是 ,我们已经将 R&D 过程中的重要部分自动化, 但并未发现科学进步有任何显著加速 。例如,我们已经不断地将大多数 R&D 所需的编程工作自动化,首先是通过开发专门的库,最近是通过使用 LLM 驱动的工具来加速编码;随着时间的推移,我们还发明了许多种节省体力劳动的研究设备。然而,这一切都没有带来 R&D 进步的爆炸式增长:相反,其收益相当微薄,这与 R&D 任务之间具有相当强的互补性的情况是一致的。这并不能直接告诉我们整个 R&D 工作与实验之间的互补性,但这是另一个应该纳入我们先前考虑的证据。
所有这些证据的质量都不高,这意味着我们不能排除 AI R&D 可能是经济中一个不寻常的部分,在这个部分中,关键投入之间的替代弹性等于或大于 1,这将确保互补性足够弱,使得奇点在原则上成为可能。然而,通过与我们掌握数据的其他情况进行比较,我们应该对任何此类预测持谨慎态度。默认情况下,仅软件或偏向软件的奇点应被视为不太可能的结果,而不是可能出现的结果。
乍一看,科学家的工作似乎非常依赖抽象推理——产生想法、提出假设、分析数据、编码和数学推理。 如果这是真的,那就表明在不久的将来,科学家将是最有可能被推理模型取代的工作之一。 这是因为,这些任务正是目前的推理模型最容易实现自动化的任务类型。
在这样的世界里,AI 将大大加快 R&D 速度,然后才会在整个经济中广泛部署,取代零售工人、房地产经纪人或 IT 专业人员等更常见的工作。简而言之,AI 将“首先实现科学自动化,然后实现其他一切自动化”。
但这种设想很可能是错误的。 实际上,大多数 R&D 工作需要的远不止抽象推理技能。 以医学科学家为例进行说明。下面是一份与医学科学家相关的工作任务列表,摘自 O*NET 职业调查,按对该职业的重要性进行了排序。我们根据“是否普遍认为只需抽象推理技能就能完成每项任务”,对其进行了标注——在这里,这意味着它需要纯粹的语言、逻辑或数学能力,包括撰写报告、编码或证明定理。
我们认为,在这 14 项任务中,只有 6 项需要单独使用抽象推理才能完成。令人吃惊的是,在医学科学家最重要的 5 项任务中,我们只将其中一项归类为完全依赖抽象推理。总体而言,工作中最关键的方面似乎需要动手操作的技术技能、与他人的精准协作、专业设备的使用、长上下文能力以及复杂的多模态理解能力。
这种模式也适用于其他常见的研究职业。为了证明这一点,我们使用 GPT-4.5 将 12 种常见 R&D 职业中的任务分为 3 类,即是否只需要抽象推理技能就能完成任务、是否需要复杂的 computer-use 技能(但不需要亲临现场)、是否需要亲临现场才能完成任务。
图|12 种常见 R&D 职业执行任务的需求。
这一情节揭示了科学研究的本质。 与研究主要是一项抽象推理任务的假设相反,现实中的研究大多涉及物理操作和高级代理。要实现 R&D 工作的完全自动化,AI 系统可能需要具备自主操作计算机图形用户界面(GUI)的能力、与人类团队有效协调的能力、在长时间内完成高度复杂项目的强大执行能力,以及操控物理环境进行实验的能力。
然而,当 AI 达到以较高能力全面执行这些不同技能所需的水平时,很可能一大批常规工作已经实现了自动化。这与 AI 将“首先实现科学自动化,然后实现其他一切自动化”的说法相矛盾。相反,一个更合理的预测是, AI 自动化在达到全面接管 R&D 工作所需的水平之前,将首先在各行各业中实现大部分普通劳动力的自动化。
我们不应该期待 AI 革命从科学突破开始,然后再进入其他领域, 而是应该预计在初期阶段,自动化将首先接管大部分传统工作,只有当 AI 掌握了现实世界中杂乱而复杂的工作需求后,科学和技术才会大幅加速发展。
即使在 AI 完全接管 R&D 工作之后,我们也可以合理地预期,AI 将主要通过非 R&D 任务的大规模自动化来加速科学技术的发展,而不是直接取代 R&D 研究人员。考虑到如前所述,明确的 R&D 目前只占整体经济增长的一小部分,这种预期是合理的。
综上所述,上述论点表明 ,即使在 AI 开始产生变革性的经济或技术影响之前,其影响也很可能比许多关于 AI 飞速发展的报道所描述的要更加广泛和显著。 所谓“广泛”,我们指的是 AI 驱动的自动化将广泛出现并改变经济的大部分,而不是狭隘地局限于 R&D 职业。所谓“显著”, 它的影响对大多数人来说都是显而易见的,并且具有高度的破坏性——例如,它将大规模地取代劳动力。
此外,即使在 AI 开始对世界产生变革性影响之后,前面的论点也表明,显性 R&D 的自动化在这些影响中只会起到次要作用。相反, 这些影响将主要由整个经济中更广泛的自动化来支撑。
我们认为,与其想象未来几年 AI 的飞速发展将以 “数据中心中的天才之国” 的形式进行 R&D 工作,不如想象以下另一种景象:
未来几年,AI 的进步将继续逐步扩大 AI 能够执行的任务集。这种进步将 主要通过扩展计算基础设施来实现 ,而不是纯粹的依赖认知 AI R&D 工作。
因此,AI 将被广泛应用于整个经济领域,使越来越多的劳动任务实现自动化,最终将大大加速经济增长。
在 AI 对世界产生变革性影响之前——即在经济、医疗或其他技术领域引发爆炸性进步之前,已经出现了一系列极具破坏性的自动化浪潮,从根本上重塑了全球劳动力市场和公众对 AI 的看法。
在每一个时间点上,包括在 AI 能够显著地加速经济、医疗或技术进步的时间点之后,AI 加速这些变量的主要渠道都将是大规模自动化而非 R&D 任务。
有人可能会把这种情况称为“通用自动化爆炸”(general automation explosion),以强调支持加速的关键力量是 AI 自动化的广度和规模,而不是来自 AI 擅长的任何具体事物。不过,我们承认,这个词不如 “智能爆炸”(intelligence explosion) 来得朗朗上口。
这一观点对我们如何从商业、政策和个人角度看待 AI 的未来具有重要影响。
首先,从商业角度来看,我们认为在可预见的未来, AI 实验室更应该把重点放在努力实现普通工作任务的自动化上 ,例如创建能够胜任浏览互联网、操作商业软件和执行标准白领工作任务的 computer-use agent,而不是专注于开发“诺贝尔奖获得者”级别的推理模型,从而能够为生物学和医学等领域的研究人员提供狭隘的帮助。我们还认为,与 AI 在 R&D 任务上的表现相比,这些普通能力可能更需要跟踪和基准测试。
其次,从政策角度来看,我们认为必须认识到,从现在到 AI 开始对世界产生变革性影响(如爆炸性经济增长或人类寿命延长方面的重大进展)这段时间内,公众对 AI 的看法可能会发生深刻转变。之所以会发生这种转变,是因为当 AI 发展到那个阶段时,社会已经经历了一系列颠覆性的自动化浪潮,大规模地取代了工人。因此,我们认为,假设在变革性 AI 出现之前或之后,公众对 AI 的看法将与现在大不相同。
第三,从个人角度来看,我们认为 值得规划和投资的未来是 AI 将在数年甚至数十年内逐步取代工作岗位 ,而不是在 AI 接管 AI R&D 流程后,人类劳动力一下子就被淘汰。我们认为,与其想象一个相对突然的事件,即 AI 通过递归式的 AI R&D 爆发出超级智能,不如预期经济向全面自动化的平稳过渡更有成效。
我们认为, AI 很可能会在一段较长的时期内,在某些任务上超越人类,但在其他互补任务上仍不如人类。 明确地说,我们承认 AI 最终将在几乎所有有经济价值的活动中超越人类,这将导致经济增长显著加速。不过,我们认为, 这可能要经过数年或数十年日益广泛和颠覆性的自动化之后才会发生 ——其影响将远远超出 R&D 领域。
原文链接: https://epoch.ai/gradient-updates/most-ai-value-will-come-from-broad-automation-not-from-r-d