OpenAI劲敌Anthropic发布经济指数报告,年薪超6万美元用户使用最频繁
11 小时前 / 阅读约9分钟
来源:36kr
Anthropic报告AI在职业任务中多数用于增强而非自动化。

2月11日消息,OpenAI竞争对手Anthropic发布了首份《经济指数》报告,他们对大约400万次与Claude的对话进行分析,具体涵盖了Claude.ai上的初级用户和Pro用户的对话,并根据职业任务对这些对话进行分类,提供了关于企业和专业人士如何将AI融入工作的细节。

过往的AI工作影响分析多来自于社会学问卷调查或经济模型分析。这是首次有公司结合AI软件内部使用情况,对AI经济影响的分析尝试。能让我们从内部视角一窥究竟。

Anthropic首份经济指数报告的主要发现:

——在各类任务中,57%的使用表明AI被用于执行“增强”任务,即AI与人类协作,提升人类能力;而43%被用于执行“自动化”任务,即AI直接执行任务。

——当前,AI的使用主要集中在软件开发和技术写作任务中。超过三分之一的职业(约36%)至少在四分之一的相关工作中使用AI,约4%的职业更是在四分之三的相关工作中使用AI。

——AI在计算机程序员和数据科学家等中高薪职业中使用更为普遍,但在最低薪和最高薪职位中,AI的使用率都较低。这可能反映了当前AI能力的局限性,也反映了使用该技术的实际障碍。

以下是Anthropic报告中发现的详细内容:

图注:以上数据源自与Claude.ai的实际对话,展示了AI在不同任务、职业和类别中的使用情况

  • 劳动市场中AI使用情况

我们的报告基于技术对劳动市场影响的长期研究,探讨了从工业革命时期的纺纱机到现今汽车制造机器人等技术对劳动市场的持续影响。我们重点关注AI的长期影响,且更侧重于通过直接数据展示AI在劳动市场中的实际应用,而非试图预测未来。

  • 分析职业任务

我们的研究始于经济学文献中的一个重要观点:有时,将研究重点放在具体的工作任务上,而非整体职业本身,可能会更具意义。这是因为,许多工作在任务和技能上有一定的重合。例如,视觉模式识别这一任务是设计师、摄影师、安全筛查员和放射科医生等多个职业共同执行的任务。

某些任务比其他任务更适合通过新技术进行自动化或增强。因此,我们预计,AI会根据不同职业中的不同任务,有选择性地被应用。

分析这些任务(而非整个职业)将有助于我们更全面地了解AI如何在经济中被整合与运用。

  • 使用Clio系统将AI使用与任务匹配

本次研究依赖于Clio系统(Anthropic推出的Claude使用分析系统,全称Claude Insights and Observations),它可以在保证用户隐私的前提下,分析与Claude的对话数据。

我们使用Clio对大约100万次与Claude的对话进行分析,具体涵盖了Claude.ai上的初级用户和Pro用户的对话,并根据职业任务对这些对话进行分类。

我们所采用的任务分类标准来源于美国劳工部所维护的职业信息网络(O*NET)数据库,该数据库包含了约2万个与工作相关的具体任务。

Clio将每次对话与O*NET中最能代表AI在对话中作用的任务进行匹配。然后,我们依据O*NET的分类方法,将这些任务归入相应的职业,并根据这些职业的特征,进一步将它们归入诸如教育与图书馆、商业与金融等大类中。

图注:这张图展示了用户如何与Claude进行交流,并揭示了这些对话是如何与特定任务和职业相关联的

结论

1. AI在不同职业类型中的使用情况:使用AI最多的工作是计算机和数学”

在我们的数据集中,AI使用最为广泛的任务和职业主要集中在“计算机和数学”类别,该类别大部分涵盖了与软件工程相关的职位。

与Claude的对话中,37.2%的对话属于这一类别,涉及的任务包括软件改进、代码调试和网络故障排查等。

排名第二的类别是“艺术、设计、体育、娱乐和媒体”(占10.3%的对话),这些对话主要反映了人们在各种写作和编辑任务中使用Claude的情况。然而,涉及大量体力劳动的职业类别,如“农业、渔业和林业”类别(仅占0.1%的对话),在我们的数据中所占比例最小。

我们还将数据中的AI使用率与每个职业在劳动市场中的出现频率进行了对比。比较结果如下图所示:

图注:这张图直观地对比了AI使用频率与劳动市场代表性之间的差异

2.职业任务中的AI使用深度:4%的用户,超过75%的工作都由AI完成;大约11%的职位在至少50%的任务中使用了AI。

图注:只有极少职业在其大部分相关任务中使用了AI

我们的分析发现,极少有职业在其大部分相关任务中都使用AI:只有大约4%的职位在至少75%的任务中使用了AI。

然而,AI的中度使用则更为普遍:约36%的职位在至少25%的任务中使用了AI。

正如我们所预料的那样,尽管这个数据集中并没有显示工作被完全自动化的证据,但AI在经济中的众多任务中都得到了应用,并且在某些任务中发挥了关键作用。

AI使用与薪资关系:程序员等年薪中位数在6万美元以上的的职业使用最为频繁

O*NET数据库提供了每个职业的美国中位数工资。我们将这些数据纳入了分析,以便比较不同职业的中位数薪资与其相关任务中AI的使用情况。

有趣的是,低薪和高薪职位的AI使用率都普遍较低,这些职位通常需要较多的手工操作,如洗发师和产科医生。

而在中高薪资范围(年薪中位数在6万美元以上)内的特定职业,例如计算机程序员和文案编辑,通常是我们数据中AI使用最为频繁的职业。

图注:这张散点图展示了各职业的中位数年薪与AI使用率之间的关系

4. 自动化与增强任务:57%的应用场景为“增强”任务

我们还对任务的执行方式进行了更深入的研究——特别是哪些任务属于“自动化”任务(AI直接执行任务,如格式化文档),而哪些属于“增强”任务(AI与用户协作完成任务)。

总体而言,我们发现AI更倾向于被用于执行增强任务,57%的任务属于增强任务,而43%的任务属于自动化任务。

也就是说,在大多数情况下,AI并不是用来完全取代人类执行任务,而是与人类合作,执行诸如验证(核对用户的工作)、学习(帮助用户获取新知识和技能)和任务迭代(帮助用户进行头脑风暴或执行重复性生成任务)等任务。

图注:这张图比较了Claude对话中增强任务(57.4%)与自动化任务(42.6%)的比例

研究局限性:无法确认对话结果实际应用,未覆盖全量用户

我们的研究为AI如何改变劳动市场提供了独特的视角,但和所有研究一样,它也存在一些局限性,具体包括以下几点:

1.我们无法确定使用Claude进行某项任务的人是否是在工作。例如,有人可能请求Claude提供写作或编辑建议,这可能是他们在工作中的需求,也可能是他们在写小说等个人兴趣活动中提出的请求。

2.我们无法知道用户是如何使用Claude提供的回应的。举例来说,用户是否将代码片段复制粘贴?他们是进行事实核对还是直接接受回答?一些看似自动化的任务,实际上可能是增强型任务。例如,用户可能要求Claude为他们写一份完整的备忘录(被视作自动化任务),但随后他们自己对其进行编辑(属于增强任务)。

3.我们只分析了Claude.ai的初级用户和Pro用户的数据,而没有涵盖API、Team或Enterprise用户的使用情况。虽然Claude.ai的数据中包含了一些非工作相关的对话,但我们通过一种语言模型对数据进行了过滤,只保留与职业任务相关的对话,从而减轻了这一问题。

4.由于任务种类繁多,Clio系统在分类过程中可能会出现误差。

5.Claude无法生成图像(除非通过代码间接生成),因此一些创意类的任务在数据中没有被记录。

6.由于Claude被宣传为顶级编程模型,我们可能会看到编程相关任务在使用案例中占据较高比例。因此,我们不认为现有数据集能够完全代表AI在其他领域的使用情况。

未来研究方向:为人类提供工作自动化场景参考

AI的使用正在迅速扩展,且模型变得越来越强大。劳动市场的情况可能在相对较短的时间内发生显著变化。

因此,我们计划定期重复上述分析,以帮助追踪社会和经济可能出现的变化。作为Anthropic经济指数的一部分,我们将定期发布分析结果及相关数据集。

这种纵向分析能够为我们提供AI与劳动市场之间关系的深入洞察。例如,我们将能够监测AI在不同职业中的使用深度变化。

如果AI仍然仅用于特定任务,并且只有少数职业在大部分任务中使用AI,那么未来的工作形态可能更多是当前职业的演变,而非完全消失。

我们还可以跟踪自动化与增强任务的比例变化,从而为我们提供自动化逐步普及的场景参考。

我们的研究提供了关于AI使用的数据,但并未提出具体的政策建议。关于如何为AI对劳动市场的影响做好准备这一问题,单纯依赖独立研究并无法得出完整答案。

此外,解决这些问题的答案应当结合多方面的证据、价值观和经验。我们期待通过采用新的研究方法,进一步深入探讨这些问题。