日前,微软首席执行官 Satya Nadella 在参加由知名科技播客主持人 Dwarkesh Patel 主持的播客节目 Dwarkesh Podcast 时,谈到了他对当前人工智能(AI)/通用人工智能(AGI)的前景、量子计算的革命性进展,以及科技如何推动全球经济变革的看法。
当各家公司都在争先恐后地追逐 AGI 时,Nadella 在访谈中却语出惊人,“我们自己宣称达成某个 AGI 的里程碑,对我来说,那只是一些无意义的基准修改。真正的基准是:全球经济增长 10%。”
同时,他认为,法律与伦理基础设施(如责任归属、劳动价值重构)是部署强大 AI 系统的先决条件。
此外,他还预言, 未来人类将管理“智能体蜂群” ,通过 Copilot 等界面协调任务,而认知劳动的定义将随着技术迭代不断升级。
学术头条在不改变原文大意的情况下,对整体内容做了精编,如下:
Dwarkesh Patel:Satya,非常感谢你来参加我们的播客。
稍后我们将讨论微软近期取得的两项突破,恭喜你们,这两项成果同一天在《自然》杂志上发表:Majorana 芯片,就放在我们面前,还有 WHAM(世界和人类行动模型)。你描述了你在 80 年代和 90 年代看到的事情,现在它们又在重新发生。
Satya Nadella:对我来说感到兴奋的是……Dwarkesh,首先,非常高兴参与你的播客。我是你的忠实听众,我非常喜欢你做访谈的方式和你所探讨的广泛话题。
这让我有点想起我在 90 年代刚进入科技行业的前几年,当时人们就在争论到底是采用 RISC 还是 CISC,或者“嘿,我们真能用 x86 来构建服务器吗?”
当我加入微软时,那正是 Windows NT 诞生之初。因此,从核心芯片平台到操作系统,再到应用层——这种全栈方法——整个过程都在争论之中。
你可以说云计算领域也有类似的情况,显然分布式计算和云计算确实改变了客户端-服务器架构,网页也发生了巨大的变化。但这感觉似乎比我曾经参与过的更像是一个全栈。
Dwarkesh Patel:当你回顾上世纪 80 年代和 90 年代,想想哪些决策最终成为了长期赢家,哪些没有,特别是当你想到你曾在 Sun Microsystems 工作时,他们在上世纪 90 年代的互联网泡沫中经历了一段有趣的历程。人们常说数据中心的建设是一个泡沫,但与此同时,我们今天的互联网也是当时建设的结果。
那么,什么是经得起时间考验的经验教训?什么是固有的世俗趋势?哪些只是昙花一现?
Satya Nadella:回过头来看,我参与过四大变革中的客户端以及客户端-服务器。这就是图形用户界面(GPU)和 x86 架构的诞生,基本上让我们能够构建服务器。
我记得非常清楚,1991 年,我去参加 PDC(微软专业开发者大会),当时我还在 Sun Microsystems 工作。那一年,我去了 Moscone,那时候,微软首次描述了 Win32 接口,我当时就很清楚接下来会发生什么,服务器也会成为 x86 架构的东西。当某个东西具备规模优势时,那就是你必须做出的长期投资选择。在客户端发生的一切会在服务器端发生,然后你就能真正构建客户端-服务器应用程序。因此,应用模型变得清晰。
然后,互联网就是我们的重大挑战,我们必须在开始时就应对它。实际上,我一加入微软,网景浏览器(Netscape)或马赛克浏览器(Mosaic)就发布了,大概是在 1993 年 12 月或 11 月吧?应该是 Andreessen 和他的团队推出的。
从一个有趣的视角来看,这真是一个改变游戏规则的大事件,当时,我们正掀起客户端-服务器浪潮,而且很明显我们也将在这一浪潮中获胜。我们迎来了浏览器时代,因此我们必须做出调整。由于浏览器是一种全新的应用模式,我们的调整工作做得相当出色。
我们所做的一切都是为了全力拥抱那个时代,无论是在 Word 中使用 HTML,还是我们自己构建一个新的浏览器并为之竞争,抑或是在我们的服务器堆栈上构建一个 web 服务器。然而,不可否认的是,我们错过了网络上最大的商业模式,因为我们都认为网络的核心是分布式——谁能想到搜索会成为组织网络的最大赢家呢?显然我们没有看到这一点,而 Google 看到了,并且执行得相当出色。
所以,这就是我学到的一个教训:你不仅要把握好技术趋势,还必须了解这一趋势将在哪里创造价值。这些商业模式的转变可能比技术趋势的变化更难预测。
AI 行业不会“赢家通吃”
Dwarkesh Patel:人工智能的价值将在哪里创造?
Satya Nadella:这是一个很好的问题。我可以比较有信心地说两个地方。一是表现良好的超大规模运营商(Hyperscaler),因为从根本上讲,如果你回顾一下 Sam 和其他人的描述,如果智能是计算的对数,那么谁能进行大量计算,谁就是大赢家。
另一个有趣的地方是,如果你看一下任何 AI 工作负载的底层,就像拿 ChatGPT 来说,并不是每个人都对 GPU 方面的进展感到兴奋,虽然它很棒。事实上,我甚至把我的计算资源看作是 AI 加速器、存储和计算的比率。在规模上,你必须不断扩展它。
Dwarkesh Patel:是的。
Satya Nadella:所以,全球对这种基础设施的需求将会呈指数级增长。
Dwarkesh Patel:没错。
Satya Nadella:因此,事实上,拥有这些 AI 工作负载就像是天赐之物,因为你猜怎么着?他们对计算的需求更大,不仅是为了训练,也是为了测试时。想想看,一个 AI 智能体会以指数级的速度增加计算量,因为这不只是一个人调用一个程序,而是一个人调用的程序又会调用更多的程序。这将创造出巨大的计算基础设施需求和规模。因此,我们的超大规模业务,Azure 业务,以及其他超大规模公司,我认为这是一件大事。
之后,情况就变得有点模糊了。你可以说,嘿,有赢家通吃的模式,但我没发现。顺便说一下,这是我学到的另一件事:善于理解哪些市场是赢家通吃,哪些不是赢家通吃,某种意义上来说,这就是一切。我记得在我刚开始进入 Azure 时,亚马逊已经领先很多,人们会来找我,投资者也会找我说,“哦,结束了,你们永远无法赶上,亚马逊是赢家通吃。”
在与甲骨文和 IBM 在客户端-服务器领域竞争过后,我知道买家是不会容忍赢家通吃的。从结构上讲,超大规模公司永远不会是赢家通吃的,因为买家很聪明。
消费者市场有时可能是赢家通吃的,但只要买方是公司、企业、IT 部门,他们就会希望有多个供应商。所以,你得成为其中一个供应商。
我认为,这在模型方面也会发生。会有开源的存在,也会有一个“管制者”。就像在 Windows 上,我学到的一个重要教训是,如果你有一个闭源操作系统,那么一定会有一个与之互补的开源系统。
因此,在某种程度上,这就是对事态发展的真正制衡。我认为在模型方面,可能会有少数几个闭源的,但一定会有开源的替代方案,开源的替代方案实际上会确保闭源的赢家通吃被遏制。
这是我对模型方面的看法。顺便说一下,如果这些东西真的像人们说的那样强大,政府是不会坐视不管让私营公司到处……全世界都是如此。所以,我不认为它是赢家通吃的。
除此之外,我认为还是老一套,那就是在消费者市场,某些类别中,可能会有赢家通吃的网络效应。毕竟,ChatGPT 就是一个很好的例子。
它是一个规模化(at-scale)的消费产品,已经获得了真正的“逃逸速度”(escape velocity)。我去 App Store 看,它总是排在前五名,我就会想,“哇,真不可思议。”
所以,他们能够利用这个早期优势,把它转化为应用程序优势。在消费者市场上,这种情况可能发生。而在企业市场上,我认为不同的类别会有不同的赢家。至少我是这样分析的。
Dwarkesh Patel:我还有很多问题。我们一会儿要聊量子计算,但关于模型可能被商品化的观点:也许几年前就有人对云计算提出过类似的论点——从根本上说,它不过就是一块芯片和一个盒子。
但最终,当然,你和其他许多人找到了在云计算中获得惊人利润率的方法。你们找到了规模经济的途径,并增加了其他的价值。从根本上说,即使抛开行话不谈,如果你有了 AGI,并且它能帮助你创造更好的 AI ——现在是合成数据和强化学习(RL),也许未来是自动化的 AI 研究员——这似乎是巩固优势的一个好方法。我很好奇你对此怎么看,单纯是关于在这方面走在前面真的很重要的这个想法。
Satya Nadella:在规模上,没有什么是商品化的。关于云计算的观点,每个人都会说,“哦,云计算是商品。”除非,当你做到规模化……这就是为什么运营一个超大规模公司需要特定的技术和经验……你可以说,“哦,那有什么难的?我可以把服务器堆叠起来。”
Dwarkesh Patel:没错。
Satya Nadella:事实上,在超大规模计算的早期,大多数人认为“有这么多主机托管商,但那些不是什么好生意。超大规模计算真的是生意吗?它会有业务吗?”结果证明,超大规模计算是一个真实的生意,因为 Azure 拥有运行全球 60 多个地区所有计算的专门技术。这是很难复制的。
所以,我更想说的是,这是一个赢家吗?到底是不是赢家通吃?因为这一点必须搞清楚。我喜欢参加 TAM(总可用市场)的类别,这样就不会有赢家通吃的风险。最好的情况是,一个大市场能容纳几个赢家,而你就是其中之一。
这就是我所说的 hyperscale 层级。在模型层级,一个模型最终需要在一些 hyperscale 的计算平台上运行。所以,我觉得这种联系将永远存在。它不仅仅是模型;模型需要状态,这意味着它需要存储,还需要需要常规的计算资源来运行这些智能体和智能体环境。
因此,这就是为什么我认为一个人跑赢并建立一个完整的模型的极限可能不会发生的原因。
Dwarkesh Patel:关于 hyperscaler 计算平台,顺便说一下,作为一个 hyperscaler,你的优势也很有趣,特别是在推理时扩展方面,如果这涉及到未来模型的训练,你可以将数据中心和 GPU 的成本摊销,不仅用于训练,还可以再次用于推理。
我很好奇,你认为微软和 Azure 是何种类型的 hyperscaler。是侧重于预训练的部分?还是提供 o3 类的推理?还是你们只是提供托管和部署市场上的任何单一模型,对此保持中立?
Satya Nadella:这是个很好的问题。我们希望构建的计算平台在某种意义上是顺应摩尔定律(Moore's Law)的。我认为,这就像我们过去做的所有事情一样:每年不断刷新平台,按照这些设备的生命周期价值进行折旧,然后对机群进行非常好的布局,以便能高效地运行不同的任务。有时会有非常大的训练任务,需要配置高度集中的峰值计算能力,并且这些任务也需要相互协同。这很好。我们应该有足够的数据中心资源来满足这些需求。
但归根结底,这些都变得非常庞大,甚至在预训练规模的情况下,如果需要持续进行,预训练的规模有时也必须跨越数据中心的边界。这一切或多或少都存在。
那么,很好,一旦开始跨越预训练的数据中心边界,这和其他有什么不同呢?我考虑的方式是,嘿,分布式计算将保持分布式,所以要构建你的平台,使其准备好应对大规模训练任务,准备好进行测试时计算,甚至准备好——如果可能发生的强化学习最终实现了,你可以先建立一个大模型,然后进行大量的强化学习。对我来说,这就像是更多的训练计算,因为你想为不同的任务创造这些高度专业化、精炼的模型。
因此,你需要那样的计算平台,然后是服务需求。归根结底,光速就是光速,你不能在得克萨斯州建一个数据中心,然后说,“我要从这里为全世界提供服务。”
你必须在世界各地都有推理机群的基础上为全世界提供服务。这就是我对我们构建真正超大规模平台的理解。
哦,顺便说一下,我希望我的存储和计算也靠近这些所有的东西,因为不仅仅是 AI 加速器是无状态的。我的训练数据本身需要存储,然后我想能够多路复用多个训练任务,我想能有内存,我希望能有这些环境,在这些环境中,智能体可以去执行程序。这就是我的想法。
全球经济增长 10%
Dwarkesh Patel:你最近报告说,你们每年通过 AI 获得的收入是 130 亿美元。但如果你看看年增长率,按照这个趋势,四年后,你们的 AI 收入将是现在的 10 倍,达到 1300 亿美元。如果这一趋势继续下去,你预见到如何利用所有这些智能,如何实现这种工业规模的应用?
是通过 Office 吗?是你们为其他公司提供部署平台吗?要有 AGI,才能有 1300 亿美元的收入?那会是什么样子?
Satya Nadella:这是个很好的问题,因为从某种程度上来说, 如果我们真的会迎来这种爆炸性的、丰富的、可利用的智能商品,我们首先要观察的就是国内生产总值(GDP)的增长 。
在我谈微软的收入将是什么样子之前,所有一切的唯一制约因素有一个。我觉得, 我们在所有 AGI 的炒作中有些自夸 。记住,发达国家的经济增长率是 2%,如果调整通胀的话,可能是零增长。
所以,2025 年,当我们坐在这里时,我不是经济学家,但至少我能看出我们有一个真正的增长挑战。因此,首先我们必须做的是,当我们说这就像是工业革命时,让我们实现那种工业革命式的增长。
对我来说,那意味着 10%、7%,发达国家经过通胀调整后增长 5%。那才是真正的标杆。不能只是供应端的变化。
事实上,这就是问题所在,很多人在写这个,我很高兴他们写这些,真正的赢家不会是科技公司。赢家将是那些使用这种丰富的商品的广泛行业,顺便说一下,智能将变得丰富,突然间生产力上升,经济的增长速度加快。当这种情况发生时,我们这个行业就好起来了。
但对我来说,那才是关键时刻。 我们自己宣称达成某个 AGI 的里程碑,对我来说,那只是一些无意义的基准修改。真正的基准是:全球经济增长 10% 。
Dwarkesh Patel:好吧,如果全球经济增长 10%,假设世界经济总量是 10 万亿美元,那如果增长 10%,相当于每年多创造 10 万亿美元的价值。如果是这样,作为一个超大规模服务商...... 800 亿美元似乎太少了,但难道你们不应该做到 8000 亿美元吗?
如果你真的认为在几年内,全球经济能以这个速度增长,而关键瓶颈将是:你是否拥有足够的算力来部署这些 AI,完成所有这些工作?
Satya Nadella:没错。但顺便说一下,经典的供应方观点是,“嘿,让我建好了,他们就会来。”这是一个论点,毕竟我们也做过,我们敢冒足够的风险去做。
但在某个时候,供应和需求必须匹配。这就是为什么我同时关注这两个方面。你完全可能在炒作供应方时偏离轨道,而没有真正理解如何将其转化为对客户的实际价值。
这就是为什么我关注我的推理收入,也是为什么我会披露推理收入的原因之一...... 有趣的是,很多人并没有谈论他们的真实收入,但对我来说,这是理解它的一个重要标准。
你不能指望它们在任何给定时刻都对称匹配,但你需要有实际证明,证明你能够把昨天的“资本”转化为今天的需求,这样你才能再次投资,甚至可能以指数级的方式投资,知道你不会完全错配增长速度。
Dwarkesh Patel:我在想这两种观点是否存在矛盾,因为你做得很好的一件事就是提前下注。你在 2019 年就投资了 OpenAI,甚至是在 Copilot 和任何应用出现之前。
如果你看看工业革命,这些 6%、10% 的铁路建设和其他东西,其中很多都不是像 "我们已经从车票上获得了收入,现在我们要...... "
Satya Nadella:那时候确实有很多钱被浪费了。
Dwarkesh Patel:没错。那么,如果你真的认为这里有潜力将世界的增长率提高 10 倍或 5 倍,然后你可能会想,“那么,GPT-4 的收入是多少?”
如果你真的认为这是下一个层次的可能性,你难道不应该说“疯狂点,做数千亿美元的算力”吗?我觉得是有可能的,对吧?
Satya Nadella:有趣的事情就在这里,没错。这就是为什么我觉得对基础设施采取平衡的方法非常重要。问题不在于建造算力,而是在于建造那些不仅能帮助我训练下一个大模型,还能为下一个大模型提供服务的算力。只有做到这两点,你才有可能真正利用你的投资。
所以, 这不是单纯地在比谁能建造一个模型,而是在比谁能创造一种世界上正在使用的商品 ,推动……你必须有完整的思路,而不仅仅是关注某一件事。
顺便说一下,其中一个问题是,肯定会有过度建设。关于你提到的互联网泡沫时期的情况,大家都知道,现在你需要更多的能源,需要更多的算力。多亏了这一点,每个人都会加入这场竞赛。
实际上,不仅仅是公司在部署,国家也会投入资本,而且显然……我非常激动自己是一个领导者,因为,顺便提一下,我建造了很多,也租赁了很多。我很高兴看到我将在 2027 年、2028 年租赁大量的算力,因为我看到这些建设情况,我想,“这太棒了。”唯一会发生的事就是,所有算力的建设将导致价格下降。
智能的价格正在下降
Dwarkesh Patel:说到价格下降,你最近在 DeepSeek 模型发布后发了一条关于杰文斯悖论(Jevons Paradox)的推文。我很好奇你能否详细解释一下。杰文斯悖论发生在需求对某物的价格高度弹性时。智能是不是也受到价格下降的制约?
因为至少在我作为消费者的使用案例中,智能技术已经非常便宜了。每百万个 token 只要两美分。我真的需要它降到 0.02 美分吗?我只是在让它变得更智能方面遇到了瓶颈。如果你需要向我收取 100倍 的费用,那就做 100 倍更大的训练。我很乐意公司这么做。
但是也许你在企业端看到的是不同的情况。什么样的智能应用真的需要它降到每百万 token 0.002 美分?
Satya Nadella: 我认为真正的关键在于 token 的效用 。两者都需要发生:一是智能需要变得更好、更便宜。每当出现突破性进展,比如 DeepSeek 所做的那样,性能与每个 token 的效率前沿发生变化,曲线会弯曲,前沿也会移动。这就带来了更多的需求。这正是云计算所经历的。
有一个有趣的事情是:我们曾经以为“天哪,我们在客户端-服务器时代已经卖出了所有服务器”。但一旦我们开始把服务器放进云里,人们突然开始消费更多,因为他们可以以更便宜的价格购买,并且是弹性的,他们可以按使用量购买,而不是购买许可证,这完全扩展了服务器的消费范围。
比方说,我们去印度这样的国家,跟他们讲“这是 SQL Server”。我们卖得不多,但天哪,印度的云计算远远超过了我们在服务器时代所能做的。我认为这将会继续发生。
想想看,如果你真的想在全球南部、在发展中国家开展业务,如果这些 token 可以非常便宜地用于医疗保健,那将是史无前例的变革。
Dwarkesh Patel:我认为,如果有人听到像我这样在旧金山的人说“他们有点傻;他们不知道在现实世界中部署技术是什么样的”,这其实是很合理的。
作为一个与这些财富 500 强公司合作并帮助它们为数亿、数十亿人部署技术的人,你怎么看待这些功能的部署速度?
即便拥有了能够工作的智能体,甚至是能够为你远程工作的一些工具,考虑到所有合规问题和固有的瓶颈,这会是一个大的挑战吗,还是会很快解决?
Satya Nadella:这将是一个真正的挑战,因为真正的问题是变革管理或流程变革。这里有一个有趣的事情:我常用的一个类比是,想象一下,像我们这样的大型跨国公司,在没有个人电脑、电子邮件和电子表格的时代,是如何做预测的。传真到处都是。然后,有人拿到传真,做了一份部门间备忘录,然后到处传阅,人们输入数字,最后得出预测,也许正好赶上下一季度。
然后有人说,“嘿,我只要把 Excel 表格放到电子邮件里,发出去,让大家编辑一下,我就能得到预测。”所以,整个预测的业务流程发生了变化,因为工作成果和工作流程发生了变化。
这就是 AI 引入知识工作时需要发生的事情。事实上,当我们想到这些智能体时,根本的变化就是有了一种新的工作方式和流程。
比如说,在准备我们的播客时,我会去我的助手那里说,“嘿,我要和 Dwarkesh 讨论我们关于量子计算的公告以及我们为游戏生成所建立的新模型。给我一个我在谈话前应该阅读的内容摘要。” 它知道了那两篇《自然》杂志的论文,并且提取了相关信息。我甚至说,“嘿,给我做一个播客格式的总结。” 结果,它做得很不错,两个人像聊天一样讨论了这个话题。
所以这就成了—实际上,我还把它分享给了我的团队。我把它放进了 Pages,这是我们的工具,然后分享给了大家。所以我现在的工作流程是,我和我的同事一起使用AI来完成工作。
这就是对所有从事知识工作的人来说,根本性的变革管理,突然间大家开始弄清楚这些新的模式,“我如何用新的方式完成我的知识工作?” 这需要时间。这将会在销售、金融和供应链中发生。
对于现有公司来说,我认为这将是一件,让我们以我喜欢用的类比来说明,就像制造商做的精益生产方面所做的事情。我喜欢这个类比,因为,从某种意义上来说,精益生产成为了一种方法论,它可以让人们将制造的端到端流程变得更加高效。这是一种持续改进的过程, 减少浪费、增加价值 。
这也是知识的发展趋势。这就像是知识工作中的精益生产。这将是从事知识工作的管理团队和个人的艰苦工作,需要时间。
Dwarkesh Patel:我可以简短地问一下关于那个类比的问题吗?精益生产做的其中一件事是,物理上改变了工厂车间的面貌。它揭示了人们在真正关注流程和工作流程之前没有意识到的瓶颈。
你简要提到了你的工作流程——AI 改变了你的工作流程。我很好奇,随着 AI 智能体越来越智能,管理一个大公司会是什么样子?
Satya Nadella:你问得很有意思。我在想,举个例子,如果我的工作非常依赖电子邮件。我早上到达办公室,发现我的收件箱满了,我在回复邮件,所以我迫不及待地想让一些 Copilot 智能体自动填充我的草稿,这样我就可以开始审阅和发送了。
但我现在在 Copilot 里至少有十个智能体,我会根据不同的任务向它们提问。我觉得会有一个新的收件箱诞生,那就是 我与成千上万的智能体打交道,它们需要向我报告一些异常情况,发出通知,或者请求我的指示 。
因此,至少我现在想到的是,会有一个新的框架,那就是智能体管理器。它不仅仅是一个聊天界面。我需要一个比聊天界面更智能的工具来管理所有智能体及其对话。
这就是为什么我认为 Copilot 作为 AI 的用户界面非常重要。我们每个人都将拥有它。基本上,你可以把它看作:有知识工作,就有知识工作者。知识工作可能由许多智能体来完成,但你仍然有一个知识工作者在处理所有这些知识工作者。而我认为,这就是我们需要构建的界面。
量子突破
Dwarkesh Patel:你是世界上少数几个可以说拥有 20 万个以微软公司及其所有员工为形式的智慧蜂群的人。你需要管理它,你需要与之互动,如何最好地利用它。希望未来世界上更多的人也能够拥有这种体验。
我很好奇,如果所有人的收件箱像你一样,你的收件箱早晨会是什么样子的。
好吧,在我们深入讨论这个问题之前,我想继续问你一些关于AI的问题,我真的很想问你关于微软研究院宣布的量子领域的重大突破。你能解释一下这是怎么回事吗?
Satya Nadella:这是我们另外一段 30 年的旅程。简直难以置信。我是微软第三任 CEO,曾对量子计算充满热情。
这里的根本突破,或者说我们一直以来的愿景是,你需要一个物理学的突破,才能构建一个实用规模的量子计算机。我们认为,要想获得噪声更小或更可靠的量子比特,唯一的办法就是在物理特性上下注,因为从定义上讲,物理特性更可靠,而这就引领我们走向了马约拉纳零模式(Majorana zero mode),马约拉纳零模式是 20 世纪 30 年代就提出的理论。问题是,我们能否真的物理上制造出这些东西?我们真的能构建它们吗?
实际上,我知道你也跟 Chetan 聊过,真正的突破就是我们现在终于有了一个存在性证明和物理学突破,即在一种新的物质相中发现了马约拉纳零模式。这就是为什么我们喜欢将这一突破类比为量子计算的“晶体管时刻”,因为我们实际上拥有了一个新的阶段,即拓扑阶段(Topological phase),这意味着我们现在可以可靠地隐藏量子信息、测量它,并且可以制造它。现在,我们已经掌握了这种核心基础制造技术,我们可以开始制造马约拉纳芯片了。
这个“马约拉纳一号”(Majorana One),我认为它将基本上是第一个能够支持百万量子比特的物理芯片。然后基于它,可以实现数千个逻辑量子比特,经过纠错处理。到那时,真正的挑战就开始了。突然间拥有了构建一个真正的实用规模量子计算机的能力,对我来说,这现在变得更加可行了。没有像这样的突破,仍然能实现一些里程碑,但永远无法构建一个实用规模的计算机。这就是我们感到兴奋的原因。
Dwarkesh Patel:太惊人了。顺便说一句,我相信这就是它。
Satya Nadella:没错,这就是它。
Dwarkesh Patel:是的。
Satya Nadella:我现在有些忘了,我们是不是叫它马约拉纳?对,没错,就是马约拉纳一号。很高兴我们以这个名字来命名它。
想想看,我们竟然能在如此小的体积中构建出一个百万量子比特的量子计算机,真是难以置信。这就是问题的关键:除非我们能做到这一点,否则就别想着能构建一个实用规模的量子计算机。
Dwarkesh Patel:你是说最终的百万量子比特会放在这么小的芯片上吗?太棒了。
其他公司也宣布了 100 个物理量子比特,比如谷歌、IBM 等。你说你们也有一个,但你提到你们的量子计算机在规模扩展性上远远领先时,是什么意思?
Satya Nadella:是的。我们还做了一件事,我们采取了一种将软件和硬件分开的方法。我们正在构建自己的软件堆栈,现在,我们与中性原子和离子阱的团队合作,还与其他一些有相当不错的光子学方法的团队合作,这意味着会有不同类型的量子计算机。事实上,我想我们最近宣布的有 24 个逻辑量子比特。所以我们在纠错方面也取得了一些非常棒的突破,这使得我们能够在中性原子和离子阱量子计算机上构建这些 20 个以上的量子比特,我认为这个进展会持续下去,你将看到我们在这一方面的不断改进。
但我们也说过, “让我们从基本原则出发,构建我们自己的量子计算机,将赌注押在拓扑量子比特上。” 这就是这次突破的意义所在。
Dwarkesh Patel:太惊人了。百万拓扑量子比特,数千个逻辑量子比特,预计要达到这个水平的时间是多久?如果你们已经有了第一个晶体管,那么这里的摩尔定律会是什么样的?
Satya Nadella:显然,我们已经为此努力了 30 年。我很高兴我们现在有了物理学上的突破和制造技术上的突破。
我希望我们现在能有一台量子计算机,因为,顺便说一下,量子计算机首先能让我们做的事情就是制造量子计算机,因为模拟这些新量子门的原子级构建将变得更加容易。
但无论如何,接下来的真正任务是,既然我们有了制造技术,就让我们去制造第一台容错量子计算机吧。
所以,我现在可以说,“哦,也许到 2027、2028、2029 年,我们就能真正造出这台计算机”。现在我们有了这个量子“门”,我能把它装进集成电路里 然后把这些集成电路装进真正的计算机里吗?这就是下一步的逻辑所在。
Dwarkesh Patel:那么,你预料,到了 2027、2028 年,你们的量子计算机能工作了吗?它可以通过应用程序接口(API)访问吗?还是它是你们内部用于材料和化学研究的工具?
Satya Nadella:这是一个很好的问题。让我感到兴奋的一件事是,即使在今天的世界里我们有这个量子程序,还为它添加了一些 API。我们在两年前取得的突破是把高性能计算堆栈、人工智能堆栈和量子放在一起考虑。
事实上,如果你想想看,AI 就像是模拟器的仿真器。量子就像是大自然的模拟器。量子会做什么?顺便说一下,量子不会取代经典计算。量子擅长它能做的事,而经典计算也会……
量子在任何不是数据密集型但在状态空间方面是探索密集型的事情上都将非常出色。它应该是数据轻量的,但在你想要探索的指数状态上。模拟就是一个很好的例子:化学物理、什么的、生物学。
我们开始做的其中一件事就是真正将 AI 作为仿真引擎。但你可以然后进行训练。所以我认为的方式是,如果你有 AI 加量子,或许你会用量子生成合成数据,然后让 AI 利用这些数据训练更好的模型,从而能够模拟化学、物理或其他领域。这两者会一起使用。
因此,即使今天,我们实际上就是在做高性能计算(HPC)和 AI 的结合。我希望能够用量子计算机替代一些 HPC 的部分。
Dwarkesh Patel:你能不能告诉我,你是如何做出这些研究决定的,尤其是在微软这样规模的公司,这些决定在 20 年、30 年后是否真的会带来红利?显然,你对这个项目的技术细节非常了解。你觉得在微软研究院做所有这些事情的同时,你还能做出这样的决策吗?
你怎么知道你现在下的赌注在 20 年后会有回报?是必须通过组织有机地涌现出来,还是你如何跟踪这一切?
Satya Nadella:我觉得比尔(盖茨)在 1995 年左右创办微软研究院(MSR)时的做法非常棒。我认为,在这些以好奇心为驱动力的研究机构的悠久历史中,只做基础研究的研究机构和 MSR,多年来已经建立起了这种制度优势,因此,当我考虑资本分配或预算时,我们首先把筹码放进去,然后说:"这是 MSR 的预算"。我们每年都要这样做,因为我们知道,大多数赌注都不会在有限的时间内得到回报。也许微软的第六任 CEO 会从中受益。在科技行业,我认为这是必然的。
我真正考虑的事情是,当像量子计算、新模型等这样的技术时机到来时,能否抓住这些机会?作为在位者,如果你回顾一下科技史,你会发现并不是说人们没有投资下注,而是你需要有一种文化,知道如何把创新进行规模化。
这对 CEO 和管理团队来说是真正困难的部分,坦率地说,这一点很吸引人。它不仅仅关乎良好的判断力,也关乎良好的文化。有时候我们做对了,有时候做错了;我可以告诉你微软研究院有上千个项目,我们应该领导这些项目,但我们没有做到。我总是问自己为什么。因为我们没有足够的信心去完成那个完整的思考,不仅仅是把创新引入市场,而是把它做成一个有用的产品,并有一个商业模式,我们能拿去市场推广。
这是 CEO 和管理团队的工作: 不能只对某一件事感到兴奋,而是能够真正执行一个完整的方案。这说起来容易,做起来难。
Dwarkesh Patel:你提到微软可能会有三位继任 CEO,如果他们每个人都能将市值提高一个数量级,那么当你取得下一个突破时,你就会成为世界经济的领头羊之类的人物。
Satya Nadella:或者记住,世界将以 10% 的速度增长,所以我们会没事的。
Muse 将如何改变游戏
Dwarkesh Patel:让我们深入了解你们刚刚取得的另一个重大突破。你们在同一天发布了这两项突破,在你们的游戏世界模型中真的让人震惊。如果你能简单介绍一下这个模型,我将非常高兴。
Satya Nadella:我们将其称为 Muse,它将成为这个世界的行动模型或者说人类行动模型。
这真是太酷了。显然,Dall-E 和 Sora 在生成模型方面所取得的成就令人难以置信。我们想要追求的一件事就是利用游戏玩法数据,你能否生成既一致又能展现游戏多样性的游戏,并且能够对用户的 mod 进行持久化处理?
这就是问题所在。他们能与我们的一家游戏工作室合作,这就是《自然》杂志上的另一篇文章。
最酷的是,我期待着将来很快会有一个游戏目录,我们将开始使用这些模型,或者我们会训练这些模型来生成游戏,然后开始玩它们。
事实上,当 Phil Spencer 第一次向我展示时,他拿着一个 Xbox 手柄,这个模型基本上根据输入生成了输出,而且与游戏一致。对我来说,这是一个巨大的“哇”的时刻。这就像我们第一次看到 ChatGPT 说完整的句子,或者 Dall-E画画,或者 Sora 一样。这是这样一个时刻。
Dwarkesh Patel:今天早上,我有机会看到你们的首席研究员 Katja 展示的实时演示视频。和她谈过后,我才真正意识到这有多么不可思议,因为我们过去已经使用 AI 来建模智能体,而仅仅利用相同的技术来建模智能体周围的世界,便能提供一致的实时反馈——我们将在这期播客上叠加相关视频,大家可以亲眼看到。到时候它应该也会发布,大家可以在那里观看。
这一切本身就令人难以置信。作为 CEO,你已经投入了数百亿美元来建立微软游戏并收购知识产权。
回顾过去,如果你能将所有这些数据整合成一个大型模型,能够带给你同时访问和体验多个世界的感受,而如果这是游戏未来发展的方向,看起来这笔投资是非常值得的。你当时有预感到这一点吗?
Satya Nadella:我不会说我们投资游戏是为了构建模型。坦率地说,我们投资游戏,实际上是因为——这是我们历史中的一件有趣的事:我们在开发 Windows 之前就已经开发了第一款游戏。飞行模拟器在我们开发 Windows 之前就是微软的产品。
所以,游戏在公司历史上有着悠久的传统,我们投资游戏是为了游戏本身。我总是先说,我讨厌那种为了达成某种目标而进入的行业。它们必须本身就是目的。
是的,我们不是一个企业集团,我们是一家公司,必须将这些资产整合起来,通过增值成为更好的所有者。例如,云游戏对我们来说是一个自然的投资方向,因为它将扩展市场总量(TAM),并扩大人们在任何地方玩游戏的能力。
同样,AI 与游戏的结合:我们确实认为它可能会有所帮助——它就像是长期以来游戏的 CGI 时刻。这太棒了。作为全球最大的发行商,这对我们非常有帮助。但与此同时,我们必须制作高质量的游戏。我的意思是,如果不专注于这一点,你根本不能成为一个游戏出版商。
这个数据资产将会非常有趣,不仅在游戏的背景下,而是作为一个通用的行动模型和世界模型,这太棒了。我认为或许就像 YouTube 之于 Google一样,而游戏数据之于微软也是如此。因此,我对此感到非常兴奋。
Dwarkesh Patel:是的,这就是我想表达的意思,就是说,你可以在多种不同的游戏中获得统一的体验。除了 AI 之外,这与微软过去所做的其他工作有什么关系,比如混合现实?也许能给小型游戏工作室一个机会来制作这些 AAA 级动作游戏?在五到十年后,你能想象有哪些方式?
Satya Nadella: 我早在五、六、七年前就说过,我们要下的三大赌注是 AI、量子和混合现实 。
我仍然相信它们,因为从某种意义上讲,要解决的大问题是什么?存在感。这是混合现实的梦想。你能创造出真正的存在感吗?就像你我在做这种播客一样。
老实说,我认为这是那些挑战中最难的一个。我本以为它会更容易解决。可能更困难的一部分,是因为它涉及到社交因素:穿戴设备等等。
实话讲,我们很高兴能与 Anduril 还有 Palmer 合作,尤其是他们如何推动 IVAS 项目,因为这是一个绝佳的应用案例。我们会在这方面继续努力。
二维(2D)界面也是如此。我认为这会继续发展下去。这是一个长期的趋势。
我们已经讨论过量子了,AI 是另一个。所以,这三件事是我关注的方向。我在思考如何将这些东西结合起来?最终,不是为了技术本身,而是为了实现我们作为人类在生活中所追求的一些基本需求,并且更多地在我们的经济中推动生产力。如果我们能以某种方式把这一点做对,我认为我们就真的取得了进展。
AI 的法律障碍
Dwarkesh Patel:回到 AI 这个话题,你在 2019 年投资了 OpenAI,非常早,你在书中提到过, “也可以说我们正在孕育一种新物 种(new species),其 智能可能没有上限。”
当然,2017 年谈论这个话题是非常超前的。我们已经在具体细致地讨论智能体、Office Copilot、资本支出等问题。但如果把眼光放远,考虑到你的这番话,再加上你作为一个超大规模公司运营者,同时也是研究这些模型的人,为构建一个新物种提供培训、推理和研究,你是如何从全局的角度看待这个问题的?
你认为在你作为 CEO 的任期内,我们会朝着超人类智能的方向发展吗?
Satya Nadella:我认为甚至 Mustafa 都用过这个词。实际上,他最近也提到了这个“新物种”。
我的看法是,信任是必须的。在我们宣称这是一个物种之前,我们要做的最基本的事情就是要有真正的信任,无论是个人层面的信任还是社会层面的信任,这才是硬道理。
我认为,影响这项技术最大限制因素将是我们的法律……可以称之为基础设施,我们讨论的是所有计算基础设施,那么法律基础设施如何发展以应对这一点呢?整个世界都是建立在诸如人类拥有财产、拥有权利和承担责任等概念上的。这是一个根本问题,首先必须问清楚的是,这对现在人类作为工具使用的所有事物意味着什么?如果人类将更多的权力委托给这些工具,那么这种结构将如何发展?在这个问题得到真正解决之前,我认为光谈技术能力是无法实现的。
Dwarkesh Patel:意思是,在我们搞清楚如何解决这个问题之前,我们不能部署这种类型的智能?
Satya Nadella:完全正确。因为归根结底,今天你无法部署这些智能,除非有某个人为其提供担保。
就像你说的,这也是为什么我认为,即使是最强大的 AI,基本上也还是在人某个类的授权下运作。你可以说,哦,那都是对齐问题,等等。正因如此,我认为你必须真正确保这些对齐能够发挥作用,并且能够以某种方式验证,但我就是不认为你可以部署那些失控的智能。例如,AI 的起飞问题可能会成为一个真正的问题,但在它成为真正的问题之前,真正的问题会出现在法庭上。没有哪个社会会允许某个人说:“是 AI 干的。”
Dwarkesh Patel:是的。世界上有很多社会,我想知道是否有哪个社会的法律体系会更为宽容。如果没有起飞,那你可能会担心。这不一定非得发生在美国,对吧?
Satya Nadella:我们认为没有哪个社会能做到不在乎,对吧?虽然确实可能会有不法分子,我并不是说不会有不法分子,它们确实存在。
但要认为整个人类社会根本不在乎这一点,也是不对的。我认为我们所有人都会在意。我们现在知道如何应对流氓国家和不法分子。世界不会坐视不管,而说“我们可以容忍”。
Dwarkesh Patel:是的。但如果你能想象出经济增长 10 %的景象,我认为这真的取决于像 AGI 这样的东西能否发挥作用,因为数十万亿美元的价值,听起来更接近人类工资的总和,约 60 万亿美元的经济总量。要达到这种规模,你基本上必须在非常显著的方式上自动化劳动或补充劳动。
如果这有可能,一旦我们弄清楚它的法律后果,那么即便在你任期内,我们也有可能解决这个问题。你在考虑超人类智能吗?就像你职业生涯中最大的成就就是这个?
Satya Nadella:你提到了另一个点。我知道 David Autor 等人谈了很多这个问题,60% 的劳动——我认为需要解决的另一个问题是,至少在我们的民主社会中,稳定的社会结构和民主制度的运作不能仅仅依靠资本的回报,而没有劳动的回报。我们可以讨论这个问题,但这 60% 的劳动必须重新估价。
用我自己简单的方式,也许你可以称之为天真,我们将开始评估不同类型的人类劳动。今天被认为是高价值的人类劳动,可能会变成商品。我们可能会看重一些新的东西。
包括那个帮助我做理疗的人,或者其他我们看重的东西,但归根结底,如果我们的劳动没有回报,工作没有意义,工作没有尊严,那也是这些东西能否部署的一个制约因素。
让 AGI 真正安全
Dwarkesh Patel:关于对齐问题,两年前,你们发布了 Sydney Bing。为了明确一点,就当时的能力水平而言,这只是一个迷人、令人愉快、也有些幽默的误对齐的例子。
在当时,它就像聊天机器人一样。它们可以思考 30 秒,给你一些有趣或不恰当的回复。但是,如果你考虑到这种系统--我想,对于《纽约时报》的记者来说,这种系统曾试图让他离开他的妻子或其他什么--如果你考虑到这种系统的未来,而你拥有的这些智能体在未来的几个小时、几个星期、几个月里,就像自主的 AGI 群一样,他们可能会以类似的方式错位,把事情搞砸,也许还会相互协调,你们将如何应对,确保当你们拥有那个“大型 AGI”时,能够做到正确的对齐?
Satya Nadella:没错。这也是我们通常在分配计算资源时的原因之一—— 我们要为对齐问题分配计算资源 。
更重要的是,我们需要考虑真正能够监控这些事情的运行时环境是什么?它的可观察性如何?我们今天在传统的技术领域也面临很多类似的问题,比如网络安全。我们不只是编写软件,然后任其发展。有了软件,还要对其进行监控。你要监控它是否遭受网络攻击、是否存在故障注入等等。
因此,我认为我们必须在这些部署方面建立足够的软件工程支持,然后在模型本身内部解决对齐问题。这些问题中,有些是科学问题,有些是工程问题,我们必须逐一攻克。
这也意味着我们需要承担我们自己的责任。所以,我更倾向于将这些技术部署在那些可以实际管理其范围和规模的地方。你不能就这样把某个系统释放到外部世界中,造成伤害,因为社会不允许这样做。
Dwarkesh Patel:当你拥有能够为你完成数周任务的智能体时,你希望在让它运行一个随机的财富 500 强公司之前,你想要的最基本的保障是什么?
Satya Nadella:我认为,当我使用像 Deep Research 这样的东西时,最低的保障要求是,在我们特别拥有任何东西的物理化身之前,这应该是一个门槛,当你越过这个门槛时,才会考虑进一步的部署。那可能是其中一个点。
另一个方面是,比如说,这些系统运行的环境的权限。
Dwarkesh Patel:我的意思是,我们已经有了网络搜索,而且已经脱离沙箱了。
Satya Nadella:但即便是网络搜索,它做的事情,以及它写的内容——比如说,假如它只是为了进行某些计算而写一堆代码,那些代码是在哪里部署的?这些代码是仅仅为了创建输出而临时生成的,还是会被放出去到世界上?
这些是你在行动空间中可以真正控制的东西。
Dwarkesh Patel:除了安全问题之外,当你考虑到自己的产品套件,并且思考如果你确实拥有如此强大的 AI 系统时,某个时刻,它不仅仅像是 Copilot——你提到的关于你如何为这次播客做准备的例子——更像是你实际将工作委派给同事的方式。
在你当前的产品套件基础上,添加这些 AI 会是什么样子?我指的是, 是否有一个问题是,大语言模型(LLM)会被其他事物商品化?
我在想,这些数据库、画布、Excel 表格等等——如果 LLM 是你访问所有这些东西的主要入口点,是否有可能 LLM 会让 Office 商品化?
Satya Nadella:这是一个有趣的问题。我认为,至少在第一阶段,我的想法是:LLM 能否帮助我更高效地使用所有这些工具或画布来完成知识工作?
我见过的一个最好的演示是,一位医生准备参加肿瘤委员会会议的工作流程。她要参加肿瘤委员会会议,首先她使用 Copilot 来创建会议议程,因为 LLM 可以帮助她理清所有案例,这些案例在某个 SharePoint 网站上。它会说:“嘿,这些案例——显然,肿瘤委员会会议是一个高度关键的会议,你需要考虑不同案例的差异,以便分配适当的时间。”
甚至仅仅是创建一个议程的推理任务,它知道如何分配时间,这非常好。所以,她用 LLM 来做这个。然后她进入会议,在和所有同事在 Teams 通话中,她能够专注于实际案例,而不是做笔记,因为现在有这个 AI Copilot 在做完整的会议记录。这不仅仅是转录,还包括了会议内容的数据库条目,以供随时回顾。
然后,她从会议中出来,讨论了案例,而没有被做笔记分心。她是位教学医生,她想去准备她的课堂。所以她进入 Copilot,说:“把我的肿瘤委员会会议内容做成 PPT,好让我可以给学生讲解。”
这就是这种类型的工作。我现在的用户界面(UI)和支撑框架是通过 LLM 填充的画布。而工作流程本身正在被重塑;知识工作正在进行。
有一个有趣的事情:如果在上世纪 80 年代末有人告诉我:“你桌上会有一百万份文件”,我可能会说:“那是什么鬼?”我本来会以为桌上会有一百万份纸质文件。但事实上,我们确实有一百万份电子表格和一百万份文档。
Dwarkesh Patel:我没有,你有。
Satya Nadella:它们都在那儿。所以,即使是智能体,也会发生这样的事情。会有一个 UI 层。对我来说,Office 不仅仅是今天的办公室,它是知识工作的 UI 层。它将随着工作流程的演变而进化。这就是我们想要构建的。
我确实认为,今天存在的 SaaS 应用程序,这些 CRUD 应用程序,最终会发生根本性变化,因为业务逻辑将更多地进入这种智能体层。实际上,我在 Copilot 的另一个很酷的体验是,当我说,“嘿,我准备和客户开会,”我只需要说,“给我所有相关的会议笔记。”它会从我的 CRM 数据库中提取,从我的 Microsoft Graph 中提取,创建一个合成的、本质上的人工制品,然后在上面应用逻辑。对我来说,这将改变我们今天所知道的 SaaS 应用程序。
Dwarkesh Patel:SaaS 作为一个行业,可能每年价值数千亿美元到数万亿美元,具体取决于如何计算。如果这真能被 AI 击垮,那在未来十年里,微软的市值是否会再次增长 10 倍?因为你在谈论数万亿美元的市场…
Satya Nadella:它还将为 SaaS 创造大量价值。也许我们没有太关注的一个方面是,世界上存在的 IT 积压问题。
这些代码生成技术,加上可以通过智能体来查询你所有的 SaaS 应用并获取更多效用,将会带来应用程序的巨大爆炸,它们会被称为智能体,所以在每个行业、每个类别中,我们突然间就能够获得服务。
因此,将会有很多价值。你不能停滞不前。你不能再说“哦,我对某个狭窄的业务流程做了框架设计,我在浏览器中有一个 UI,这就是我的工作了。”这种说法已经不再适用了。 你必须要站得更高,问问自己:“我需要参与的任务是什么?”
你将希望能够将你的 SaaS 应用程序转变为一个出色的智能体,在一个多智能体的世界中发挥作用。只要你能做到这一点,那么我认为你就可以增加它的价值。
34 年微软生涯
Dwarkesh Patel:我可以问你一些关于你在微软工作的事情吗?
Satya Nadella:当然可以。
Dwarkesh Patel:做为一个公司人(company man,指的是那些长期在一家公司工作,对公司文化、历史和业务有深入了解,并逐渐通过公司内部晋升至高位的员工。)是不是被低估了?你在微软大部分时间里工作,或许可以说,你之所以能创造如此多的价值,其中一个原因就是你见证了微软的文化、历史和技术。你通过在公司内部晋升,获得了所有这些背景。是不是更多的公司应该由那些拥有这种背景的人来管理?
Satya Nadella:这是一个很好的问题。我没有从这个角度思考过。
在我 34 年的微软生涯中,每一年我都觉得比前一年更激动人心。并不是觉得,哦,我是个公司人,或者其他什么。我非常认真对待这一点,尤其是对于任何加入微软的人来说。并不是说他们加入微软是因为他们觉得这只是一个经济回报的平台,而是他们觉得能够利用微软平台来实现自己的使命和目的。这就是我们之间的契约。
所以我认为是的,企业必须创造一种文化,允许员工进入公司并成为像我这样的“公司人”。至少在我的案例中,微软在这一点上做得利是大于弊端的,我希望未来依然如此。
Dwarkesh Patel:你所说的第六任 CEO,将会使用你现在开始的这些研究,你是如何留住未来的 Satya Nadella,确保他们能够成为未来的领导者的?
Satya Nadella:这很有意思。今天是我们的第 50 个年头,我经常在思考这个问题。我们应该理解的是,持久性不是目标,意义才是目标。
我和我们 20 万名员工每天要做的事情是:我们所做的事情,是否对世界有用并且有意义,我们不仅要考虑今天的世界,还要考虑未来的世界。
我们所处的行业没有特许经营价值,这是另一个难点。如果你把我们今年的研发预算拿出来,那都是在推测五年后会发生什么。基本上,你必须抱着这样的态度去做,说“我们正在做我们认为会有意义的事情”。
所以你必须关注这个目标。然后要知道,你的打击率是有限的,你不会总是成功,你必须对失败有很高的容忍度。你必须进行足够的尝试,才能说:“好吧,作为一家公司,我们会成功的”。这就是这个行业的棘手之处。
Dwarkesh Patel:还有两个月就是微软成立 50 周年了。如果你看一下市值排名前十的公司,或者前五名,基本上,除了微软,其他公司都比微软年轻。这个现象非常有趣,微软是如何做到在这么多年中始终保持活力的?如何不断重整旗鼓(refounding)?成功的公司往往都比较年轻。世界 500 强企业的平均寿命为10到15年。
Satya Nadella:我喜欢 Reed Hoffman 用的那个词,refounding。这就是一种思维方式。人们常说“创始人模式”(founder mode),但 对于我们这些普通的CEO来说,更像是“重整旗鼓模式”(refounder mode) 。
能够以全新的视角重新看待事物是关键。对于你的问题:我们能否在文化上创造一个环境,使得“重整旗鼓”成为一种习惯?我们每天来这里都会说:“我们觉得我们与这里息息相关,能够改变我们所做的事情的核心假设,并重新定义我们与周围世界的关系。我们给自己这个权限了吗?”我认为,很多时候,公司会觉得自己受到了商业模式等的限制。对此,你必须需要解除对自己的束缚。
Dwarkesh Patel:如果你离开微软,你会创办什么公司?
Satya Nadella:我会创办什么公司?天啊。这时候“公司人”的我就说:“我永远不会离开微软。”
如果我真要做点什么,我认为选择一个有…当我看到科技的梦想时,我们一直在说,科技是最大的、最伟大的民主化力量。
我觉得我们最终具备了这样的能力。如果你说每瓦特每美元能产生的效益,我愿意去找到一个可以应用这种能力的领域,尤其是那些服务不足的应用领域。
那就是医疗、教育…公共部门会是另一个应用领域。如果你把这些领域,也就是服务不足的地方,作为这个国家的公民、这个社会的成员或任何地方的一员,能够受益于这种技术带来的丰富性,转化为更好的医疗、更好的教育和更好的公共部门服务,那将会很棒。
相信AGI吗?
Dwarkesh Patel:听了你对不同问题的回答,有一点我不太确定,你是否认为 AGI 是一个存在的事物。是否会有一种能够自动化所有认知劳动的东西,像是任何人能够在电脑上做的事?
Satya Nadella:这是我对人们讨论它的定义有所困惑的地方。认知劳动并不是一成不变的。今天就有认知劳动。如果我有一个收件箱,管理我所有的智能体,那是新的认知劳动吗?
今天的认知劳动可能会被自动化。那么,产生的新认知劳动呢?这两者都必须考虑到,这就是转变。
这就是为什么我做出这样的区分,至少在我的脑海中是这样:不要把知识工作者和知识工作混淆。今天的知识工作可能会被自动化。但谁说我的人生目标是处理我的电子邮件?让智能体处理我的电子邮件,但在处理完我的电子邮件之后,再给我一个更高层次的认知劳动任务,比如,“嘿,这三份草稿是我真正想要你审阅的”。这是一个不同的抽象概念。
Dwarkesh Patel:但 AI 能达到第二个层次吗?
Satya Nadella:有可能,但一旦它达到了第二个层次,就会有第三个层次。当我们在历史上使用的工具已经改变了认知劳动的本质时,我们为什么还在担心所有的认知劳动都会消失呢?
Dwarkesh Patel:我敢肯定你之前听过这些例子,比如说马匹仍然在某些事情上有用,有些地形是你无法开车去的。但认为你会看到马匹在街上跑,或者雇佣百万马匹,这种情况显然不会发生。
然后这个问题是,类似的情况会不会发生在人类身上?
Satya Nadella:但是仅仅在一个非常狭窄的维度上吗?按照我们今天的理解,人类开始重视某些被称为“认知劳动”的这种狭义的东西,这样的历史只有两百年。
以化学为例。如果量子力学加上 AI 确实帮助我们做了很多新型的材料科学研究,那由它做的新材料科学研究是非常棒的。这是否会剥夺人类能做的其他事情呢?
为什么我们不能在一个有强大认知机器的世界里生存,同时知道我们的认知能力并没有被剥夺呢?
Dwarkesh Patel:我会问这个问题,不是关于你的,而是关于一个不同的情境,所以也许你可以在不感到尴尬的情况下回答。假设在微软的董事会中,你能看到增加一个 AI 成员吗?它能否拥有判断力、背景和全面的理解,成为一个有用的顾问?
Satya Nadella:这是一个很好的例子。我们在 Teams 中增加了一个主持智能体。目前还处于早期阶段,我们的目标是,能否让这个主持智能体利用长期记忆,不仅仅是会议背景,还包括我们正在进行的项目、团队等背景,成为一个出色的主持人?
我甚至希望它能在董事会会议中使用,因为董事会成员每个季度才开一次会,他们需要消化一个像微软这样复杂的公司的信息。一个能够真正帮助人们集中注意力,保持专注于重要问题的主持智能体,那真是太棒了。
这就像你说的,回到你之前的问题,拥有一个拥有无限记忆的东西能帮助到我们。毕竟,Herbert Simon 怎么说的来着?我们都是有限理性。因此,如果人类的有限理性能够通过外部的认知放大器得到处理,那就太好了。
Dwarkesh Patel:说到材料和化学,我记得你最近说过,你希望下一个 250 年在这些领域的进展能在未来 25 年内实现。现在,当我想到下一个 250 年可能实现的事情时,我想到的是太空旅行、太空电梯、永生以及治愈所有疾病。你觉得未来 25 年能做到这些吗?
Satya Nadella:我提到这个的原因之一是,我喜欢那个观点:工业革命是 250 年的进程。我们必须从一个基于碳的系统转变到另一种系统。
这意味着,你必须从根本上重塑过去 250 年里化学领域发生的一切。 这就是我希望量子计算机能够发挥作用的地方,量子计算机帮助我们发现新材料,然后我们可以制造出这些新材料,来应对我们在这个星球上面临的所有挑战。然后我也支持星际旅行。
Dwarkesh Patel:太棒了。Satya,非常感谢你抽出时间来和我们交谈。
Satya Nadella:非常感谢。这真是太棒了。谢谢。
Dwarkesh Patel:太好了,谢谢。