北京时间今天(3 月 19 日)凌晨,一年一度的“AI 界春晚”GTC 2025 在加州圣何塞正式召开。
老黄身着皮衣、不用提词器,脱稿带来了一场时长 2 个半小时的演讲,从游戏显卡、聊到 AI 芯片、再到机器人时代,IT之家这就来带大家简要回顾一下要点。
尽管英伟达并没有在今年的 GTC 大会上发布新的 GeForce 游戏显卡产品,但老黄依然选择从 GeForce 的 25 周年聊起。
黄仁勋强调,目前全球都已“售罄”的 RTX 5090 显卡,比前代 RTX 4090 的体积足足小了 30%。
正是 GeForce 将 CUDA 带给了世界,CUDA 让 AI 成为了可能,AI 又反过来增强了游戏的视觉效果。
在发布新产品之前,老黄讨论了我们在 AI 时代的发展阶段。
现在我们处于生成式 AI(Generative AI)阶段,根据路线图,我们将迈向一个 Agentic AI 时代,随后便是 Physical AI —— 机器人登场的时候。
老黄认为,AI 领域 Scaling Law 的故事还没有讲完,而且仍在加速,我们对算力的需求并没有减弱。
数据中心建设预计将在 2028 年达到 1 万亿美元(IT之家注:现汇率约合 7.23 万亿元人民币)。
自动驾驶汽车时代已来,英伟达将和 GM 通用汽车合作,打造未来的自动驾驶汽车。
面对安全问题,老黄还发布了英伟达 Halos,一款从芯片到系统、软件、算法、策略的全方位安全系统,700 万行代码都经过第三方的安全评估。
为了让客户“买得越多、省得越多”,英伟达发布了 Dynamo,号称是“AI 工厂的操作系统”。
Dynamo 是一个“分布式推理服务库”。本质上,它是一个针对用户需求 token 而无法生产足够 token 之间问题的开源解决方案。
黄仁勋展示了一张关于推理的图表,X 轴显示用户每秒的 Token 数,Y 轴显示工厂每秒的 Token 数。
在 Dynamo、Grace Blackwell NVLink72 超级芯片的加持下,Blackwell 相比 Hopper 可实现 25 倍的性能提升。
而在推理模型中,这一性能差距更是扩大到了 40 倍。
随后,老黄正式发布了之前传言已久的“超大杯”GB300 芯片,并将其命名为 Blackwell Ultra,单颗便配备了 288GB 的 HBM3e 内存,拥有 15PF 的稠密 FP4 算力。
拥有 72 颗 GB300 的 Blackwell Ultra NVL72 平台将于 2025 年下半年推出,算力达原本 GB200 NVL72 的 1.5 倍。
目前使用 Blackwell GB200 的客户,也都可以平滑切换到 Blackwell Ultra。
接下来,黄仁勋公布了继 Hopper、Blackwell 之后的下一代 AI 芯片 Rubin。
英伟达选择以“证实暗物质存在”的女性科学先驱薇拉・鲁宾(Vera Rubin,1928–2016,婚前姓 Cooper)来命名,延续了该公司以杰出科学家命名芯片架构的传统。
Vera Rubin NVL144 将于 2026 年下半年推出,拥有 75TB 带宽 13TB/s 的 HBM4 内存,带来 3.3 倍于上面介绍的 GB300 NVL72 的性能。
而更强的 Rubin Ultra NVL576 将于 2027 年下半年推出,拥有 365TB 带宽 4.6PB/s 的 HBM4e 内存,带来 14 倍于 GB300 NVL72 的性能。
Rubin 的性能可达 Hopper 的 900 倍,而 Blackwell 是 Hopper 的 68 倍。
为了匹配“AI 工厂”的需求,英伟达还发布了 Spectrum-X Photonics 与 Quantum-X Photonics 两款光电一体化交换机,为连接数百万块 GPU 做好准备。
而 Rubin 的下一代架构将被命名为 Feynman,用来纪念在量子力学领域作出了巨大贡献的美国物理学家理查德・菲利普斯・费曼。
看完了上面的数据中心产品,我们再来看看老黄眼中 AI 时代的电脑应该是什么样的。
DGX Station 搭载一颗 GB300 超级芯片,拥有 784GB 统一内存,AI 算力高达 20,000 TFLOPS。
之前在 CES 上发布的 Project DIGITS 迷你主机,现已正式定名为 DGX Spark,仅需 3000 美元(现汇率约合 21691 元人民币)即可获得 1000 TFLOPS 的 AI 算力。
此外,英伟达还正式发布了面向工作站和服务器的 RTX PRO 系列 Blackwell 专业卡。
其中,旗舰级的 RTX PRO 6000 系列拥有 24,064 个 CUDA 核心、752 个 Tensor 核心、188 个 RT 核心。
在本次 GTC 的结尾,英伟达开始讨论机器人的相关内容。
老黄首先展示了与迪士尼和谷歌 Deepmind 团队合作打造的物理引擎 Newton,并把小机器人 Blue 请到了台上进行互动。
随后老黄宣布,英伟达 Isaac GROOT N1 —— 全球首款人形机器人功能模型将会开源!
Blackwell 芯片已经开始全面生产,Blackwell Ultra 超大杯将于今年年底登场,面向企业及个人的 AI 产品也箭在弦上,机器人具身智能时代也即将到来。
在 GTC 2025 上,英伟达传达出的一个强烈信息,简单来说便是:我们对 AI 算力的需求仍在持续加速中,快来买买买吧!
英伟达 GTC 2025 大会专题