黄仁勋发布英伟达最强芯片,人形机器人时代正式倒计时
8 小时前 / 阅读约9分钟
来源:IT之家
祭出史上最强 AI 芯片的同时,也画下了好几个大饼。

就在北京时间今天(3 月 19 日)凌晨,一年一度的“AI 春晚”英伟达 GTC 大会在加州圣何塞开幕。

还是那身熟悉的皮衣,黄仁勋走上 GTC25 舞台,没有提词器也没有脚本笔记,拿着幻灯片遥控器即兴脱稿演讲 2 个半小时。

他表示,去年的 GTC 是 AI 界的伍德斯托克音乐节,今年则是 AI 界的超级碗。

在本次 GTC 大会中,黄仁勋讲述了英伟达过去一年的进展、展示了 AI 发展的路线图、介绍了在 AI 领域的最新技术突破。

从游戏显卡、到 AI 芯片、再到机器人时代,IT之家小编这就来带大家回顾一下要点。

一、从 GeForce 游戏显卡聊起

尽管英伟达并没有在今年的 GTC 大会上发布新的 GeForce 游戏显卡产品,但老黄依然选择从 GeForce 的 25 周年聊起。

黄仁勋强调,目前全球都已“售罄”的 RTX 5090 显卡,比前代 RTX 4090 的体积足足小了 30%

正是 GeForce 将 CUDA 带给了世界,CUDA 让 AI 成为了可能,AI 又反过来增强了游戏的视觉效果。

二、Agentic AI 时代

在发布新产品之前,老黄先行提到了 AI 发展的未来,并讨论了我们在 AI 时代的发展阶段。

根据他所展示的演示图,现在我们处于生成式 AI(Generative AI)阶段。

接下来,将迈向一个 Agentic AI 时代,随后便是 Physical AI —— 机器人登场的时候。

老黄认为,AI 领域 Scaling Law 的故事还没有讲完,而且仍在加速,我们对算力的需求并没有减弱。

数据中心建设预计将在 2028 年达到 1 万亿美元(IT之家注:现汇率约合 7.23 万亿元人民币)。

三、自动驾驶,安全第一位

自动驾驶汽车时代已来,英伟达将和 GM 通用汽车合作,打造未来的自动驾驶汽车。

面对安全问题,老黄还发布了英伟达 Halos,这是一个专注于汽车安全的 AI 解决方案。

该解决方案是一款从芯片到系统、软件、算法、策略的全方位安全系统,700 万行代码都经过第三方的安全评估。

四、Dynamo,AI 工厂的操作系统

为了让客户“买得越多、省得越多”,英伟达发布了 Dynamo,号称是“AI 工厂的操作系统”。

Dynamo 是一个“分布式推理服务库”。本质上,它是一个针对用户需求 token 而无法生产足够 token 之间问题的开源解决方案。

黄仁勋展示了一张关于推理的图表,X 轴显示用户每秒的 Token 数,Y 轴显示工厂每秒的 Token 数。

在 Dynamo、Grace Blackwell NVLink72 超级芯片的加持下,Blackwell 相比 Hopper 可实现 25 倍的性能提升。

而在推理模型中,这一性能差距更是扩大到了 40 倍。

值得一提的是,黄仁勋打趣道,有了上述最新技术加持,搭建 AI 工厂的厂商“买得越多、省得越多”

言下之意 —— 掏钱吧。

五、新“核弹”Blackwell Ultra 芯片

距离 Blackwell 芯片推出已一年有余,据黄仁勋透露,2024 年全球前四超算运营商共采购 130 万片 Hopper 架构芯片;2025 年,它们又购买了 360 万 Blackwell 芯片。

而在万众期待中,老黄又带来了传言已久的 Blackwell 增强产品 ——Blackwell Ultra(GB300)

既然是增强产品,那 Blackwell Ultra 的规格无疑比 Blackwell 更为强悍。

对比来看,该芯片单颗便配备了 288GB 的 HBM3e 内存,拥有 15PF 的稠密 FP4 算力,比 GB200 高出 1.5 倍。

拥有 72 颗 GB300 的 Blackwell Ultra NVL72 平台将于 2025 年下半年推出。

目前使用 Blackwell GB200 的客户,也都可以平滑切换到 Blackwell Ultra。

六、下一代 Rubin 芯片,抢先预览

本以为 Blackwell Ultra 已是王炸,没想到黄仁勋还有大招。

他预览了继 Hopper、Blackwell 之后的英伟达下一代 AI 超级芯片 ——Vera Rubin

Vera Rubin 的命名规则和 Grace Blackwell 类似,Vera 是 CPU,Rubin 是 GPU。

选择这个名字,是为了致敬“证实暗物质存在”的女性科学先驱薇拉・鲁宾,延续了该公司以杰出科学家命名芯片架构的传统。

从预览的性能来看,Vera Rubin 的整体性能是 GB300 的 3.3 倍,集 288GB HBM4、13TB/s 带宽、260TB/s 吞吐量于一身。

其性能可达 Hopper 的 900 倍,而 Blackwell 是 Hopper 的 68 倍。

在预览 Rubin 的同时,老黄还超前瞻了更为强悍的 Rubin Ultra NVL576,拥有 365TB 带宽 4.6PB/s 的 HBM4e 内存,性能拉到 GB300 的 14 倍。

Rubin 计划于 2026 年下半年推出,Rubin Ultra 则要到 2027 年。

为了匹配“AI 工厂”的需求,英伟达还发布了 Spectrum-X Photonics 与 Quantum-X Photonics 两款光电一体化交换机,为连接数百万块 GPU 做好准备。

预览下一代 Rubin 还不过瘾,黄仁勋甚至还公布了更下一代结构 ——Feynman。将于 2028 年上市。

该命名用来纪念在量子力学领域做出了巨大贡献的美国物理学家理查德・菲利普斯・费曼。

七、全套 AI 计算机,任你选择

看完了上面的数据中心产品,我们再来看看老黄眼中 AI 时代的电脑应该是什么样的。

DGX Station 搭载一颗 GB300 超级芯片,拥有 784GB 统一内存,AI 算力高达 20,000 TFLOPS。

之前在 CES 上发布的 Project DIGITS 迷你主机,现已正式定名为 DGX Spark,仅需 3000 美元即可获得 1000 TFLOPS 的 AI 算力。

此外,英伟达还正式发布了面向工作站和服务器的 RTX PRO 系列 Blackwell 专业卡。

其中,旗舰级的 RTX PRO 6000 系列拥有 24,064 个 CUDA 核心、752 个 Tensor 核心、188 个 RT 核心。

八、拿下 DeepSeek 推理世界纪录

值得一提的是,DeepSeek 出现在英伟达 GTC 大会中,据黄仁勋透露,其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据悉,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

随着继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

九、步入机器人时代

在本次 GTC 的结尾,英伟达开始讨论机器人的相关内容。

老黄首先展示了与迪士尼和谷歌 Deepmind 团队合作打造的开源物理引擎 Newton,并把小机器人 Blue 请到了台上进行互动。

这个机器人像《星球大战》中的机器人一样移动,发出可爱的声音,行走动作自然。

随后老黄宣布,英伟达 Isaac GROOT N1 —— 全球首款人形机器人功能模型将会开源!

Blackwell 芯片已经开始全面生产,Blackwell Ultra 超大杯将于今年年底登场,面向企业及个人的 AI 产品也箭在弦上,机器人具身智能时代也即将到来。

老黄预言:在未来,机器人领域将成为最大的产业。

十、总结

以上就是英伟达 GTC 大会的主要情况了,IT之家小编特此汇总要点助各位一文速通。

回顾老黄的演讲,他在祭出史上最强 AI 芯片的同时,也画下了好几个大饼。

总之,英伟达传达出的信息很强烈:AI 算力需求仍在持续加速中,快来买买买吧!