当老黄颇为自恋地问观众,“我这件皮衣怎么样?”我就知道这场发布会不简单。
游戏玩家最为关心得为英伟达献出多少大洋,黄仁勋却寥寥几页带过了消费级显卡,把大段叙述留给了AI,以及智能体、世界模型、机器人、自动驾驶、超算等因AI渗透发生进展的领域,未来又将如何被英伟达改变。
RTX 50系,刺得我好痛
老黄一上来,就带我们短暂回顾了英伟达的历史,如何从《街头霸王》走向图像处理领域的巨头,GPU也从游戏图像处理的芯片,成为了AI的支柱。
老黄先是端出,新一代基于Blackwell 架构的 GeForce RTX 50 系显卡。
从技术规格来看,RTX 5090 搭载 920 亿个晶体管,可提供 3400 TOPS 算力,还带四个 AI 处理单元,内建 21760 个 CUDA 核心,是世界上第一款超过 20000 个内核的 GeForce GPU,512bit 位宽 32GB GDDR7 的显存,整体性能是 RTX 4090 的两倍。
换芯后的 RTX 50 诠释了老黄口中,“GeForce曾让AI触达大众,而AI“卷土重来”后,彻底改变GeForce”。
而老黄将 RTX 4090 价格砍了三分之二,“摇身一变”,RTX 5070 登场。售价549 美元的 RTX 5070 性能等同于 2022 年发布,售价 1599 美元的 4090。台下瞬间爆发热烈掌声。
在一头一尾两张卡介绍完后,中间的 RTX 5070Ti 和 5080 沦为了“背景版”。Blackwell 已全面投产,RTX 50 系也将于一月开始发售。
有人收我双十一5500买的4070TiS吗?
“大力水手”第四代DLSS正式登场,引入了多帧生成技术,用AI把每个渲染帧再生成三帧,从 DLSS 3 的一比一生成,直接进化到“以一生三”。
DLSS 4 最高可以实现传统渲染 8 倍的性能,同时比旧版生成速度快 40%,生成的像素重影更少,细节更多,整体视觉效果更清晰。
然而,DLSS 4的多帧生成技术为50系独占。DLSS4首发即支持 75 款主流 3A 大作,其他游戏将在后续支持(不知道你们,双十一我刚花5500买的4070TiS,这会儿心痛痛的)。英伟达宣布:RTX 5090 将带游戏进入 4K 240 帧光线追踪的时代。
备受游戏玩家关注的RTX 50 系的发布环节,大概十多分钟左右就结束了。
不是?这就结束了?
2021年(自然年),游戏还是英伟达最大的收入来源,约为 122 亿美元,占比 46.7% 。而2022年后,英伟达的数据中心业务直接起飞。据彭博社对英伟达 2025 年的销售预估,游戏业务没发生太大变化,能达到 118 亿美元的销售额,对应的数据中心则是 1137 亿美元。
游戏代表英伟达的过去,而AI才是未来。
AI要理解物理世界
模型性能与数据可用性直接相关,但物理世界数据的捕获、整理、和标记成本很高。此前,业内也普遍认为,AI向前发展面临“数据墙”的问题。
英伟达对此表示:没有数据,就创造数据。英伟达发布了Cosmos 世界基础模型(World Foundation Models),要教AI理解物理世界。
老黄特意说,Cosmos模型不是教AI生成创意内容,换个意思,跟市面上那些“花里胡哨”的视频模型不太一样。
Cosmos 用文本指令就能生成符合物理规律的高质量视频,再通过对已有的视频分析,生成极度拟真的视频,再用 AI 分析 AI 视频,这就相当于自己出题自己做,卷死自己谁能活?
据介绍,Cosmos的第一代已经用 9000 万亿 Token 进行了训练,深度学习了 2000 万小时的人类高质量视频(这时长相当于从秦始皇登基前开始看视频,一直看到今天发布会)。
然后老黄大手一挥表示,Cosmos 模型开源,在 Github 上就能访问(已于下午 14:20 上线)。毕竟,独乐乐不如众乐乐。
这跟之前叫嚷很久的Omniverse数字孪生平台联系了起来。
Omniverse(工业数字化和物理 AI 仿真平台,内置了英伟达 PhysX、RTX 技术,可以实现物理上 3D 场景搭建,并且其中有真实的碰撞、光线追踪和粒子模拟)为 Cosmos 生成提供了一个能落地、可控制、可调节的基础环境。
比如,Omniverse 中构建一个车祸场景(总不能为了 AI 训练一直故意制造车祸吧),Cosmos 模型来渲染和分析场景里的物理规律,例如当开发者输入不同指令,“变成夜晚都市高峰期的路况”、“测试车辆左边加一辆要左转的车”、“前面的摩托车闯红灯”等,Cosmos生成“花式路况”让AI不断学习升级——有点”自产自销“的意思。
老黄说,构建机器人系统得要三台计算机。一个用来训练,和一个用来部署,还有一个得把前面两个连接起来,这就是Omniverse和Cosmos这套组合拳的意义,用合成数据去训练模型,给机器人系统提供仿真环境不停做测试。
当然,机器人系统可以是自动驾驶汽车,更可以是“机器人”。
欢迎老黄的朋友们。
可恶,被他装到了
一排十几个人形机器人,从台下依次升起。几次颇为寂静和稀稀拉拉的掌声后,场内终于一片叫好。Isaac GR00T 是人形机器人通用基础模型,在最新版本里,开发者头戴 Vision Pro 拍摄第一人称视频,来教机器人怎么识别物理空间,怎么做出自然动作。
全球最小的个人超算
当老黄“举”着Blackwell NVLink72样品上台时,不知道是“美国队长”的造型不太适合他,还是产品使用离用户太远,反正,老黄看起来没收到想象中的喝彩声。
不是,你AI队长啊?
NVLink72 能将模型训练成本降低三倍,配备了72个Blackwell GPU、1.4 exaFLOPS算力和130万亿个晶体管,能满足几乎所有数据中心的需求。
AI将会持续scale(不管以哪种方式),是英伟达推出NVlink72的原因。
一切都要从DGX-1(首个专为深度学习而设计的系统)说起。2016年,黄把第一台DGX-1送给了OpenAI和马斯克,坊间到处流传着那张照片。
“那台机器要是能小点儿就好了”,话音刚落,Keynote 里的样机成倍缩小,全球最小的个人 AI 超级计算机 Projects Digits 登场。
可恶,又被他装到了
Projects Digits,巴掌大的超级计算机,和一本新华词典差不多的体积下,配备 128 GB 统一内存和 4TB 的 NVMe 存储,还搭载了 GB10 Grace Blackwell 芯片,本地就能跑 2000 亿参数的大模型,这算力还不够的话,可以买两台连接达到 4050 亿参数的模型(刚好符合 Meta 最新的 Llama-3.1 最大尺寸模型参数量)。
标准电源插座就能带动 Projects Digits ,用户基于自己的桌面系统就能开发和测试模型,而且都基于 Blackwell 架构,开发者还能在英伟达的云端或数据中心上无缝部署模型。
相当于电费、服务器、硬件成本,甚至占用空间都给你省出来了。不过 Projects Digits 也不算便宜,起售价 3000 美元(约人民币 22000 元),5 月正式上市。
至此,关于新品介绍完毕。
现场偶有冷场发生,并不是老黄不够幽默。而是CES本是一个消费硬件扎堆的“大联欢”,而英伟达的发布会重心明显从消费级产品,转向行业解决方案,如果你细心,就能看到每个产品后的keynote上列出的满满“友商”。
而面向AI时代的硬件,将AI催生的生产力再向上推高一个台阶,或许也是这一届CES的主旋律。