黄仁勋需要让英伟达再次伟大
8 小时前 / 阅读约8分钟
来源:36kr
捍卫三万亿

比起去年把Transformer八子、OpenAI、xAI等明星企业攒到一起,今年的英伟达GTC似乎狂热稍减。

但这并不影响黄仁勋的AI叙事,在美国加州圣何塞,「英伟达绿」依旧是科技圈的符号。除了现场超2万人的围观,成千上万的人在线观看黄仁勋的主题演讲,他说了什么、英伟达会干什么,这些都会成为人们判断AI时代的依据。

不过,比起预测未来,今年GTC,黄仁勋可能干的最多的是重复和反驳——比如「买得越多,省得越多,甚至比这更好——买得越多,赚得越多」,这是经典的黄式定律,再比如「几乎全世界都误解了Scaling Law放缓」。

也许是这些重复叙事,没能带来更多的效果,对于英伟达GTC大会发布的一系列产品,华尔街的态度反响平平,英伟达盘后股价下跌了约4%。

我们整理出这届GTC黄仁勋最想对市场说的三个关键真相。

1、53次token,捍卫Scaling Law的信仰

黄仁勋演讲里有个隐秘的主题——tokens,他在自己的演讲里至少提到了53次。

如此反复强调tokens,某种程度上黄仁勋在说Scaling Law没有终结,源源不断的tokens消耗,就能带来持续的算力需求,这是英伟达讲述一切增长的前提。

他给出一组数据,随着Agentic AI和推理能力的发展,目前所需的计算量是过去的至少100倍。

给予黄仁勋信心的是英伟达GPU的下游应用场景——主要包括数据中心、汽车领域、机器人等,科技巨头、云厂商和算力租赁服务商都会大笔采购英伟达的先进芯片建设AI基建。

黄仁勋曾这样形容:“英伟达不造芯片,英伟达造数据中心”。

遵循这一认知,黄仁勋公布了一组数据,2024年,美国Top4云公司总计采购了130万颗Hopper架构GPU,到了2025年,这一数据飙升至360万颗Blackwell GPU,他预计数据中心建设的价值将达到1万亿美元。

面向这些云厂商等企业端客户,英伟达主要出售的是包括AI服务器、高速交换机等AI算力集群服务,英伟达所提供的是系统和网络、硬件和软件等方案。

与此前的AI服务器GB200 NVL72一样,英伟达公布了新产品:Blackwell Ultra NVL72机柜,黄仁勋特别强调这是「AI推理专用机柜」。

天风证券分析师郭明錤曾提到,影响英伟达AI服务器增长的一个重要因素是,它能否提供算力更强且平均token成本更低的Scale-up?

至少从英伟达提供的数据来看,黄仁勋已想到了这一点:相比前一代产品GB200 NVL72,带宽是前代的两倍,内存速度是前代的1.5倍,同时由于因机柜尺寸和电源规格相似,这对科技公司的数据中心升级而言,有着一定的性价比优势。

不过黄仁勋没说的是,英伟达数据中心业务的暴涨年代已经过去了。单从财报看,英伟达数据中心业务已结束了六个季度以来连续保持的「三位数高增」,环比下降趋势也十分显著。

郭明錤还提到,英伟达数据中心业务目前存在的问题是「量产的能见度不高」,英伟达需要更多具体列举数据中心部署GB200 NVL72的案例,以及客户转换到新产品的具体效益情况。

2、下一代芯片:黄式定律能否有效?

除去行业宏观层面,对Scaling Law的展望,过去的几个小时里,花费1万美金购票入场的技术信徒们,还在期待另一个问题的答案:

“黄氏定律”能否延续。

作为英伟达首席科学家所提出的,对后摩尔定律时代的重要补充,黄氏定律表明:GPU架构、软件的革新将推动AI性能实现每年翻倍。

如果说Scaling Law关注的是“行业需不需要更多GPU”,那么黄氏定律所传达的内容则更为直观——行业需不需要英伟达。

尽管从目前的市场趋势来看,Blackwell取得了远超于Hopper架构GPU的市场成绩,并直接带动了AI领域基建的新一轮繁荣,参考黄仁勋本人的说法:“Blackwell开始出货的一年内,你能看到人工智能基础设施建设出现了难以置信的增长。”

但股价的下跌还是侧面传递出了市场的不满情绪。

这一不满情绪的源头,很大程度上来自于年度算力“核弹”——Blackwell Ultra GB300的不佳表现。

这颗被外界寄予厚望的芯片,并未能重现Blackwell架构横空出世时的惊艳感,反而更像是上一代芯片的内存“超大杯”版本。

虽然黄仁勋并未对比两代Blackwell产品间的性能差异。但根据此前英伟达官方透露的信息显示,单个Ultra芯片将提供与Blackwell相同的20 petaflops的AI性能,HBM3e内存从192GB升级到了现在的288GB。

似乎是为了补救现场用户的失望感,老黄直接趁势预告了明年上市的新一代Rubin架构GPU,并表示,新一代GPU的性能预计是Blackwell Ultra NVL72的3.3倍。

但很显然,这种画饼行为并没有得到市场的认可。原因也很简单,想象一下库克在苹果发布会上掏出一部4TB版本的iPhone16告诉大家,这就是本届发布会的新品,顺便再吹一波iPhone18的性能——对比往期发布会上的遥遥领先,至少在今年,黄氏定律在硬件侧,短暂按下了暂停键。

相比之下,软件侧的Nvidia Dynamo,反而成为了黄氏定律续命的关键。

作为业内人士口中,英伟达“在推理领域构建的新CUDA”,Nvidia Dynamo绝对担得起发布会王炸的头衔。

作为一个专为推理、训练和跨整个数据中心加速而构建的开源软件。Dynamo的性能数据相当出色:在NVIDIA Hoppe平台上,软件能够在同样的GPU前提下,将AI工厂的性能和收入提高一倍。而在GB200 NVL72机架集群上运行DeepSeek-R1模型时,生成的token数量更是进一步被提高了30多倍。

从黄仁勋的演讲细节来看,他对这款产品的表现也非常满意,在介绍完相关性能后,他甚至轻松地和现场开启了玩笑:

“这就是我以前为什么说,当Blackwell批量发货时,你不要把Hopper送人。”

3、从DeepSeek到大厂,黄仁勋的「中国朋友圈」

本届GTC,「中国元素」浓度也很高。

长达两个小时的演讲里,句句不离推理的黄仁勋当然会提到DeepSeek,他将DeepSeek R1模型称为「卓越的创新」和「世界级的开源推理模型」。

事实上,在ChatGPT尚未诞生的2022年,幻方AI就受邀在黄仁勋的GTC舞台上演讲。

此次GTC,黄仁勋又秀了一次自己的「中国朋友圈」。

在主题演讲的前一天,GTC特别举办了China AI Day-云与互联网在线中文专场,包括火山引擎、阿里云、百度、蚂蚁集团、京东、美团、快手、百川智能等中国企业分享了其在大语言模型、多模态大语言模型、数据科学和搜推广领域的前沿进展。

大半个中国智驾圈也齐聚GTC,除此以外,据「硅基研究室」不完全统计,联想、比亚迪、文远知行、阿尔特、工业富联、九号公司、完美世界、银河通用等中国企业均相继宣布与英伟达的最新合作。

尽管饱受地缘政治影响,但英伟达始终关注中国市场的一举一动。今年年初的例行中国行中,黄仁勋连续走访了多个中国城市,和中国合作伙伴同桌共饮。

从科技历史来看,三次技术浪潮诞生了三家市值超三万亿美元的公司,他们是微软、苹果和英伟达,随着英伟达成为这个时代最伟大的企业之一,GTC大会已不仅仅只是黄仁勋的个人秀,而是整个AI圈的文化符号。

人们对文化符号自带信仰和高预期,就像华尔街对英伟达的期待一样:人们的恐惧是,如果英伟达也不能讲出新故事了,那么下一个英伟达在哪里呢?