一年一度的“AI春晚”来了,北京时间3月19日凌晨,英伟达CEO黄仁勋出现在2025 GTC开幕主题演讲的舞台上,一上台,他说:“今天是人工智能的超级碗(Super Bowl),区别是,每个人都能获胜,都是赢家。”
赢家有大有小,黄仁勋属于大赢家,在AI时代,他成了创业者膜拜的CEO,英伟达一度成了世界上市值最高的公司。
只是世界上没有永远的赢家。
2025年1月,来自中国的DeepSeek公司开源R1模型,用少量英伟达芯片就实现了堪比OpenAI o1的推理能力,一度让英伟达市值跌去6000亿美元。
所以,在当天的圣何塞主场,黄仁勋至少提到了5次“R1模型”,但未提及DeepSeek的公司名称。
看起来,当晚更像是黄仁勋的一次答卷,出题人是DeepSeek以及模仿DeepSeek方式来征服AGI的大公司,比如Meta的创始人扎克伯格说,Meta将继续学习DeepSeek等技术,并发布自己的开源免费Llama AI模型,这也能推动行业发展。
此前的2024年,美国前四大云厂累计采购130万颗Hopper架构芯片,2025年,这一数据预计还会飙升。他们将采购360万颗Blackwell GPU。黄仁勋预计,2030年以前,英伟达的数据中心的建设将达到1万亿美元。
算力是永恒需求,并且需求会越来越大,这是黄仁勋构筑的图景。黄仁勋一会儿像一个教授,预测AI的需求曲线,一会儿像抖音直播间的主播。他在演讲中从省电费开始算起,不断推销这样一个理念:“买得越多,省得越多,甚至,买得越多,赚得就越多。”
《中国企业家》询问DeepSeek,“满分100分,给黄仁勋在2025 GTC的主题演讲打分”,DeepSeek给出了“85分”,DeepSeek解释说,在技术深度和前瞻性上拿到了40分,但在商业转化和演讲内容呈现这两项,扣去了15分。
截至3月19日美股收盘,英伟达股价为115.43美元,比前一交易日跌去3.43%,总市值为2.82万亿美元,今年前3个月,英伟达股价曾达到153美元的高点,以3月19日为基准,已跌去24.5%。
在黄仁勋勾勒的世界里,在AI时代,英伟达GPU硬件以及之上的软件生态,是像空气、水、电一样的AI基础设施。
世界AI的重心,正在从预训练转向推理。训练大模型被证明是“大力出奇迹”的结果,是典型的Scaling Law(尺度法则)。黄仁勋在演讲中自证,在推理阶段,推理大模型更需要GPU,更需要英伟达。
他说,在计算机科学和数据工厂里,延迟、响应、时间和吞吐量之间存在根本的紧张关系。“一方面,你希望服务客户的质量尽可能好,聪明的AI是速度超级快的。另一方面,你试图让数据中心为尽可能多的人生产token,这样你的收入可以最大化”。
最优解是拥有一台计算速度快,内存大以及支撑大模型数据调用的GPU和服务器,黄仁勋可以提供这些。
重头戏是硬件产品的更新,黄仁勋公布了英伟达GPU生态的路线图。
在2024年Blackwell芯片架构基础上,英伟达发布了GB300超级芯片——Blackwell Ultra芯片,并推出Blackwell Ultra NVL72平台,预计在今年下半年出货,它的带宽是前代GB200的两倍,内存速度是前代的1.5倍。
以满血版671B参数DeepSeek-R1为例,基于H100产品可实现每秒100 tokens,而采用Blackwell Ultra NVL72方案,可以达到每秒1000 tokens,这意味着用户的需求可以更快得到响应。
此外,英伟达公布了路线图,下一次芯片升级是Vera Rubin,Vera Rubin将于2026年下半年推出,Vera Rubin NVLink 144的性能将是Blackwell Ultra NVL72的3.3倍。
这样激进的技术宣言很符合黄仁勋的风格,每年进行一次架构更新,每两年进行一次整体架构升级,每年推出一条新的产品线,实现X因素的提升。
此外,黄仁勋还宣布英伟达发布两款AI电脑,分别名为DGX Spark和DGX Station,称它们是“AI时代的计算机”。这两款电脑都使用Blackwell架构的芯片。DGX Spark外形类似Mac mini,DGX Station则是体积更大,它们将能够运行诸如Llama或DeepSeek等大模型。
在主题演讲中,黄仁勋重点提及了英伟达的CUDA生态以及各类软件栈,这些软件栈可以有效提升硬件性能,加速计算,比如一个名为cuDSS的稀疏求解器,它实现了EDA和CAE库的加速。
他还发布了一款用于加速和扩展AI工厂中AI推理模型的开源软件NVIDIA Dynamo,黄仁勋指出,“它本质上是AI工厂的操作系统”。通过Dynamo,可以让DeepSeek等推理模型,在相同架构和使用相同数量GPU的条件下,将性能提升30倍。
AI的下一个阶段则是Agent AI,不仅能说、能答,而且还能提供解决问题的决策和行动,比如机器人。
黄仁勋展示了一个名为“Blue”的机器人,并与之互动,这是英伟达与Google DeepMind、迪士尼合作开发名为Newton的机器人平台成果之一,此外,英伟达推出了专为机器人设计的通用基础模型GR00T N1。这是世界上第一个开放、完全可定制的通用人形推理和技能基础模型。
今年,英伟达的朋友圈更多向美国本土公司开放,黄仁勋展示了和通用汽车在自动驾驶方面的合作,与迪士尼研究公司和谷歌DeepMind合作创造的机器人,还计划与海外众多运营厂商开发AI原生6G网络。
黄仁勋的主题演讲中,来自中国玩家的展示变少了。在2024年的GTC主题演讲中,黄仁勋展示了与腾讯的游戏合作,展示了宇树科技和小鹏鹏行等机器人公司的产品。
但有一家中国公司,黄仁勋至少提到了5次,那就是R1模型,但关于其母公司DeepSeek,“皮衣教主”绝口不提。
这是因为DeepSeek正在引发美国从商界到政界的震动。
比如OpenAI CEO奥尔特曼向美国政府提交了一份报告,报告指控DeepSeek“非法抓取1.2万亿网页”,同时还建议特朗普政府建立“三级许可制度”,允许美国盟友使用美国AI技术,同时限制中国等国使用。
难怪Meta首席科学家杨立昆在社交平台上说:“OpenAI的指控暴露了封闭模式的傲慢。”
对于AGI的前景,OpenAI以及奥尔特曼都在说没那么快,需要降低预期,微软CEO纳德拉说,“我们自己宣称达成某个AGI的里程碑,对我来说,那只是一些无意义的基准修改。真正的基准是:全球经济增长10%。”
目前,英伟达正在马力全开,Blackwell已全面投入生产,黄仁勋笑称“这可能会影响Hopper(H100和GH200)系列芯片的销售,但这就是技术的发展”。
对于中国的大公司而言,只能戴着镣铐起舞。
来自中国的互联网大公司得不到H100,更遑论Blackwell的GB200和GB300了,它们只能大量购入H20,这是一款阉割版的H100,H20的GPU核心数量比H100减少了41%,性能降低了28%。
据《财经》杂志报道,腾讯正在加速大模型应用的推进,近期已经向英伟达采购一批新的AI芯片,订单金额约合几十亿元量级。
在2025年初,腾讯积极接入DeepSeek的R1大模型,并让搜一搜、腾讯元宝等产品接入,这让本地的算力需求急剧提升。