根据各公司公开披露的资本支出、服务器出货量和供应链情报,Omdia估计了大致数额
根据技术咨询公司Omdia的分析师估计,微软今年购买了48.5万块英伟达Hopper芯片,位列全球GPU买家的TOP 1。
这就使微软远远领先于英伟达的第二大美国客户——购买了22.4万块Hopper芯片的Meta。
在Meta之后的,就是xAI、亚马逊(19.6万块)和Google(16.9万块)。
而且,Hopper的下一代GPU Blackwell马上就要来了,英伟达还能大赚一波。
总之,随着全球大科技公司疯狂囤GPU,争相组装越来越大的GPU集群,英伟达的市值今年已经飙涨至3万亿美元。
这不,xAI已经开心晒出了首批发货的英伟达GB200 NVL72,Colossus这个世界上最大的超算集群,会变成更大的庞然巨物。
感觉xAI都要笑出声来了:“xAI的Colossus提前过圣诞啰”
可以看到,11月18日,戴尔创始人兼CEO Michael Dell就表示:世界上第一个英伟达GB200 NVL72服务器机架现已发货。AI火箭要起飞了!
不过,只要有最好的芯片,就一定能构建最好的AI基础设施呢?其实未必。
微软Azure全球基础设施高级总监Alistair Speirs表示,除此之外,还需要搭配合适的存储组件、基础设施、软件层、主机管理层、错误纠正功能,以及构建完整系统所需的各项组件。
比如坐拥全球最强超算的Grok——虽然有不少测试指出它的表现十分出色,但依然经常被网友泼冷水说:拥有世界上数量最多的GPU,并不意味着你的模型就更好。
但是来不及解释了,全世界的GPU购买潮已经到了最高峰,所有巨头心里想的只有一句话——快上车!
微软,全球最大英伟达GPU买家
过去两年里,英伟达最先进的GPU一直供不应求,而在CEO纳德拉的指示下,微软可谓是卯足了全力!
从Omdia的数据中可以看出,微软今年买了将近50万块GPU,数量是竞争对手的2倍之多。与此同时,也坐稳了投资金额榜一的位置。
为了扩建数据中心基础设施,微软已向OpenAI投资130亿美元。这些设施既用于运行Copilot等自身的AI服务,也会通过Azure租给客户。
OpenAI最新的o1模型,就是用微软的Azure云基础设施训练的。联手的这两方,正在和强势回归的Google、Anthropic、xAI等公司,激烈争夺着下一代计算技术的制高点。
ChatGPT的成功,让英伟达连夜加紧扩大Hopper芯片的生产。
而相比2023年购入的同代英伟达AI处理器,微软这次订购的数量增加了两倍多。
根据微软Azure全球基础设施高级总监Alistair Speirs的说法,如今高质量的数据中心基础设施,已经变成了极其复杂的“资本密集型项目”。
这需要多年规划。因此,准确预测增长需求并保持适当的缓冲余量至关重要。
的确,现在英伟达GPU已经成为硅谷最热门的硬通货,引发了前所未有的AI投资大暴增。
据Omdia预计,2024年服务器支出中,约有43%投向了英伟达。
其中,数据中心基础设施的前十大买家(现包括新晋的xAI和CoreWeave在内),占据了全球计算能力投资的60%。
而全球科技公司在服务器上的支出,则将达到2,290亿美元这一惊人数字——微软为310亿美元,亚马逊为260亿美元。
Omdia云计算和数据中心研究主管Vlad Galabov表示:“英伟达GPU在服务器资本支出中占据了极高份额,已接近峰值水平。”
异军突起,挑战英伟达霸主
不过,英伟达也不能笑得太早。
虽然目前它仍主导着AI芯片市场,但它的老对手AMD也一直在对这块市场虎视眈眈。
目前,AMD已取得了突破性进展。据Omdia统计,Meta今年采购了17.3万块AMD MI300芯片,微软也购入了9.6万块。
更值得注意的是,各大科技巨头纷纷极速布局自研AI芯片,降低对英伟达的依赖程度。
作为先行者,Google潜心研发十年TPU;Meta在去年首次推出第一代训推加速器芯片。
他们分别部署了约150块自研芯片。
另有,全球最大云计算服务巨头亚马逊,在AI芯片领域的动作引人注目。
目前,亚马逊自研的Trainium和Inferentia芯片,今年已经部署约130万块。
几周前,他们官宣将使用数十万块最新Trainium芯片搭建超算集群,主要是向投资了80亿美金的Anthropic提供算力支持,用来训练下一代模型。
相较之下,微软在AI加速器研发方面,还处于起步阶段。,一共部署了20万块Maia芯片。
在这之中,针对GoogleTPU芯片的需求,增长最快。甚至,强劲到足以撼动英伟达GPU的主导市场地位。
在Broadcom第三季度业绩报告中,提供了一些重要的线索。
作为Google、Meta等多家科技巨头的供应商,Broadcom为他们提供了半导体解决方案,其内部数据揭示了一些鲜为人知的采购趋势和信息。
比如,Google购买了多少块定制处理器等等。
Broadcom CEO陈福阳多次上调了半导体收入,并将今年目标设定在120亿美金。
基于此,GoogleTPU带来的收入预计在60亿-90亿美元之间,具体还得取决于计算设备和网络设备的配比。
Omdia首席分析师Alexander Harrowell指出,“尽管计算设备和网络设备的具体比例存在一些不确定性,但即使按照较低的60亿美元估计,TPU出货量的增长速度也足以首次从英伟达手中抢占市场份额”。
他继续道,“Google云业务在总收入中占比持续增长,盈利也在不断提升”。
这背后,很可能就是TPU加速实例和基于TPU的AI产品在发挥作用。
除了Google,Broadcom还在为Meta、字节这三个主要客户开发定制AI芯片(ASIC)。并且,它还与与另外两个客户合作开发下一代AIXPU。
从这点可以看出,许多云服务提供商青睐ASIC,而非英伟达GPU,主要是因为前者在成本效益上更具优势,能够以更高性价比优化内部工作负载。
摩根士丹利估计,在云服务提供商推动下,定制AI芯片市场规模将从2024年的1200亿美元,增长到2027年的3000亿美元,增速将超过GPU市场。
TPU、定制芯片的崛起,让激烈的AI芯片市场的竞争格局正发生深刻变化。