1.爆特斯拉Optimus机器人发布会上受人工操控;
2.马斯克团队19天安装10万个英伟达H200 GPU,黄仁勋:通常需4年时间;
3.英伟达DGX B200 AI服务器上市,顶级AI硬件起售价50万美元;
4.人工智能初创公司Writer正在筹资,推出新模式与OpenAI竞争;
5.英伟达年度研发费用超120亿美元,是AMD的两倍;
6.每日万亿次验证!新思科技HAPS赋能SiFive;
1.爆特斯拉Optimus机器人发布会上受人工操控;
近日,有知情人士透露,在上周的特斯拉“WE,ROBOT”活动上,特斯拉远程操控了Optimus人形机器人的一些功能,以更好展示其产品。知情人士称,发布会当天其他地方的特斯拉员工远程监督了许多Optimus与来宾们之间的互动,其实并没有展示出来的那么智能。
当日发布会上,20余台Optimus列队在人群中穿过,5台Optimus人形机器人在舞台上集体舞蹈,灵活的动作和稳健的步伐引得现场掌声阵阵;一台精致着装的Optimus化身“服务员”在发布会后的参观活动中提供酒水服务——娴熟地拿起杯子接满鸡尾酒并递送给对面的客人。
马斯克在发布会上对人形机器人极尽赞美。他表示,人形机器人Optimus用途丰富——不仅可以遛狗、修剪草坪、照看老人和孩子,还可以成为工厂的工人、人们的老师和朋友。
一直以来,马斯克高度推崇发展人形机器人,他曾多次表示“未来特斯拉的长期价值,大部分体现在人形机器人——擎天柱(Optimus)上。”马斯克甚至还预言未来人类和机器人的数量比例为2:1,人形机器人的需求将达到100亿至200亿台,远超过电动汽车。
(校对/黄仁贵)
2.马斯克团队19天安装10万个英伟达H200 GPU,黄仁勋:通常需4年时间;
埃隆·马斯克(Elon Musk)和xAI背后的团队创造了一个工程奇迹,在19天的时间里建立了一个由10万个英伟达H200 Blackwell GPU组成的超级集群。英伟达CEO黄仁勋在X平台上与特斯拉车主硅谷的成员们讲述了埃隆·马斯克令人难以置信的安装能力。
黄仁勋以敬畏和尊重的口吻描述了马斯克19天的冒险之旅,称其为“超人”。据称,xAI团队从“概念”阶段到完全兼容英伟达的“装备”,只用了不到三周的时间。这其中还包括在新建的超级集群上进行xAI的首次人工智能(AI)训练运行。
从开始到结束,整个过程包括建造GPU所在的大型X工厂,并为整个工厂配备液冷和电源,使所有20万个GPU都能正常运行。更不用说英伟达和马斯克的工程团队之间的所有协调工作,以确保所有硬件和基础设施以协调的方式精确运输和安装。
从这个角度来看,黄仁勋表示,一个普通的数据中心需要四年的时间才能完成马斯克和他的团队在19天内完成的工作。其中三年的时间将用于规划,而最后一年将用于运输设备、安装设备并使其全部投入使用。
黄仁勋还详细介绍了英伟达硬件联网的复杂程度。他解释说,英伟达设备的联网与传统数据中心服务器的联网不同。
马斯克整合10万个H200 GPU的做法可谓是“前无古人”,可能不会再有其他公司复制,至少在很长一段时间内不会。(校对/张杰)
3.英伟达DGX B200 AI服务器上市,顶级AI硬件起售价50万美元;
英伟达的DGX B200“Blackwell”AI服务器已由服务器解决方案提供商Broadberry在线列出,价格相当惊人。英伟达的下一代Blackwell AI架构引起了业界的关注,主要是因为据说该平台具有市场过去从未见过的性能。
不仅英伟达CEO黄仁勋对Blackwell大加赞赏,而且它也被微软和Meta等主流科技巨头迅速采用,表明英伟达的新AI产品组合已准备好颠覆市场。有趣的是,Broadberry列出了Blackwell DGX B200 AI系统,起售价约50万美元,令人感到惊讶。
英伟达打算销售多个Blackwell AI系统,但针对更广泛市场的产品是DGX B200。每台DGX B200采用8块B200 GPU,可提供高达1.4TB的GPU内存,HBM3E内存带宽高达64TB/s。
根据英伟达提供的信息,DGX B200可提供高达72 petaFLOPS的训练性能和144 petaFLOPS的推理性能,与Hopper一代相比,这是巨大的升级。
DGX B200系统全部规格包括:内置8个英伟达Blackwell GPU,GPU内存总计1440GB,64TB/s HBM3e带宽,72 petaFLOPS FP8训练性能和144 petaFLOPS FP4推理性能,英伟达网络,英伟达DGX BasePOD和英伟达DGX SuperPOD的基础,包括英伟达AI Enterprise和英伟达Base Command软件。
Broadberry上的列表为Blackwell DGX B200 AI系统标价515410.43美元,还有配置选项,主要涉及售后服务。据说Blackwell最初将受到限制,大部分出货量定于明年第一季度。
最近,英伟达向OpenAI交付了首批DGX B200 AI系统,表明两家公司之间存在独家合作关系。无论如何,英伟达的Blackwell将迎来“AI淘金热”的新时代,预计最终引领下一代架构成为英伟达最成功的产品。(校对/张杰)
4.人工智能初创公司Writer正在筹资,推出新模式与OpenAI竞争;
总部位于旧金山的人工智能初创公司Writer周三首次推出大型人工智能模型,与OpenAI、Anthropic等公司的企业级产品展开竞争。但与其中一些竞争对手不同的是,它不需要花费那么多钱来训练自己的人工智能。
该公司提到,它花费了约70万美元来训练最新的模型,包括数据和GPU,而竞争对手的初创公司则花费了数百万美元来建立自己的模型。该公司的策略引起了投资者的注意。
据一位熟悉情况的人士接受采访时透露,Writer正在以19亿美元的估值筹集最多2亿美元的资金。这几乎是该公司2023年9月估值的四倍,当时该公司以超过5亿美元的估值融资1亿美元。
该公司利用合成数据或人工智能创建的数据削减成本。它旨在模拟现实世界的信息,这些信息通常被输入到模型中,同时又不损害隐私,正在成为一种更受欢迎的训练方法。
人工智能研究人员在6月份修订的一项研究发现,如果目前的人工智能发展趋势继续下去,科技公司将在2026年至2032年间“完全耗尽”公开可用的训练数据,并写道:“人类生成的公共文本数据无法在这十年之后继续扩展。”
亚马逊在训练Alexa时使用了合成数据,Meta在微调其Llama模型时使用了合成数据,而根据该公司发布的职位描述,微软支持的OpenAI正在将合成数据纳入其模型。
不过,一些专家警告说,合成数据应谨慎使用,因为它有可能降低模型性能,加剧现有偏差。
Writer的联合创始人兼首席技术官Waseem Alshikh提到,Writer多年来一直在开发合成数据管道。
“业内对‘合成’数据的定义有些混淆。”Alshikh说,“明确地说,我们不会用虚假或幻想的数据来训练我们的模型,也不会用模型来生成随机数据......我们采用真实的事实数据,并将其转换为合成数据,这些数据以更清晰、更简洁的方式进行专门的结构化,以便进行模型训练。”
该公司的生成式人工智能允许企业客户使用其大型语言模型(或LLM),为从领英(LinkedIn)帖子到职位描述再到任务说明等任何内容生成人声文本,分析和总结数据或文本,并为市场分析等建立定制的人工智能应用。该公司拥有250多家企业客户,其中包括埃森哲、优步、Salesforce、欧莱雅和Vanguard,他们在支持、IT、运营、销售和营销等领域使用该技术。
生成式人工智能市场有望在十年内突破1万亿美元的收入。根据PitchBook的数据,到2024年为止,投资者已向498笔生成式人工智能交易注入了268亿美元,该领域的公司在2023年筹集了259亿美元,比2022年增长了200%以上。
5.英伟达年度研发费用超120亿美元,是AMD的两倍;
研发(R&D)费用是未来收入增长的最高质量指标之一。鉴于英伟达(NVIDIA)对未来几个季度营收的预期不断提高,因此在研发指标方面,英伟达绝对领先于包括AMD在内的同行,这一点也不足为奇。
截至7月底的季度,英伟达的研发支出为30.9亿美元。将这一数字按年计算,这家GPU制造商在前一个季度和未来三个季度的累计(可能)研发指标为123.6亿美元。
相比之下,AMD在截至6月底的季度中支出的研发费用为15.93亿美元。将这一数字按年计算,则该公司前一个季度和未来三个季度的累计(可能)研发指标为63.72亿美元。
换句话说,根据目前的年化预测,英伟达目前的年度研发投入约为AMD的2倍。这与2013年的情况大相径庭,当时两家公司在各自研发活动中的投入几乎完全相同。然而,从那时起,英伟达就不断加大对研发的投入,现在正享受着这些投资带来的成果。
更重要的是,AMD不得不在CPU、GPU和FPGA部门之间分配研发资源。相比之下,英伟达正将越来越多的资源用于构建人工智能(AI)机架,这只会进一步巩固这家GPU制造商在这一竞争激烈的领域的领先地位。
William Blair认为,英伟达2025财年的营收将高达1100亿美元。而该公司2023财年的收入仅为270亿美元。
要知道,英伟达GB200 CPU+GPU组合目前售价在6万~7万美元之间,而单台英伟达B100 AI加速器的价格则在3万~3.5万美元之间。更重要的是,该公司的72款芯片AI机架目前售价在200万~300万美元之间。
英伟达CEO黄仁勋最近在接受采访时断言,在未来4到5年内,现有数据中心将需要价值约1万亿美元的GPU,以适应不断变化的需求环境,从而实现现代化。(校对/张杰)
6.每日万亿次验证!新思科技HAPS赋能SiFive;
原文标题:每天一万亿次验证周期:新思科技HAPS助力SiFive满足不同各户的RISC-V设计需求
生成式人工智能、物联网等领域正蓬勃发展,对先进RISC-V内核IP的需求也迅速攀升。技术发展日益以软件为驱动力,行业已经从“先硬件后软件”模式转变为“以应用为主导”的新范式,尤其是在人工智能领域,大型语言模型正扮演关键角色。这一转变使包含高度可配置指令集架构(ISA)的RISC-V得到了行业青睐。
这种灵活性非常关键,可以让开发者根据特定的软件需求定制指令集,从而优化执行、功耗和带宽。为满足日益增长的需求,由新思科技、SiFive等组成的强大半导体公司生态系统正积极开发RISC-VIP内核。该生态系统提供一系列产品,帮助客户自行构建RISC-V实现方案,通过定制指令集确保特定应用实现优异性能。RISC-V内核的微调和适应能力在多个细分市场中表现出显著优势。
虽然人工智能是RISC-V普及的主要驱动因素,但其应用已扩展到面向多种不同产品的通用处理器,甚至是64位处理器。通用处理器市场面临激烈竞争,RISC-VIP提供商正与老牌厂商展开正面交锋。这种竞争不仅推动了创新,也为客户提供了更多处理器IP选项,最终促进了整个行业的发展。
SiFive提供了广泛的RISC-V核心IP产品组合,涵盖了简单的嵌入式微控制器到高端64位应用处理器内核。在本文中,我们将围绕SiFive产品组合、新思科技HAPS原型验证系统展开讨论,并介绍双方如何共同实现每天一万亿次验证周期。
SiFive的先进RISC-V处理器产品组合
在开发和验证领域,速度至关重要。因此,SiFive设计了一个创新开发环境,能够快速制作满足客户特定需求的CPU,并为每款CPU开发了配套编译器。然而,面对如此庞大而多样化的产品组合,验证和软件确认构成了重大挑战。
SiFive开发经理 Rajesh Ramalingam Varadharajan 表示,SiFive独特的设计方法使我们能够构建出色的RISC-V产品组合,为客户提供广泛的产品和选项。客户的产品质量要求很高,因此在确保产品可投入生产方面,我们必须高度重视验证和确认工作。我们使用FPGA原型验证进行各种验证任务,包括功能验证、回归测试和整个软件堆栈的全面验证。我们的每个RISC-V IP都在Linux操作系统的真实软件工作负载下经过了大量测试。
为了解决超快速验证的需求,SiFive选择了新思科技HAPS原型验证系统,其市场主力型号HAPS-100 4F配备了四个FPGA,可以独立配置为一个、两个或四个FPGA使用。例如,仅为小型RISC-VIP配置一两个FPGA,而为较大型RISC-V IP配置四个FPGA。
目前,SiFive使用了数十个HAPS-100 4F单元,每个单元包含四个FPGA,每个FPGA每天可以执行大约8640亿个周期,这意味着SiFive的带宽达到每天数万亿个周期。这进而使其能够支持多种配置,满足各类客户的不同RISC-V设计需求。
RISC-V编译验证和认证
除了RISC-V内核的设计工作之外,SiFive还致力于为每个RISC-V架构开发软件编译器。他们利用HAPS进行功能验证、软件验证和RISC-V性能认证。
在开发早期阶段,对于基于Imperas技术(现已成为新思科技旗下品牌)的快速处理器等虚拟RISC-V模型来说,虽然在虚拟环境中运行也很有价值,但编译软件开发阶段要求准确表示CPU,而这只能通过RTL描述来实现。经多方面验证,HAPS原型验证系统成为了快速执行RTL代码的理想平台。SiFive广泛使用HAPS原型验证系统对其RISC-V内核进行全面测试,以满足Brython、SPEC等CPU基准测试的要求,确保其性能符合认证标准。
最后,HAPS支持在编译期间插入调试探针。SiFive利用这一功能,在操作系统运行过程中识别和调试功能故障,通过策略性地部署断言以在特定事件发生时触发,并捕获样本以分析潜在问题。这种方法比使用RTL仿真的速度更快。虽然新思科技VCS等RTL仿真很适合检测功能错误,但对于此场景而言,操作系统启动时间太长了。HAPS原型验证系统则可以满足对执行速度的基本要求。
RISC-V内核IP的未来
现代软件应用(尤其是人工智能)的需求不断发展,推动了对先进的RISC-V内核IP和快速芯片验证解决方案的需求。RISC-V的灵活性和可配置性使其成为优化各种应用性能的理想选择。
对于大量不同内核的IP验证和软件验证问题,可利用可扩展原型平台加以解决。凭借超快速表现,新思科技基于FPGA的HAPS平台帮助SiFive取得了成功,执行了数万亿次验证周期,最终实现了高投资回报率。即将推出的新一代RISC-V内核将比前代产品更庞大、更复杂,原型设计需求也将随之增加,以应对可能出现的大量错误和相应的测试周期需求。为解决这种复杂性,SiFive将连接多个HAPS平台,满足在更复杂的RISC-V内核上运行验证周期的需求。
凭借强大的IP提供商生态系统,在竞争激烈的市场格局下,RISC-V有望保持增长势头并推动技术领域持续创新。新思科技将携手SiFive及更多客户,继续加速突破RISC-V技术极限。