单机即可部署运行 DeepSeek R1 671B 模型，浪潮信息推出元脑 R1 推理服务器 - AI

7 x 24跟踪全球科技动态

热门话题

白天

搜索

资讯

单机即可部署运行 DeepSeek R1 671B 模型，浪潮信息推出元脑 R1 推理服务器

2025-02-12 / 阅读约3分钟

来源：IT之家

DeepSeek 开源了多版本模型，其中，DeepSeek R1 671B 模型作为全参数基础大模型，相比蒸馏模型具有更强的泛化能力、更高的准确性和更好的上下文理解能力，但也对系统显存容量、显存带宽、互连带宽和延迟提出了更高要求。

IT之家 2 月 12 日消息，浪潮信息今日宣布推出元脑 R1 推理服务器，通过系统创新和软硬协同优化，单机即可部署运行 DeepSeek R1 671B 模型。

IT之家注：DeepSeek 开源了多版本模型，其中，DeepSeek R1 671B 模型作为全参数基础大模型，相比蒸馏模型具有更强的泛化能力、更高的准确性和更好的上下文理解能力，但也对系统显存容量、显存带宽、互连带宽和延迟提出了更高要求：

在 FP8 精度下至少需要约 800GB 显存承载，FP16 / BF16 精度下需要 1.4TB 以上的显存空间。

此外，DeepSeek R1 是典型的长思维链模型，具有短输入、长输出的应用特点，推理解码阶段依赖更高的显存带宽和极低的通信延迟。

元脑 R1 推理服务器 NF5688G7 原生搭载 FP8 计算引擎，提供 1128GB HBM3e 显存，满足 671B 模型 FP8 精度下不低于 800GB 显存容量的需求，单机支持全量模型推理情况下，仍保留充足的 KV 缓存空间，该机的显存带宽可达 4.8TB/s。

在通信方面，GPU P2P 带宽达 900GB/s，基于最新推理框架单机可支持 20-30 用户并发。同时，单台 NF5688G7 配备 3200Gbps 无损扩展网络，可根据用户业务需求增长实现敏捷扩展，提供 R1 服务器集群 Turnkey 解决方案。

元脑 R1 推理服务器 NF5868G8 是专为大推理模型（Large Reasoning Model）设计的高吞吐推理服务器，业界首次实现单机支持 16 张标准 PCIe 双宽卡，提供最高 1536GB 显存容量，支持在 FP16 / BF16 精度下单机部署 DeepSeek 671B 模型。

该机采用基于 PCIe Fabric 的 16 卡全互连拓扑，任意两卡 P2P 通信带宽可达 128GB/s，降低通信延迟超 60%。通过软硬协同优化，相较传统 2 机 8 卡 PCIe 机型，NF5868G8 可将 DeepSeek 671B 模型推理性能提升近 40%，目前已支持多元 AI 加速卡选配。

上一篇：放弃Deepseek，苹果将与阿里巴巴合作开发中国版AI功能

下一篇：Perplexity 推出新版 Sonar 搜索模型：1200 Token / s 疾速，比肩前沿模...

返回列表

热文阅读

2 天前

裁员2.2万人！Intel CEO陈立武宣布重大调整：用最少的人完成最多的工作

2 天前

估值160亿，广州半导体独角兽启动IPO

2 天前

韩国科学家开发锡纳米微粒复合阳极让电池充电更快、寿命更长，能量密度提升至 1.5 倍

2 天前

消息称三星 HBM3E 认证遇阻，谷歌 AI 芯片已通知撤换供应商