海光信息成功推出国产化适配DeepSeek模型
1 天前

中科曙光国家先进计算产业创新中心昨日宣布,海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的国产化适配,并正式上线。这两款基于Transformer架构的模型,融合了MLA和DeepSeek MoE两大技术,显著降低了内存占用,提升了推理效率,并对模型性能进行了优化。海光DCU是海光信息推出的一款高性能GPGPU架构AI加速卡,已在科教、金融、医疗等多个领域实现规模化应用。用户可在指定平台下载模型,并基于DCU平台部署使用。