微软 CEO 纳德拉评 DeepSeek:令人印象深刻,计算效率非常高
3 天前 / 阅读约2分钟
来源:IT之家
“DeepSeek的新模型令人印象深刻,尤其是在如何高效开发开源模型并进行推理计算方面,它的计算效率非常出色。我们应当非常认真地对待来自中国的这些技术进展。”

IT之家 1 月 27 日消息,据 CNBC 报道,微软首席执行官萨提亚・纳德拉在瑞士达沃斯的世界经济论坛上表示:“DeepSeek 的新模型令人印象深刻,尤其是在如何高效开发开源模型并进行推理计算方面,它的计算效率非常出色。我们应当非常、非常认真地对待来自中国的这些技术进展。”

近期,DeepSeek-R1 跻身大模型竞技榜前三,以开源、便宜 20 倍的“身价”与 ChatGPT-4o(2024.11.20)并列。综合IT之家此前报道,本月亦有消息称 Facebook 母公司 Meta 成立了四个专门研究小组来研究 DeepSeek 的工作原理,并基于此来改进旗下大模型 Llama。

1 月 20 日,DeepSeek-R1 推理大模型正式发布。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

不仅如此,今日 Deepseek 应用已登顶苹果中国地区和美国地区应用商店免费 App 下载排行榜,在美区下载榜上超越了 ChatGPT。