近日,中国AI初创公司DeepSeek在不到一个月内连续发布DeepSeek-V3和DeepSeek-R1两款大模型,引发全网热议。据塔斯社1月28日报道,俄罗斯外交部长拉夫罗夫称赞中国科学家在AI领域的成就,特别是DeepSeek的出现,已经超越了美国在该领域的研发成果。 DeepSeek-V3和DeepSeek-R1两款模型以其卓越的性能和极低的训练成本,在全球范围内引起了广泛关注。DeepSeek-V3在多项核心指标上已与美国顶尖模型比肩,而DeepSeek-R1则在推理能力上实现了重大突破,其性能超越了包括Meta的Llama在内的多个国际知名模型。同时,DeepSeek的训练成本远低于行业平均水平,这种性能与成本的双重优势,让DeepSeek在全球AI领域声名鹊起。 DeepSeek的成功不仅体现在技术上,更在于其商业模式和创新理念的颠覆性。该公司通过优化算法和分布式训练策略,实现了在有限预算内的性能突破,打破了行业信奉的"算力规模决定论"。这种"精算式创新"为AI行业的发展提供了新的思路和方向,也引发了全球AI领域的深刻反思和变革。