在数学推理领域,大型语言模型遭遇重大挑战。在最近的美国数学奥赛中,顶级AI模型得分不足5%,这一结果由ETH Zurich等机构的MathArena团队揭示。3月26日,该研究发布后引发广泛讨论,彻底打破了AI擅长解决数学题的认知神话。