OpenAI发布新一代AI模型o3：AGI评测成绩刷新纪录，达到87.5% - AI

7 x 24跟踪全球科技动态

热门话题

白天

搜索

资讯

OpenAI发布新一代AI模型o3：AGI评测成绩刷新纪录，达到87.5%

2 天前 / 阅读约2分钟

来源：集微网

OpenAI最近宣布推出下一代模型o3，包括正式版o3和精简版o3-mini。CEO Sam Altman表示，o3在各方面的表现都明显超过了之前的模型o1，包括编程、数学竞赛和掌握博士级别的自然科学知识等。o3在通用人工智能（AGI）测试中的成绩达到了类人水平。精简版o3-mini在性能与成本平衡方面表现出色。然而，OpenAI可能不会很快将这款新模型推向市场，目前只允许安全研究人员注册访问。

近日，OpenAI在其为期12个工作日的线上新品发布活动的最后一天，宣布推出下一代模型o3，包括一个正式版o3和一个精简版o3-mini。据OpenAI CEO Sam Altman表示，新模型o3是“一个非常、非常聪明的模型”，无论在软件工程、编写代码，还是竞赛数学、掌握人类博士级别的自然科学知识能力方面，o3都明显高出o1一筹。同时，o3在OpenAI实现通用人工智能（AGI）这一奋斗目标上取得了突破，最高的测试成绩达到了类人水平。

今年9月，OpenAI发布的o1预览版在测试化学、物理和生物学专业知识的基准GPQA-diamond上，准确率达到78.3%，超过了人类博士专家的69.7%。然而，新推出的o3模型在同样的测试中，准确率高达87.7%，比o1高将近13%。

此外，o3模型在ARC-AGI评估中，最低成绩为75.7%，最高成绩为87.5%，超过了标志着达到人类水平的门槛85%。前谷歌高级工程师、AI研究员François Chollet表示，OpenAI这些推理模型在AGI测试中取得进步是“稳健的”。

与此同时，OpenAI还推出了精简版o3-mini，该模型在性能与成本平衡方面表现出色，能够以较低的成本提供高效的服务。o3Mini模型在编码评估、数学能力测试中均表现出色，与o1模型相当。

然而，尽管o3的测评看上去表现惊艳，OpenAI可能不会很快面向大众上线这款新的超级推理模型。从12月20日开始，OpenAI允许安全研究人员可以注册访问o3 和 o3-mini的预览。OpenAI计划明年初正式发布这些新的o3模型。

上一篇：OpenAI直播最后一天放出“王炸”：下一代推理模型o3亮相

下一篇：对话Sam Altman：解读o3模型，2025底年AI或将超越人类智慧

返回列表

相关新闻