又是感谢 DeepSeek 的一天。
OpenAI CEO Altman 于今日凌晨透露,公司将在未来数月内推出整合 o3 及其他技术的 GPT-5 模型,并将其应用于 ChatGPT 和 API 服务。
Altman 表示希望更透明地分享公司的发展路线图,同时简化产品体系结构。他强调希望 AI 能做到「开箱即用」,让用户无需费心理解复杂的模型与产品选择。( 原来你也知道呀)
不过,在 GPT-5 发布之前,OpenAI 的下一代模型将是 GPT-4.5(内部代号 Orion),这将是 OpenAI 最后一个非思维链式(non-chain-of-thought)模型。
此前有报道称,GPT-4.5(Orion)在性能优化上遇到了挑战,技术进展不及预期。外媒报道提到,GPT-4.5 相比 GPT-4o 的提升幅度,远不及 GPT-4 相较 GPT-3 的进步。
此外,OpenAI 未来的模型还有望根据用户输入自动选择调用相应的模型。用 Altman 的原话说:「我们和你一样讨厌模型选择器,也希望回归那种智能统一的「魔法」体验。」
接下来的几个月,OpenAI 的核心目标是统一 o 系列模型和 GPT 系列模型,打造能够整合所有工具的系统,使其能够根据需要决定何时进行深入思考,适用于更广泛的任务场景。
如开篇所说,在 ChatGPT 和 API 服务中,即将发布的 GPT-5 将整合包括 o3 在内的多项技术。 而此前预告的 o3 模型将不再独立推出。
去年,OpenAI 曾计划于 2025 年初发布 o3。就在几周前,OpenAI 首席产品官 Kevin Weil 在接受采访时还表示。o3 预计将在 2-3 月间发布,但目前尚不清楚 OpenAI 撕毁全年计划,临时「变卦」的原因。
实际上,OpenAI 的推理模型进步显著。以编程能力为例,他们的首个推理模型 o1 达到了「全球百万分之一」的竞争性编程水平,到去年 12 月份发布的 o3 模型已跃升至全球第 175 名。
根据内部测试,目前已接近全球第 50 名,Altman 预计今年年底有望问鼎榜首。
关于 GPT-5,Altman 还表示, ChatGPT 免费用户未来将在标准智能水平下无限制访问 GPT-5,但会受到滥用检测的限制。
Plus 订阅用户则可在更高的智能水平下运行 GPT-5,而 Pro 订阅用户可使用更高智能水平的 GPT-5,这些模型将支持语音交互、画布功能(Canvas)、搜索、深度研究等多种增强功能。
当被网友问及 GPT-4.5/GPT-5 具体发布日期时,Altman 表示将在数周或数月内推出。
但显然网友对 Altman 画饼的套路娴熟于心。
Google AI Studio 产品负责人 Logan Kilpatrick 也给自家产品蹭上了一波热度:
很好!我们一直计划将推理能力作为 Gemini 基础模型的核心部分,而不是将其视为一个附加功能(这也是我们正在推进 2.0 Flash Thinking 能力的原因)
紧接着,OpenAI 官方也在 X 平台宣布所有 Pro 用户现可在移动端和桌面应用(iOS、Android、macOS 和 Windows)上使用深度研究功能。
ChatGPT 用户选择 o1 和 o3-mini 后可上传文件和图片。Plus 用户每天与 o3-mini-high 的对话次数增加 50 次。
将时间往前拨回几个小时,Altman 在回复关于深度研究功能的帖子时表示:
我认为我们最初会为 ChatGPT Plus 用户提供每月 10 次使用,而免费用户每月可以使用 2 次,并计划随着时间推移逐步增加这些额度。 对某些用户来说,它的价值可能高达 1000 美元/月,但我更期待看到大家如何使用它!
并且,Altman 还表示由于注意到一些用户对深度研究功能的需求非常高,因此从长期来看,OpenAI 仍需要找到一种更灵活的方式,让用户能够根据需求动态支付计算资源费用。
远离这些热点消息的喧嚣,OpenAI 刚刚发布的模型规范更值得关注。
具体来说,OpenAI 最新更新的Model Spec(模型规范)文件较此前的 10 页版本内容更为详实,明确了 AI 模型在处理敏感话题、用户自定义等方面的行为准则。
据悉,新版本强调三大核心原则:可定制性(Customizability)、透明性(Transparency)以及「思想自由」(Intellectual Freedom)——允许用户探索和讨论各种观点,而不受武断限制。
吸取了过往一年发生在 OpenAI 身上的 AI 争议事件,新版 Model Spec 在诸如「电车难题」、明确禁止模型复制受版权保护的内容或绕过付费墙、调整对成人内容的策略、针对 AI 的迎合性改进等问题做出了更好的改进。
OpenAI o1 在最新的测评中合规性普遍高于 GPT-4o
比方说,如果你向 ChatGPT 提出类似「电车问题」,它应该会回答 「在防止大规模伤亡的情况下,可以这么做。」
又或者,模型不会一味回避敏感问题,而是应该 「与用户一起探索真相」,同时在错误信息和潜在危害方面保持明确立场。
考虑到用户请求 AI 评价他们的作品时,AI 只会盲目称赞,而不提供任何建设性意见,OpenAI 也对作出了调整。
ChatGPT 将会给出客观评价和建设性批评。 如果用户在提问中包含错误信息,AI 现在应该礼貌纠正而不是迎合用户的错误。
值得一提的是,OpenAI 官方放出的演示案例也疑似在内涵 DeepSeek 此前备受争议的数据蒸馏问题。
「我们无法创造一个让所有人都满意的模型。」OpenAI 模型行为团队成员 Joanne Jang 在接受 The Verge 采访时表示。
她强调,尽管 OpenAI 仍会保留核心安全机制,但用户和开发者可以自定义许多模型行为。 她还补充道: 「我们知道这会引起争议。 」
插个冷知识,Joanne Jang 毕业于斯坦福大学,获得计算机科学硕士学位和数学与计算科学学士学位,目前在 OpenAI 担任产品经理,主要负责模型行为相关工作。
另外,OpenAI 以 Creative Commons Zero(CC0)许可证 发布 Model Spec,意味着它完全开源,任何 AI 公司或研究人员都可以自由采用、修改或基于此构建自己的 AI 行为规范。
OpenAI 以 Creative Commons Zero(CC0)许可证发布 Model Spec,这意味着该规范完全开源,任何 AI 公司或研究人员都可以自由采用、修改或基于此构建自己的 AI 行为规范。 OpenAI 表示,许多业内同行此前已非正式参考其 Model Spec,emmm……这也算是真·open 了。
另外最近有消息传出,Anthropic Claude 4 预计将在本周发布,此外还有 评分全面超越 o3 的推理模型也将首次亮相。 这或许也是促使 Altman 一反常态、不再「挤牙膏」的重要原因之一。