2024年12月,OpenAI启动了一场为期12天的新品发布会。这场持续近两周的产品发布,吸引了全球科技行业的密切关注。
这12天里,OpenAI逐一推出了多项技术更新。首个亮相的是完整推理模型o1,该模型在性能指标上有明显变化:思考速度较预览版提升约50%,处理复杂问题时的错误率降低34%,同时新增了图像识别等多模态输入支持功能。
随后发布的产品包括强化微调技术、文生视频工具Sora和协作平台Canvas。其中,Sora可生成最长20秒、1080p分辨率的视频内容;Canvas则集成了写作辅助和编程环境功能。经过强化微调的o1-mini模型在测试通过率上提升了82%。
在发布会的最后阶段,OpenAI推出了新一代AI模型o3及其精简版o3-mini。o3在多项专业测试中展现出其性能:在GPQADiamond博士级科学考试中达到87.7%的准确率,在美国AIME数学竞赛中获得96.7分,在Codeforces编程平台上获得2727分的评分。
市场期待的高光时刻却未如期而至。在这场持续12天的发布会中,OpenAI始终未曾提及外界翘首以盼的GPT-5。而作为OpenAI的重磅产品,文生视频工具Sora的表现也未能完全兑现此前的期望。此外,不速之客Google突然宣布推出其最新AI模型,则让这场年末的科技盛会更添几分戏剧性。
曾经被业界视为AI领域当之无愧领跑者的OpenAI,这一次却在最引以为傲的两大王牌产品上连遭掣肘。 而给OpenAI带来这场"惊喜"的,正是此前因"动作迟缓"而备受争议的老对手 - Google。
OpenAI直播进行到第三天,万众期待的Sora终于正式亮相。每月200美元的ChatGPT Pro会员可享用这款文生视频工具,似乎一切都在按部就班地进行。然而,与年初首次官宣时引发的轰动效应相比,这次的Sora表现却显得黯淡无光。最长20秒、最高1080p的视频生成能力,在已有Runway、可灵、海螺AI等诸多竞品的市场上,不仅未能激起太大波澜,反倒让不少用户发出了失望的声音。
就在OpenAI试图力挽狂澜之际,Google选择了最巧妙的时机发起反击。12月17日,一款名为Veo2的文生视频产品横空出世。虽然当前Veo2只能生成8秒、720p的视频,但Google给出了一个极具诱惑力的承诺:未来将支持2分钟以上的4K分辨率视频生成。更具意味的是,Google CEO皮查伊在社交媒体上特意强调Veo2"对现实世界的物理与运动有更好的理解",这番话背后的锋芒,直指Sora当前饱受诟病的技术短板。
市场的反应格外耐人寻味。Sora发布后,用户讨论热度平平,评测中频频出现"生物运动变形"、"手部动作不自然"、"文字乱码"等老问题的身影。反观Veo2,其流畅的生物运动、丰富自然的表情变化以及稳定的长镜头表现,却收获了一片赞誉之声。这种尴尬的反差,最终迫使OpenAI不得不在圣诞假期期间推出"无限制访问"的临时政策,试图重新引起市场关注。
Google的反击不仅如此。就在OpenAI直播进入倒计时的第二天,Google又打出了一记重拳-发布Gemini 2.0 Flash Thinking。这个以思维链可视化为特色的多模态推理模型,明显是冲着OpenAI的o1模型而来。根据独立基准测试网站lmarena.ai的初步评估,Gemini 2.0 Flash Thinking的整体表现已经超越了o1预览版,排名跃居第一。
在这场年末的AI角力中,曾经在人工智能领域起步较晚的Google,似乎找到了与OpenAI正面较量的最佳时机。这一回合的交锋,不仅关乎两家科技巨头的产品博弈,更预示着AI领域竞争格局可能即将迎来一次重大转折。
而在这场12天的直播盛会中,一个显著的缺席者引发了业界的诸多猜测 - 外界最为期待的GPT-5始终未曾露面。这背后,是其代号为"Orion"(猎户座)的项目所面临的重重困境。
这个已经开发超过18个月的新一代AI项目,正在经历着远比外界想象更为艰难的阵痛。据知情人士透露,OpenAI的最大投资方微软原本期待在2024年年中看到这款新模型的身影。然而现实却给了所有人一记重击:在至少两次大规模训练中,每一次都耗时数月,消耗了海量数据资源,却始终未能达到研究人员预期的成果。
这场充满未知的探索之旅,从一开始就布满荆棘。2023年年中,OpenAI对猎户座新设计展开首次实战测试,这个被称为"Arrakis"的项目却暴露出了令人忧心的问题:训练进度异常缓慢,预示着更大规模训练可能带来天文数字般的成本。即便在最理想的情况下,猎户座相较现有模型的性能提升,也难以证明其高昂的运营成本是否值得-仅六个月的训练周期,计算成本就可能高达约5亿美元。
正如OpenAI CEO奥特曼所言,如果GPT-4的训练成本就已超过1亿美元,那么未来的AI模型训练费用将轻松突破10亿美元大关。在这种情况下,每一次失败的训练都会带来巨大的压力,带来的不仅是巨额损失,更是难以承受的心理打击。
而就在OpenAI为GPT-5绞尽脑汁之际,外部压力却接踵而至。Google不仅在这场马拉松直播中频频出手,展现出令人意外的精准打击能力,马斯克的xAI更是在活动结束后立即宣布完成60亿美元C轮融资,将该公司的总融资额推至120亿美元。这些动作无不在暗示:AI领域的竞争远比想象中更加激烈。
这场本应在欢快氛围中结束2024年的营销活动,却在某种程度上成为了OpenAI这一年际遇的隐喻:它依然优秀,却已从神坛回归人间。随着竞争对手的不断崛起,2025年的AI赛道注定将迎来更多挑战。对OpenAI而言,如何在保持技术领先的同时突破发展瓶颈,或许是一个值得深思的命题。