失意的年终直播：OpenAI的内外交困 - AI

7 x 24跟踪全球科技动态

热门话题

白天

搜索

资讯

失意的年终直播：OpenAI的内外交困

2024-12-30 / 阅读约6分钟

来源：36kr

陷入双重困境。

2024年12月，OpenAI启动了一场为期12天的新品发布会。这场持续近两周的产品发布,吸引了全球科技行业的密切关注。

这12天里,OpenAI逐一推出了多项技术更新。首个亮相的是完整推理模型o1,该模型在性能指标上有明显变化:思考速度较预览版提升约50%,处理复杂问题时的错误率降低34%,同时新增了图像识别等多模态输入支持功能。

随后发布的产品包括强化微调技术、文生视频工具Sora和协作平台Canvas。其中,Sora可生成最长20秒、1080p分辨率的视频内容;Canvas则集成了写作辅助和编程环境功能。经过强化微调的o1-mini模型在测试通过率上提升了82%。

在发布会的最后阶段,OpenAI推出了新一代AI模型o3及其精简版o3-mini。o3在多项专业测试中展现出其性能:在GPQADiamond博士级科学考试中达到87.7%的准确率,在美国AIME数学竞赛中获得96.7分,在Codeforces编程平台上获得2727分的评分。

市场期待的高光时刻却未如期而至。在这场持续12天的发布会中,OpenAI始终未曾提及外界翘首以盼的GPT-5。而作为OpenAI的重磅产品,文生视频工具Sora的表现也未能完全兑现此前的期望。此外，不速之客Google突然宣布推出其最新AI模型，则让这场年末的科技盛会更添几分戏剧性。

Google反击：OpenAI的意外年终剧情

曾经被业界视为AI领域当之无愧领跑者的OpenAI，这一次却在最引以为傲的两大王牌产品上连遭掣肘。而给OpenAI带来这场"惊喜"的，正是此前因"动作迟缓"而备受争议的老对手 - Google。

OpenAI直播进行到第三天，万众期待的Sora终于正式亮相。每月200美元的ChatGPT Pro会员可享用这款文生视频工具，似乎一切都在按部就班地进行。然而，与年初首次官宣时引发的轰动效应相比，这次的Sora表现却显得黯淡无光。最长20秒、最高1080p的视频生成能力，在已有Runway、可灵、海螺AI等诸多竞品的市场上，不仅未能激起太大波澜，反倒让不少用户发出了失望的声音。

就在OpenAI试图力挽狂澜之际，Google选择了最巧妙的时机发起反击。12月17日，一款名为Veo2的文生视频产品横空出世。虽然当前Veo2只能生成8秒、720p的视频，但Google给出了一个极具诱惑力的承诺：未来将支持2分钟以上的4K分辨率视频生成。更具意味的是，Google CEO皮查伊在社交媒体上特意强调Veo2"对现实世界的物理与运动有更好的理解"，这番话背后的锋芒，直指Sora当前饱受诟病的技术短板。

市场的反应格外耐人寻味。Sora发布后，用户讨论热度平平，评测中频频出现"生物运动变形"、"手部动作不自然"、"文字乱码"等老问题的身影。反观Veo2，其流畅的生物运动、丰富自然的表情变化以及稳定的长镜头表现，却收获了一片赞誉之声。这种尴尬的反差，最终迫使OpenAI不得不在圣诞假期期间推出"无限制访问"的临时政策，试图重新引起市场关注。

Google的反击不仅如此。就在OpenAI直播进入倒计时的第二天，Google又打出了一记重拳-发布Gemini 2.0 Flash Thinking。这个以思维链可视化为特色的多模态推理模型，明显是冲着OpenAI的o1模型而来。根据独立基准测试网站lmarena.ai的初步评估，Gemini 2.0 Flash Thinking的整体表现已经超越了o1预览版，排名跃居第一。

在这场年末的AI角力中，曾经在人工智能领域起步较晚的Google，似乎找到了与OpenAI正面较量的最佳时机。这一回合的交锋，不仅关乎两家科技巨头的产品博弈，更预示着AI领域竞争格局可能即将迎来一次重大转折。

GPT-5为何迟迟未至？

而在这场12天的直播盛会中，一个显著的缺席者引发了业界的诸多猜测 - 外界最为期待的GPT-5始终未曾露面。这背后，是其代号为"Orion"（猎户座）的项目所面临的重重困境。

这个已经开发超过18个月的新一代AI项目，正在经历着远比外界想象更为艰难的阵痛。据知情人士透露，OpenAI的最大投资方微软原本期待在2024年年中看到这款新模型的身影。然而现实却给了所有人一记重击：在至少两次大规模训练中，每一次都耗时数月，消耗了海量数据资源，却始终未能达到研究人员预期的成果。

这场充满未知的探索之旅，从一开始就布满荆棘。2023年年中，OpenAI对猎户座新设计展开首次实战测试，这个被称为"Arrakis"的项目却暴露出了令人忧心的问题：训练进度异常缓慢，预示着更大规模训练可能带来天文数字般的成本。即便在最理想的情况下，猎户座相较现有模型的性能提升，也难以证明其高昂的运营成本是否值得-仅六个月的训练周期，计算成本就可能高达约5亿美元。

正如OpenAI CEO奥特曼所言，如果GPT-4的训练成本就已超过1亿美元，那么未来的AI模型训练费用将轻松突破10亿美元大关。在这种情况下，每一次失败的训练都会带来巨大的压力，带来的不仅是巨额损失，更是难以承受的心理打击。

而就在OpenAI为GPT-5绞尽脑汁之际，外部压力却接踵而至。Google不仅在这场马拉松直播中频频出手，展现出令人意外的精准打击能力，马斯克的xAI更是在活动结束后立即宣布完成60亿美元C轮融资，将该公司的总融资额推至120亿美元。这些动作无不在暗示：AI领域的竞争远比想象中更加激烈。

这场本应在欢快氛围中结束2024年的营销活动，却在某种程度上成为了OpenAI这一年际遇的隐喻：它依然优秀，却已从神坛回归人间。随着竞争对手的不断崛起，2025年的AI赛道注定将迎来更多挑战。对OpenAI而言，如何在保持技术领先的同时突破发展瓶颈，或许是一个值得深思的命题。

上一篇：一城之力反超美国巨头们，杭州这几家企业火了

下一篇：突破内存瓶颈：Rambus HBM4控制器IP如何定义未来计算

返回列表

Google反击：OpenAI的意外年终剧情

GPT-5为何迟迟未至？

相关新闻