图片来源: 林伟权/Getty Images
我们或许正迎来一场推理复兴。
自OpenAI发布其推理模型o1以来,多家竞争对手的AI实验室也纷纷推出了各自的推理模型。11月初,由量化交易员资助的AI研究公司DeepSeek发布了其首款推理算法DeepSeek-R1的预览版。同月,阿里巴巴的Qwen团队也推出了据称是对o1的首个“开放”挑战者。
那么,是什么推动了这股推理模型的潮流呢?首要原因是寻求改进生成式AI技术的新途径。正如我的同事Max Zeff最近报道的那样,通过“暴力”手段扩展模型规模的技术已不再像过去那样有效。
AI公司面临着巨大的竞争压力,需要保持当前的创新步伐。据估计,全球AI市场在2023年已达到1966.3亿美元,预计到2030年其价值可能达到1.81万亿美元。
OpenAI声称,推理模型能够“解决比以往模型更难的问题”,标志着生成式AI发展的重大转变。然而,并非所有人都认为推理模型是前进的最佳路径。
卡内基梅隆大学机器学习副教授Ameet Talwalkar表示,他对首批推理模型印象深刻。但同时,他也提醒我们不要盲目相信推理模型能将行业带向何方。
“AI公司有财务激励对其技术未来版本做出乐观预测,”Talwalkar说,“我们面临着盲目关注单一范式的风险。因此,更广泛的AI研究界必须避免盲目相信这些公司的炒作和营销活动,而应关注具体成果。”
推理模型存在两个主要缺点:昂贵且耗电。
例如,在OpenAI的API中,分析约750,000个单词的o1模型需收费15美元,而生成相同数量的单词则需60美元。这是OpenAI最新的“非推理”模型GPT-4o成本的3到4倍。
虽然o1在OpenAI的AI聊天机器人平台ChatGPT上可用且免费(但有限制),但本月早些时候,OpenAI推出了更高级的o1专业模式,年费高达2400美元。
“大型语言模型推理的整体成本肯定不会下降,”加州大学洛杉矶分校计算机科学教授Guy Van Den Broeck告诉TechCrunch。
推理模型成本高昂的原因之一是它们需要大量的计算资源来运行。与大多数AI不同,o1和其他推理模型在运行时会尝试自我检查。这有助于它们避免一些常见的错误陷阱,但缺点是它们往往需要更长时间才能找到解决方案。
OpenAI设想未来的推理模型能够持续思考数小时、数天甚至数周。该公司承认这将增加使用成本,但从突破性电池到新型抗癌药物等潜在回报可能会使这些投入物有所值。
然而,当今推理模型的价值主张尚不明显。非营利组织Ai2的研究员和机器学习工程师Costa Huang指出,o1并不是一个非常可靠的计算器。在社交媒体上进行粗略搜索可以发现许多o1专业模式的错误。
“这些推理模型是专门化的,可能在一般领域表现不佳,”Huang告诉TechCrunch,“一些局限性会比其他局限性更早被克服。”
Van den Broeck断言,推理模型并未进行真正的推理,因此在能够成功完成的任务类型上受到限制。“真正的推理适用于所有问题,而不仅仅是模型训练数据中可能出现的问题,”他说,“这是仍需要克服的主要挑战。”
鉴于强大的市场激励推动推理模型的发展,可以肯定的是,它们会随着时间的推移而不断改进。毕竟,不仅仅是OpenAI、DeepSeek和阿里巴巴在投资这一新的AI研究方向。相邻行业的风险投资家和创始人正围绕由推理AI主导的未来这一理念而聚集。
然而,Talwalkar担心大型实验室会垄断这些改进。“大型实验室出于竞争原因可以理解地保持秘密,但这种缺乏透明度严重阻碍了研究界与这些想法的接触能力,”他说,“随着越来越多的人在这个方向上工作,我预计推理模型将迅速发展。虽然其中一些想法将来自学术界,但鉴于这里的财务激励,我预计大多数(如果不是全部)模型将由OpenAI等大型工业实验室提供。”