还真让DeepSeek头号黑粉美到了。
北京时间2月25日,Anthropic传来两个好消息。
第一个好消息是,Anthropic发布首个“混合模型”Claude 3.7 Sonnet。在腾讯、阿里、xAI等纷纷跟上DeepSeek的脚步,推出推理模型的时候,Anthropic说“我都要”,将及时应答和深度思考结合,抛弃了多模型堆砌的做法。
第二个好消息是,在Claude 3.7 Sonnet发布的几乎同时,《华尔街日报》称Anthropic接近完成35亿美元的新一轮融资,估值可能达到615亿美元,是此前180亿美元估值的3倍有余。
Anthropic有很多头衔。这家公司是OpenAI“叛军”代表,是硅谷明星人工智能初创公司。同时,在近一个月,该公司还成为了“DeepSeek头号黑粉”,不仅质疑V3的600万美元训练成本,还由联合创始人之一亲自上阵撰写檄文,呼吁加强美国的芯片出口管制。
如今新模型发布,再加上融资即将超额完成的消息,Anthropic暂时顶住了DeepSeek带来的压力。
这不仅是属于Anthropic的好消息,实际上,在华尔街和大众都因DeepSeek质疑硅谷的高支出AI战略时,Anthropic的表现证明着神话还未破灭。对OpenAI等也在融资的企业来说,也无疑是一个积极的信号。
DeepSeek R1推理模型的推动下,OpenAI火速上线o3 mini,马斯克的xAI也在上周发布Grok 3时带上了Grok Reasoning。
而Anthropic此时选择:来个混合大招。
此前一直传闻Claude 4即将发布,但Anthropic这次实际上发布的是Claude 3.7 Sonnet。
Anthropic称,Claude 3.7 Sonnet是市面上首款“混合模型”,并将立即投入使用。
此“混合”,指的是业界首个在单一架构上整合实时应答(Fast Thinking)和深度思考(Slow Thinking)的模型。相比而言,不管是DeepSeek的R1模型,还是OpenAI的o3-mini,都是严格的推理模型。
在使用R1和o3-mini时,思考过程是强制的,用户只能等待,由此拖慢获取答案的时长。但有的问题实际上并不需要长时间地思考,这时候需要用户来判断并切换到及时应答的模型。
但在Claude 3.7 Sonnet这种混合模型中,用户不必切换即可获取实时应答或者深度思考。
“这个模型融合了所有功能——我们的目标是拥有一个统一的AI,能适用于各种场景。这样对我们的客户而言会更简单一些。”Anthropic联合创始人兼首席科学家贾雷德·卡普兰(Jared Kaplan)表示。
卡普兰将其比作人类大脑的运行方式:有的问题需要深度思考,有的问题需要快速作答。Claude 3.7 Sonnet将这两种能力整合在同一个模型中,而不是完全分开。
除此之外,用户可以利用“草稿”功能,在问题比较复杂时,指导模型进行更准确的思考;API用户还可以精细控制Claude 3.7 Sonnet的思考时长,甚至控制思考的预算,如告诉Claude在回答时最多思考多少个tokens。
在模型表现上,相较于上一代Claude 3.5 Sonnet:“Claude 3.7 Sonnet 在遵循指令、一般推理、多模态能力和自主编码方面表现出色,扩展思维在数学和科学方面提供了显著提升。”值得一提的是,其数学、编码能力提高10%。其中编码能力尤为突出,在多个测试中有所展现。
根据SWE Bench测试数据,Claude 3.7的代码能力大幅超越DeepSeek R1、OpenAI的o1、o3模型。专注AI编程的Cursor已经宣布集成Claude 3.7 Sonnet。
Claude 3.7 Sonnet已经全面上线,支持免费版、专业版、团队版和企业版,此外可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。不过免费用户目前无法使用扩展思考模式。
在定价方面,Claude Sonnet 3.7的价格为:输入3美元/百万tokens,输出15美元/百万tokens。这与前代模型保持一致,并显著高于竞争对手的纯推理模型,如OpenAI o3 mini(输入1.1美元/百万tokens,输出4.4美元/百万tokens)和DeepSeek R1(输入0.55美元/百万tokens,输出2.19美元/百万tokens)。
在此基础之上,Anthropic也同步发布了专注于代码的Agent Claude Code,可以直接在终端运行,帮开发者完成编程任务。
从搜索、阅读代码、编辑文件、编写代码、运行测试,一直到将代码提交到GitHub。不过,目前Claude Code仅作为有限的研究预览版提供。
在发布大模型的同时,Anthropic正在进行的融资也传来好消息:
《华尔街日报》报道:“Claude背后的公司克服了因中国DeepSeek的成功引发的投资者担忧,估值达到615亿美元。”
据称,Anthropic即将完成一轮35亿美元的融资,估值将达到615亿美元。最新一轮融资的投资者包括风投公司 Lightspeed Venture Partners、General Catalyst 和 Bessemer Venture Partners。总部位于阿布扎比的投资公司 MGX 也在洽谈参与事宜。
这个数字虽然离OpenAI的1570亿美元估值还有距离,但是超过了xAI去年底的400亿美元估值。xAI也正在寻求融资,预计估值750亿美元。
要知道,这次融资之前Anthropic的估值还只有180亿美元。
知情人士向《华尔街日报》透露,Anthropic最初计划筹集20亿美元,但在和投资者谈判期间成功提高了这一数额。
Anthropic迎头赶上,甚至拿出“要超越你们所有人”的架势,这并不令人意外。可以说,今天的两个好消息,都在夯实Anthropic被贴在身上的标签。
Anthropic自2021年成立之初,就因其由OpenAI前员工创办,而喜提“OpenAI叛军”的称号。
之前Anthropic已经多次抢先OpenAI一步。如去年的“代理(Agent)”功能,OpenAI在Anthropic之后跟进。
这次发布混合模型,高举“反多模型堆砌方案”的大旗,也不禁让人想到了OpenAI CEO山姆·奥特曼(Sam Altman)前不久发布的GPT 5计划。彼时奥特曼就表示,意识到模型和产品功能太复杂,未来将统一。不承想又被Anthropic抢先一步了。
Anthropic的联合创始人卡普兰和迈克·克里格 (Mike Krieger)都表示,预计竞争对手很快也会转向这种混合模型的方向。
另一方面,在DeepSeek R1横空出世之后,Anthropic俨然化身“DeepSeek头号黑粉”。
对DeepSeek的态度,硅谷大佬们大多是赞许中带着苦涩,但言语上还算客气。
如马斯克在Grok 3发布前,一边赞许DeepSeek R1很强,给中国工程师点赞,但也表示DeepSeek带来的不算AI领域的一次突破,并顺势夸赞了自家的模型。
奥特曼一边大赞DeepSeek“无疑是令人印象深刻的模型”,一边暗戳戳地表示DeepSeek用OpenAI专有模型训练自己的模型,可能违反了其服务条款。后来又“大方”表示“没有起诉DeepSeek的计划”。
而Anthropic就很不客气了,不仅压根不相信DeepSeek V3的训练成本仅有600万美元,甚至创始人之一的达里奥·阿莫迪(Dario Amodei)还发布了檄文《关于DeepSeek和出口控制》。
文章的核心思想就是,由于DeepSeek V3不可能只花了600万美元成本,而咱们又听说他们走私了芯片,因此咱们得好好管制一下芯片出口。之前只管H100和H800这些高端芯片显然是不够的,咱得把H20也管起来。
Anthropic当然不愿意认,虽叫“OpenAI叛军”,但背靠巨头烧钱这方面,二者如出一辙。OpenAI前有微软后有软银,而Anthropic则抱上了谷歌和亚马逊的大腿。
尤其是亚马逊,2023年就向Anthropic投资了40亿美元,2024年又承诺投资40亿美元。
而DeepSeek的大火又恰逢Anthropic进行新一轮融资之时,着急上火也是情理之中的(虽然手段有点让人不齿)。左手檄文打压DeepSeek,右手发布及时应答+深度思考的混合模型,总算稳住了局面,如果不出意外,这一轮Anthropic将超额完成融资目标。
Anthropic的两个好消息,也可以让硅谷暂时松口气了。
正在融资的不止有Anthropic。
据《华尔街日报》等媒体,OpenAI正在洽谈巨额融资,拟融资额至多400亿美元,估值可能被推高至3000亿美元。此外,xAI也在进行新一轮融资,以750亿美元估值寻求100亿美元融资。他们无疑也都感受到了DeepSeek带来的投资者担忧。
Anthropic至少证明了,在当下硅谷搞投入的AI路径尚未神话破灭,“大力出奇迹”在某种程度上依然可以打动人心,虽然可能需要付出比之前多的游说成本。
但战争远没有结束。
一方面,Anthropic依然面临着商业化难题,而这一点在后DeepSeek时代显得更加刺眼。Anthropic此前估值和收入比达到68.6倍,而OpenAI大概在42.4倍的水平。
据The Information,Anthropic的收入预计将从2025年的22亿美元激增到2027年的120亿美元。挑战在于开支,今年Anthropic预计“烧钱”30亿美元,已经比前一年的56亿美元低了。公司高层表示,预计到2027年可以停止赤字开支,实现盈利。
另一方面,自身商业化难解的同时,外部竞争也在加剧。
Grok 3刚刚发布,Anthropic发布混合模型,紧接着谷歌的视频生成模型Veo 2 API也曾宣布在年初发布,还有OpenAI的GPT-4.5随时可能降生,以及GPT-5预计在5月底发布。
开源的战场也越来越热闹。马斯克的xAI延续新代发布、开源上一代模型的做法,宣布将开源Grok 2。而OpenAI——此前和Anthropic一起被视为“闭源”的代表——也松了口,奥特曼面对DeepSeek的大火,直接坦言过去站在了“错误的一边”,在社交媒体上发起投票,释放将有一个“开源项目”的信号。
而眼下,DeepSeek也没有坐以待毙,而是宣布启动“开源周”,目前已经开源FlashMLA(直译为快速多头潜在注意力机制)的代码,以及EP通信库。
Anthropic顶住了DeepSeek的压力,发布混合模型、传出超目标融资的消息。但要让好消息延续,仍有诸多挑战。