DeepSeek头号黑粉这下爽到了 - AI

7 x 24跟踪全球科技动态

热门话题

白天

搜索

资讯

DeepSeek头号黑粉这下爽到了

2025-02-25 / 阅读约11分钟

来源：凤凰网

Anthropic的两个好消息，也可以让硅谷暂时松口气了

还真让DeepSeek头号黑粉美到了。

北京时间2月25日，Anthropic传来两个好消息。

第一个好消息是，Anthropic发布首个“混合模型”Claude 3.7 Sonnet。在腾讯、阿里、xAI等纷纷跟上DeepSeek的脚步，推出推理模型的时候，Anthropic说“我都要”，将及时应答和深度思考结合，抛弃了多模型堆砌的做法。

第二个好消息是，在Claude 3.7 Sonnet发布的几乎同时，《华尔街日报》称Anthropic接近完成35亿美元的新一轮融资，估值可能达到615亿美元，是此前180亿美元估值的3倍有余。

Anthropic有很多头衔。这家公司是OpenAI“叛军”代表，是硅谷明星人工智能初创公司。同时，在近一个月，该公司还成为了“DeepSeek头号黑粉”，不仅质疑V3的600万美元训练成本，还由联合创始人之一亲自上阵撰写檄文，呼吁加强美国的芯片出口管制。

如今新模型发布，再加上融资即将超额完成的消息，Anthropic暂时顶住了DeepSeek带来的压力。

这不仅是属于Anthropic的好消息，实际上，在华尔街和大众都因DeepSeek质疑硅谷的高支出AI战略时，Anthropic的表现证明着神话还未破灭。对OpenAI等也在融资的企业来说，也无疑是一个积极的信号。

DeepSeek R1推理模型的推动下，OpenAI火速上线o3 mini，马斯克的xAI也在上周发布Grok 3时带上了Grok Reasoning。

而Anthropic此时选择：来个混合大招。

此前一直传闻Claude 4即将发布，但Anthropic这次实际上发布的是Claude 3.7 Sonnet。

Anthropic称，Claude 3.7 Sonnet是市面上首款“混合模型”，并将立即投入使用。

此“混合”，指的是业界首个在单一架构上整合实时应答（Fast Thinking）和深度思考（Slow Thinking）的模型。相比而言，不管是DeepSeek的R1模型，还是OpenAI的o3-mini，都是严格的推理模型。

在使用R1和o3-mini时，思考过程是强制的，用户只能等待，由此拖慢获取答案的时长。但有的问题实际上并不需要长时间地思考，这时候需要用户来判断并切换到及时应答的模型。

但在Claude 3.7 Sonnet这种混合模型中，用户不必切换即可获取实时应答或者深度思考。

“这个模型融合了所有功能——我们的目标是拥有一个统一的AI，能适用于各种场景。这样对我们的客户而言会更简单一些。”Anthropic联合创始人兼首席科学家贾雷德·卡普兰（Jared Kaplan）表示。

卡普兰将其比作人类大脑的运行方式：有的问题需要深度思考，有的问题需要快速作答。Claude 3.7 Sonnet将这两种能力整合在同一个模型中，而不是完全分开。

除此之外，用户可以利用“草稿”功能，在问题比较复杂时，指导模型进行更准确的思考；API用户还可以精细控制Claude 3.7 Sonnet的思考时长，甚至控制思考的预算，如告诉Claude在回答时最多思考多少个tokens。

在模型表现上，相较于上一代Claude 3.5 Sonnet：“Claude 3.7 Sonnet 在遵循指令、一般推理、多模态能力和自主编码方面表现出色，扩展思维在数学和科学方面提供了显著提升。”值得一提的是，其数学、编码能力提高10%。其中编码能力尤为突出，在多个测试中有所展现。

根据SWE Bench测试数据，Claude 3.7的代码能力大幅超越DeepSeek R1、OpenAI的o1、o3模型。专注AI编程的Cursor已经宣布集成Claude 3.7 Sonnet。

Claude 3.7 Sonnet已经全面上线，支持免费版、专业版、团队版和企业版，此外可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。不过免费用户目前无法使用扩展思考模式。

在定价方面，Claude Sonnet 3.7的价格为：输入3美元/百万tokens，输出15美元/百万tokens。这与前代模型保持一致，并显著高于竞争对手的纯推理模型，如OpenAI o3 mini（输入1.1美元/百万tokens，输出4.4美元/百万tokens）和DeepSeek R1（输入0.55美元/百万tokens，输出2.19美元/百万tokens）。

在此基础之上，Anthropic也同步发布了专注于代码的Agent Claude Code，可以直接在终端运行，帮开发者完成编程任务。

从搜索、阅读代码、编辑文件、编写代码、运行测试，一直到将代码提交到GitHub。不过，目前Claude Code仅作为有限的研究预览版提供。

在发布大模型的同时，Anthropic正在进行的融资也传来好消息：

《华尔街日报》报道：“Claude背后的公司克服了因中国DeepSeek的成功引发的投资者担忧，估值达到615亿美元。”

据称，Anthropic即将完成一轮35亿美元的融资，估值将达到615亿美元。最新一轮融资的投资者包括风投公司 Lightspeed Venture Partners、General Catalyst 和 Bessemer Venture Partners。总部位于阿布扎比的投资公司 MGX 也在洽谈参与事宜。

这个数字虽然离OpenAI的1570亿美元估值还有距离，但是超过了xAI去年底的400亿美元估值。xAI也正在寻求融资，预计估值750亿美元。

要知道，这次融资之前Anthropic的估值还只有180亿美元。

知情人士向《华尔街日报》透露，Anthropic最初计划筹集20亿美元，但在和投资者谈判期间成功提高了这一数额。

Anthropic迎头赶上，甚至拿出“要超越你们所有人”的架势，这并不令人意外。可以说，今天的两个好消息，都在夯实Anthropic被贴在身上的标签。

Anthropic自2021年成立之初，就因其由OpenAI前员工创办，而喜提“OpenAI叛军”的称号。

之前Anthropic已经多次抢先OpenAI一步。如去年的“代理（Agent）”功能，OpenAI在Anthropic之后跟进。

这次发布混合模型，高举“反多模型堆砌方案”的大旗，也不禁让人想到了OpenAI CEO山姆·奥特曼（Sam Altman）前不久发布的GPT 5计划。彼时奥特曼就表示，意识到模型和产品功能太复杂，未来将统一。不承想又被Anthropic抢先一步了。

Anthropic的联合创始人卡普兰和迈克·克里格（Mike Krieger）都表示，预计竞争对手很快也会转向这种混合模型的方向。

另一方面，在DeepSeek R1横空出世之后，Anthropic俨然化身“DeepSeek头号黑粉”。

对DeepSeek的态度，硅谷大佬们大多是赞许中带着苦涩，但言语上还算客气。

如马斯克在Grok 3发布前，一边赞许DeepSeek R1很强，给中国工程师点赞，但也表示DeepSeek带来的不算AI领域的一次突破，并顺势夸赞了自家的模型。

奥特曼一边大赞DeepSeek“无疑是令人印象深刻的模型”，一边暗戳戳地表示DeepSeek用OpenAI专有模型训练自己的模型，可能违反了其服务条款。后来又“大方”表示“没有起诉DeepSeek的计划”。

而Anthropic就很不客气了，不仅压根不相信DeepSeek V3的训练成本仅有600万美元，甚至创始人之一的达里奥·阿莫迪（Dario Amodei）还发布了檄文《关于DeepSeek和出口控制》。

文章的核心思想就是，由于DeepSeek V3不可能只花了600万美元成本，而咱们又听说他们走私了芯片，因此咱们得好好管制一下芯片出口。之前只管H100和H800这些高端芯片显然是不够的，咱得把H20也管起来。

Anthropic当然不愿意认，虽叫“OpenAI叛军”，但背靠巨头烧钱这方面，二者如出一辙。OpenAI前有微软后有软银，而Anthropic则抱上了谷歌和亚马逊的大腿。

尤其是亚马逊，2023年就向Anthropic投资了40亿美元，2024年又承诺投资40亿美元。

而DeepSeek的大火又恰逢Anthropic进行新一轮融资之时，着急上火也是情理之中的（虽然手段有点让人不齿）。左手檄文打压DeepSeek，右手发布及时应答+深度思考的混合模型，总算稳住了局面，如果不出意外，这一轮Anthropic将超额完成融资目标。

Anthropic的两个好消息，也可以让硅谷暂时松口气了。

正在融资的不止有Anthropic。

据《华尔街日报》等媒体，OpenAI正在洽谈巨额融资，拟融资额至多400亿美元，估值可能被推高至3000亿美元。此外，xAI也在进行新一轮融资，以750亿美元估值寻求100亿美元融资。他们无疑也都感受到了DeepSeek带来的投资者担忧。

Anthropic至少证明了，在当下硅谷搞投入的AI路径尚未神话破灭，“大力出奇迹”在某种程度上依然可以打动人心，虽然可能需要付出比之前多的游说成本。

但战争远没有结束。

一方面，Anthropic依然面临着商业化难题，而这一点在后DeepSeek时代显得更加刺眼。Anthropic此前估值和收入比达到68.6倍，而OpenAI大概在42.4倍的水平。

据The Information，Anthropic的收入预计将从2025年的22亿美元激增到2027年的120亿美元。挑战在于开支，今年Anthropic预计“烧钱”30亿美元，已经比前一年的56亿美元低了。公司高层表示，预计到2027年可以停止赤字开支，实现盈利。

另一方面，自身商业化难解的同时，外部竞争也在加剧。

Grok 3刚刚发布，Anthropic发布混合模型，紧接着谷歌的视频生成模型Veo 2 API也曾宣布在年初发布，还有OpenAI的GPT-4.5随时可能降生，以及GPT-5预计在5月底发布。

开源的战场也越来越热闹。马斯克的xAI延续新代发布、开源上一代模型的做法，宣布将开源Grok 2。而OpenAI——此前和Anthropic一起被视为“闭源”的代表——也松了口，奥特曼面对DeepSeek的大火，直接坦言过去站在了“错误的一边”，在社交媒体上发起投票，释放将有一个“开源项目”的信号。