美国下黑手!DeepSeek遇上大麻烦,梁文锋一人狂斗全美AI界
22 小时前 / 阅读约11分钟
来源:凤凰网
他一个人掀翻了整个美股。

打不过就封杀!

这出似曾相识的戏码被用到了DeepSeek身上。

DeepSeek横空出世后,Scale AI创始人Alexander Wang便表达了自己的看法:漂亮国政府可能为保持领先优势,对DeepSeek的 AI 芯片进行调查和管制。

事情,果然沿着这个方向发展。

1月28日,DeepSeek官网显示,其线上服务受到大规模恶意攻击。而据专家介绍,DeepSeek这次受到的网络攻击,IP地址都在美国。

最新消息是,美国多名官员已经回应了DeepSeek对美国的影响,并表示DeepSeek是在“偷窃”,正对其影响开展国家安全调查。

而援引参考消息报道,美国海军基于“潜在安全和道德问题”,已经要求避免以任何形式使用中国公司的DeepSeek模型.......

DeepSeek的大麻烦来了!但这进一步印证了它的强大。

01 DeepSeek引巨震,英伟达跌4万亿

一家名为DeepSeek(深度求索)的中国AI 公司,引发了整个美国科技圈轰动。

1月20日晚,DeepSeek宣布发布推理模型 DeepSeek-R1 正式版,以极低成本训练出了不输 OpenAI 推理模型 o1的性能,而且完全免费开源.......

1月27日,DeepSeek同时登顶中国区和美国区苹果AppStore免费榜。这是第一次,有中国科技产品APP实现双榜登顶。

被DeepSeek甩在身后的,是OpenAI旗下的ChatGPT以及Google Gemini等全球最强AI产品。

剧烈的地震还在继续。一天后,DeepSeek又开源了多模态模型Janus-Pro-7B,并宣布在GenEval 和DPG-Bench 基准测试中击败了 DALL-E 3(来自 OpenAI)和Stable Diffusion。

这直接导演了美国一众科技股票的滑铁卢。1月28日,AI 芯片第一股英伟达股票单日暴跌17%,直接蒸发近4万亿元。(当然,受美国调查DeepSeek影响,英伟达市值次日又反弹了2万亿。)

暴跌的英伟达,引起连锁反应。随后,微软股价下跌2%,超威半导体公司(AMD)股价下跌6%,博通公司股价下跌17%.......就连人工智能领域的衍生品供应商也受到重创,比如美国联合能源公司股价下跌21%,Vistra的股价下跌29%。

英伟达的连锁反应只是表象。整个美科技股面临的深层次挑战是:它们或将经历一场估值的重新审视。

不用巨量昂贵的GPU 便能训练出超越ChatGPT的DeepSeek,让投资人开始重新审视 AI 的发展路径。

公开信息显示,DeepSeek-V3的预训练成本约为557.6万美元,整体消耗了278万GPU小时训练时长。作为对比,OpenAI仅仅是GPT-4的训练成本就接近1亿美元。

训练成本大幅下降背后,加深了人们对大模型商业模式的再思考。

DeepSeek给美国硅谷带来的震撼还在持续。一句话,DeepSeek 正让AI界变不可能为可能,变不合理为合理。

微软 CEO Satya Nadella 在达沃斯世界经济论坛上直言:“DeepSeek 新模型的表现令人印象深刻,尤其是在模型推理效率方面。我们必须认真对待来自中国的这些发展。”

沃顿商学院教授Ethan Mollick 对 R1 的内部思考过程赞叹不已:“DeepSeek 的原始思维链非常迷人。它真的读起来就像一个人在大声思考。既迷人又奇特”。

Scale AI的CEO Alexandr Wang 甚至将其称为一款“震撼世界的模型(earth-shattering model)”。“我们发现 DeepSeek的性能与美国最好的模型不相上下.......

但就是这个让全球震撼AI产品,其背后的创造者,却是一个半路出家的外来者。而这种颠覆性创新,进一步加深了外部市场的恐惧。

02 AI入侵者,极致成本颠覆OpenAI

如今火爆的DeepSeek,在很长时间里,都名不见经传。

直到1月20日,在总理主持召开专家、企业家和教科文卫体等领域代表座谈会,梁文锋在会上发言,并出现在新闻联播中,DeepSeek和他背后的掌舵者才逐渐浮出水面。

实际上,梁文锋并不是所谓AI科班出身。在2023年创办DeepSeek之前,梁文锋更像是一个投资家而非AI创业者。

即便AI创业后,他也顶多算是半路出家,甚至可以说只是行业的一个跟随者。

1985年生于广东湛江的梁文锋,从小便是学霸。高中毕业,梁文锋以吴川一中高考状元身份,考上了浙江大学电子信息工程专业。

2010年,梁文锋硕士毕业后,小试牛刀、创办了雅比克投资。

2015年,梁文锋又创办了杭州幻方科技有限公司。这一次,他将数学与人工智能结合起来,开启了量化投资浪潮。简单来说,就是通过数量化的方式,实现机器自动买入卖出股票,以此来实现盈利。

杭州幻方发展很快,2016年上线第一个AI模型,实现自动仓位上线交易。4年后,杭州幻方管理的基金就突破百亿规模。2021年,幻方量化成为国内首家突破千亿的量化私募基金。

不止能赚钱,梁文锋还尤其慷慨。2023年,幻方量化一员工向慈善机构捐赠1.38亿元,登上了热搜。尽管匿名原因让这笔捐赠成谜,但很多人认为这个人只能是幻方的老板。

直到2023年5月,梁文锋方正式杀入通用人工智能(AGI)领域,在杭州成立了深度求索人工智能基础技术研究有限公司。

在此后一年时间里,不管是与全球执牛耳者OpenAI的ChatGPT,还是与国内大模型的先行者(百度文心一言、阿里通义千问、字节跳动豆包,腾讯混元大模型)相比,DeepSeek都相去甚远。

但成立一年后,当国内外大模型厂商深陷创新泥淖时,DeepSeek却以惊人的速度完成了超越。

2024年5月,借助DeepSeek V2发布,DeepSeek率先在业内打起价格战。彼时,其推理成本每百万token不到1元钱,只有GPT-4 Turbo的七十分之一。

2024年12月26日,DeepSeek再次发布DeepSeek V3,成本再次降低。

2025年1月20日,瞄准ChatGPT o1,DeepSeek R1推理大模型发布,其价格已经开始将ChatGPT o1按在地上疯狂摩擦。比如,DeepSeek的训练成本为558万美元‌,这一成本仅为GPT-4o的约1/20‌12。

再如DeepSeek的训练过程使用了2048张H100的GPU集群。相比,全球AI第一梯队的头部公司要用1.6万张以上的GPU进行训练‌14。

DeepSeek极其低廉的价格,让美国硅谷震惊。但比成本更让人震惊的是,他们此前对DeepSeek闻所未闻,以至于跟不上DeepSeek的创新打法与思维方式。

说白了,在OpenAI之外,DeepSeek找到了存在一种完全不同的AI生存逻辑。

以OpenAI为例,其模式本质上基于研发和产品侧的高投入。这种模式下,让英伟达等美国科技巨头的“算力无限主义”模式席卷天下。事实上,OpenAI最大投入从来都是“硬件算力”和“训练成本”。

得益于微软巨大的财力以及数据支撑,OpenAI成功了那个最能烧钱的AI明星。

上游微软提供养分,下游的英伟达则成了这个生态中最赚钱的企业。与此同时,OpenAI链接的微软们与英伟达们,一起构筑出了美国AI生态有机整体。当然,这个生态是闭源的。

但当DeepSeek举起“开源大旗”,并以远低于OpenAI的价格席卷全球后,OpenAI的同盟者们如遭重击。

横空出世的DeepSeek,不只意味着攻守易位,背后还有着更深远的影响:它颠覆了既有AI创新的商业模式,并给全球以崭新的AI想象力。

更可怕在于,这只是开始。全球AI界,不会只有DeepSeek一个挑战者。

DeepSeek拉开了AI的2.0时代。

03 DeepSeek,遭西方恶势力攻击

“东方神秘力量”DeepSeek,一时成了全球是大模型行业最大“黑马”。

如今,这匹黑马正让全球陷入恐慌。

一位Meta的工程师在美国科技公司员工社区Blind中这样写道,“Meta的生成式AI部门正处于恐慌中。这一切始于DeepSeek,它使得 Llama 4 在基准测试中已经落后。

工程师们正在疯狂地剖析DeepSeek,并试图从中复制一切可能的东西。”

恐慌之外,国外势力开始动用潜在的“政治”力量。

Scale AI创始人Alexander Wang直言不讳地表达漂亮国政府需要为保持领先优势,对DeepSeek的 AI 芯片进行调查和管制。

梁文锋此前指出,对于DeepSeek来说,算力更高的先进 AI 芯片对于训练先进AI模型至关重要。

如今,DeepSeek已经开始面临竞争对手囤积大量算力挑战。上周,特朗普宣布,OpenAI与甲骨文、日本软银集团共同创立一家5000亿美金投资新计划公司“星际之门”,立即在美国至少投资 1000 亿美元用于 AI 基础设施。

同时,马斯克的 xAI 也正在大规模扩展其超级计算机,以容纳超过100万个 GPU,以帮助训练其 Grok AI 模型。

OpenAI 首席财务官 Sarah Friar也认为,中美间的 AI 竞争不是简单的口水战,这是一场真实的竞争,双方正在大力投资这一领域。“我们已经看到特朗普政府愿意积极参与,无论是从经济角度,还是从监管和商业竞争的角度......”

DeepSeek正在挑战美国AI界,而它的对手们也在做出最强有力的回应。甚至,这些反应是毫无底线的。

央视新闻消息,1月28日深度求索(DeepSeek)官网显示,其线上服务受到大规模恶意攻击,据专家介绍,DeepSeek这次受到的网络攻击,IP地址都在美国。

往前推,DeepSeek服务状态页面显示,自27日开始,平台多次出现“网页/API服务异常”。

包括“Bleeping Computer”在内的多家科技媒体认为,虽然DeepSeek尚未公布其被攻击的细节,但该平台的对话框疑似遭遇了“分布式拒绝服务攻击”(DDos)。

恶意攻击之外,更多细节表明,DeepSeek正被美国政界重点“照顾”。

美国多名官员回应DeepSeek对美国的影响,表示DeepSeek是“偷窃”,正对其影响开展国家安全调查。

白宫人工智能和加密货币事务负责人大卫·萨克斯表示,人工智能中有一种叫“蒸馏”的技术,它指的是一个模型从另一个模型中学习的过程。他认为,在接下来的几个月里,美国领先的人工智能公司将采取措施,试图防止“蒸馏”。

而据参考消息报道,美军对中国DeepSeek“出手”。

台湾“中央社”1月28日引述美国消费者新闻与商业频道的报道称,美国海军基于“潜在安全和道德问题”,已要求人员避免以任何形式使用中国公司的DeepSeek模型。