一城之力反超美国巨头们,杭州这几家企业火了
5 天前 / 阅读约8分钟
来源:凤凰网
何以是杭州?

作者| 孙鹏越

编辑|大 风

杭州AI一夜火了。

有网友调侃道,很有意思啊!我们小小的杭州,干掉美国三大科技巨头。

一家名叫幻方量化(Deepseek)的AI公司,干出来拼多多式的伟业,让全世界为之震撼,把AI训练成本直接打下来99%,打破了OpenAl的霸权; 一家名叫宇树(Unitree)的机器人公司,干掉了美国最知名的工程与机器人设计公司波士顿动力,秒杀原本的液压技术路线,反超波士顿动力的机器狗; 一家名叫毫微(Nano Labs)的无晶圆厂IC设计公司,刚刚推出FPU3.0 AI ASIC设计架构,同类产品已超英伟达的五倍以上。

在科技圈,一直流传着“AI四小龙”商汤、旷视、云从、依图科技;“大模型六小虎”智谱、MiniMax、月之暗面、百川、零一万物、阶跃星辰。

现在,杭州也有了自己的AI三支柱。

改变AI时代的底层逻辑

众所周知,AI大模型越智能,支持的场景越多,就意味着它需要的芯片和算力就越多。

全世界的算力需求,让英伟达从一家显卡厂商,硬生生蜕变成一家三万亿美元市值的巨无霸。

但哪怕是英伟达、AMD、英特尔等全部半导体公司加起来,也满足不了AI市场逐年上扬的算力需求。

就在所有AI公司都苦于算力缺口之际,来自中国杭州的一家AI创企幻方量化,发布了一个参数量高达671B的大模型:DeepSeek-V3。

更让人惊讶的是,DeepSeek-V3仅仅只用了2048块GPU训练了2个月,且只花费557.6万美元。

对比OpenAI的GPT-4o,它的训练成本约为1亿美元,至少在10000个GPU的计算集群上训练。

也就是说,幻方量化只用了五分之一的芯片,二十分之一的成本,就训练出一个参数量第一梯队的大模型。

DeepSeekMoE

这样的成绩瞬间引爆了整个AI市场。

前OpenAI联合创始人、Tesla AI团队负责人Andrej Karpathy在社交平台发文赞叹道:”Llama 3 405B使用了3080万GPU小时,而DeepSeek-V3看起来是一个更强大的模型,仅使用了280万GPU小时(计算量约为十分之一)。“

“如果DeepSeek-V3的优良表现能够得到广泛验证,这一模型将是在资源受限的情况下,在研究和工程方面让人印象深刻的一次展示。”

据DeepSeek-V3研发团队表示,之所以能用较低的价格完成高难度大模型训练,主要是采用了高效推理的多头潜在注意力(MLA)和用于经济训练的DeepSeekMoE。

多Token预测目标(Multi-Token Prediction,MTP)有利于提高模型性能,可以用于推理加速的推测解码。并采用一种创新方法,将推理能力从长思维链模型(DeepSeek R1)中,蒸馏到标准模型上。

这种“分布式推理”的方式早有人提出,例如OpenAI联合创始人兼前首席科学家Ilya Sutskever就曾经说过:“我们已经达到了数据峰值,AI预训练时代无疑将终结。”

但没想到的是,一直将中国大模型视为“廉价替代品”的美国企业,在“分布式推理”领域上,被一家中国杭州的企业先拔头筹,用技术给他们好好上了一课。

可以说,DeepSeek-V3让AI世界享受到了拼多多式的快乐。

从机器人到半导体设计

如果说DeepSeek-V3的出现,让硅谷巨头们真切意识到中国AI产业的进步速度,而宇树(Unitree)和毫微(Nano Labs)则继续让他们处于“持续应激”之中。

前不久,宇树发布了旗下行业级机器狗B2-W(B2机器狗的进阶版)的炫技视频,在视频中,B2-W机器狗演示了如何爬山、涉水、越障,克服崎岖地形、颠簸路面流畅行走。

宇树B2-W机器狗

除此之外,B2-W机器狗还能完成高难度的杂技动作:原地旋转稳停、两足倒立旋转、2.8米高楼飞跃。另外,该机器人可负载40千克行走,一个成年男性的重量不在话下。

宇树B2-W机器狗视频引发了全网热议,就连太平洋彼岸的马斯克,也忍不住转发并评论称赞。

B2-W机器狗不仅仅是一个“高价宠物”,它最适合的场景是专业领域,比如安防巡检、勘测探索、公共救援、医疗防疫陪护等危险厂家,让人员避免事故风险。

据新华社12月14日报道,警用机器狗加入成都市公安局高新区分局巡逻大队,开展安全巡逻和宣防工作。

值得一提的是,机械狗原本是美国高科企业的代表,就比如波士顿动力,从2005年就开始研发出第一款“大狗机器人”。

彼时,宇树基本上只是波士顿动力的跟班,跟着大佬的脚步一点点“照猫画虎”,从产品形态再到商业生态位,宇树一直走的是波士顿动力“平替版”路线。

然而仅仅只过了数年时间,宇树就成功研发出运动性更高、平衡性更强的动轮方案,取代了波士顿动力的四足方案,一年时间里完成了能在户外环境里跋山涉水的训练。

不少波士顿动力的死忠粉纷纷破防,还觉得宇树B2-W机器狗的视频一定是AI生成的CGI画面。

宇树B2-W机器狗

除了大模型和机器人,在半导体领域,也有一家杭州公司,对“巨人”英伟达发起了冲锋。

那就是毫微(Nano Labs)。

12月26日,Nano Labs正式推出FPU3.0,采用ASIC架构,在能效上实现了五倍的提升,树立了能源高效、高性能ASIC的新标准。能广泛应用于AI推理、边缘AI计算、5G数据传输处理和网络加速等领域。

作为AI与区块链技术的老玩家,Nano Labs是国内领先的无晶圆厂IC设计公司,从2022年就陆续推出多款HTC和HPC芯片设计的全新基础构架芯片。

目前来说,ASIC架构芯片已经成为AI世界的主流选择。

在执行大规模特定的AI任务时,ASIC可以针对特定应用设计的芯片,进一步提高计算的效率、降低功耗并提高性能。

摩根士丹利在12月15日发布研报《AI ASIC 2.0:潜在赢家》认为ASIC凭借针对性优化和成本优势,有望逐步从英伟达GPU手中争取更多市场份额。

预计AI ASIC市场规模将从2024年的120亿美元增长至2027年的300亿美元,年复合增长率达到34%。

目前,ASIC芯片朋友圈逐步扩大,谷歌、Meta、微软、亚马逊等大厂都将推出自家AI ASIC芯片。

为什么是杭州?

“中美贸易战里最大矛盾,是华盛顿市宾夕法尼亚大街1600号临时居民与深圳市南山区粤海街道企业之间的纠纷。”

这是前几年最火热的段子,而“华盛顿市宾夕法尼亚大街1600号”是指美国白宫;

“深圳市南山区粤海街道企业”则是指华为、大疆、中兴、腾讯等坐落在深圳南山区粤海街道的中国科技大厂们。

如今中美贸易战热度降低,科技斗争的矛盾点逐渐转移到了当下互联网的核心:AI。

同样, 和美国科技巨头的对抗前线,也从深圳南山区转移到杭州。

很多人不知道,早在AI浪潮之前,杭州就已经被称为人工智能的“东方硅谷”,更是国内第一座“人工智能之城”。

杭州城市大脑

2016年10月,杭州成为全世界第一个启动“城市大脑”基础建设。

杭州将安装一个人工智能中枢:杭州城市数据大脑。让数据帮助城市来做思考和决策,将杭州打造成一座能够自我调节、与人类良性互动的城市。

美国著名城市理论家、社会哲学家Lewis Mumford在著作《技术与文明》中提及,人类城市发展分成三个阶段:古希腊城市(初始文明),中世纪基督教城市(商业文明),近代和现代工业城市(工业文明)。

全世界第一个启动城市大脑的杭州,将对城市文明发起第四次浪潮,一个基于互联网、数据和人工智能的“科技之城”。

如果你问我,为何是杭州?为何是他们?为何是今年?

那么这就是答案。