DeepSeek爆火,国内同行度过了一个痛苦的春节
3 小时前 / 阅读约10分钟
来源:36kr
鲶鱼游进了舒适圈

DeepSeek让国内一众大模型同行度过了一个“痛苦”的春节。年前,DeepSeek掀起AI海啸,有某大厂大模型业者就捶胸顿足:“产品超出了我的想象,比咱家的各方面都好,真想跳槽到DeepSeek。”还有很多人反思,为啥咱自家就没做出DeepSeek。也有业者不服气,认为“它的火只是一种情绪的泡沫。”

#01 焦急:DeepSeek比咱家的好太多

李辉(化名)是北京一家大模型公司的资深从业者。DeepSeek爆火时,李辉的公司还没放假,他跟工位上的同事们展开热烈讨论。

“我开玩笑说,真想跳槽到DeepSeek。个人认为,产品能力与ChatGPT不存在差别,满意程度80-90分,国内其它大模型分数我只给一半。”李辉说。

李辉的公司一直被认为是国内大模型行业的先行者,相关技术积累很深,过去一年与各行业开展大模型商业化应用,也取得了一些早收成果。但在李辉看来,DeepSeek有两点让他觉得“很厉害、有希望”

一是产品能力。就李辉的使用体验,其它国内大模型用起来,十分挑用户输入的prompt(提示词)。但DeepSeek用起来,向自然语言交互又迈进了一步。

“不管说什么它都能理解,不用费劲解释或重新调整提示词,它回答起来上下文也很顺畅。”

李辉就让DeepSeek帮自己整理了一套某类型漫画,结果从中文到日文名,全部条分缕析、进行了罗列。“我也有让它推荐下载地址,结果问了好几次都被DeepSeek拒绝,因为它也有版权保护意识。”

二是给行业带来了希望。李辉虽然身系“局中人”,但他一直觉得:各行各业高估了大模型的作用。虽然DeepSeek的产品能力令他眼前一亮,但他仍然没有改变目前的观点。

“让我稍微觉得欣慰的是,deepseek用较为低廉的成本,取得了跟OpenAI差不多的效果,这意味着它的商业化发展有了更大的眉目。

这句话切中的是2024年国内大模型的发展痛点。2023年国内大模型烧的是钱、比的是技术,但到了2024年,国内各家都在抓紧探索大模型的商业化变现之路。

原因无它,只因为大模型是个烧钱机器,即便是账户上躺着数百亿现金的大公司,也经不起GPU、电力能源、训练成本三座吞金兽的重压。而DeepSeek推出后,全球乃至国内各家公司争相宣布接入,可以说DeepSeek正在给无资本、无技术、无知识储备的公司带来普惠。

如此夸竞对的产品,一个尴尬的问题也免不了被同事追问,“为何咱自家公司没能做出这样的产品?”

李辉说:“做不出倒是符合预期。不仅咱们,国际上那么多巨头不也被干趴下了吗。很认真地说,如果有机会,我还真愿意跳槽去DeepSeek。”

不过可能他已经晚了。小红书上,后悔没有接DeepSeek offer的帖子已经多如牛毛。

#02 应激:这只是情绪的泡沫

李辉对DeepSeek这条鲶鱼是比较正向的评价,他痛苦自己“身在曹营心在汉”,业内还有另一波“痛苦声音”—不认同、不服气。

另一家总部位于北京的某大模型公司从业者王锐(化名),对DeepSeek的爆火持相对理性的态度。他和自家人都用DeepSeek做了测试,结果遇到两个bug,让他对DeepSeek没有建立起先入为主的好印象。

他的父亲先是问DeepSeek立春是几时?别的大模型都能准确答出:是22时10分。但DeepSeek回答是:下午4点。

然后他自己又问DeepSeek春节档电影票房排名,结果DeepSeek把还没有上映的《流浪地球3》也算了进来。

对小错误“斤斤计较”的背后,是王锐不认为市场主流的其他大模型产品能力就逊色于DeepSeek,“大模型幻觉”这个广泛存在的难题依旧存在。

他认为若一定要在此时此刻论DeepSeek的功绩,在于它在开创了全新的模型训练模式,在加速AI行业迭代的同时,对AI产品做了进一步的用户破圈,而这是2024年各家大模型都在努力去做但收效还在路上的一件事——即从重视B端客户(企业客户),转向面向B端和C端并重,尤其是C端,即普通人用户。

这个背景是,多家头部公司都在2024年不约而同地意识到:只靠B端客户,难以支撑起大模型的用户规模,因而需要C端也多多用起来,而面向C端用户推出相关AI应用级产品、探索相关的商业模式,成为各家去年重点发力目标。

2024年,夸克(阿里系)和豆包(字节系)成为国内166款主要App中唯二迈入“亿级俱乐部”的玩家,成功为行业AI to C市场拓展打了个样。

而就在2月6日,阿里又宣布,引进全球顶尖人工智能科学家许主洪教授(Steven Hoi)出任集团副总裁,负责AI To C业务的多模态基础模型及Agents(智能体)相关基础研究与应用解决方案,这些都是头部玩家在AI to C端市场布局的表现。更有媒体称,“AI to C已经走到了super APP的前夜”

不过DeepSeek虽然吸引了1600万次下载,但王锐有一个疑问是:很多人可能更多是出于一种跟风的情绪来下载使用它,而情绪从来就是一种泡沫。

《黑悟空》制作人冯骥就把DeepSeek-R1,称为“国运级别的科技成果”。在极客圈聚集的知乎和即刻平台内,也有人因而把DeepSeek视为“AI界的华为”,但王锐认为,大家忽视了真正产品力上的对比。“而这些靠情绪而来的用户,是否真的是产品的核心高频用户,也是个疑问”。

图 | 截图来自 冯骥微博

另一家AI公司从业者梁伦(化名)也和王锐持有部分相同的观点。他引用网上自来水的评价称,“感觉DeepSeek并没有xx产品(梁伦家的产品)回复的准确性高,这背后是资本的力量吗?”

但梁伦表示,DeepSeek爆火后,身边同事也明显有了更乐观的情绪:“这说明中国科技公司完全有机会挑战美国市场,也瞬间把国产AI的斗志给提了起来,之前那么多的冷嘲热讽,接下来的技术竞赛有得看。

#03 冷静:DeepSeek能保持红利多久?

普通从业者对DeepSeek议论纷纷,很多是从个人角度考虑,比如是否应该跳槽,获得更大的职业发展性。老板们的眼界就不一样了。

去年12月末,“雷军出手千万年薪挖来95后AI天才少女罗福莉”的消息不胫而走,她被称为是DeepSeek的首席架构师。不过该消息并没有后续——即罗福莉官宣是否有加入。随着DeepSeek爆火全球,罗福莉是否产生了动摇不得而知。

图 | 罗福莉公开图片

舆论场上有一种声音,可能受到冲击更大的,是来自国内大模型的六大独角兽公司,也被称为“AI六小虎”

李辉就表示,此前AI六小虎对内讲故事,但在海外知名度多并不高,除了其中一家因被列入美国商务部的出口管制实体清单而在海外有了些许认知度外。因为国外大模型进不来,所以国内AI六小虎的故事,此前还多少还有点听众。

“但现在就不同了,DeepSeek直接就把战线拉到了跟OpenAI、Gemini齐平的水平。就在2月6日(昨日,编者注),Google发布Gemini 2.0(多模态大模型),媒体都报道剑指的就是DeepSeek,这在之前是不可想象的。DeepSeek对海外巨头形成了降维打击,接下来AI六小虎的故事、企业融资、企业估值是否有变化,值得关注。甚至是否会终结国内的百模大战,也不是不可能。”

此外,李辉还补充到,DeepSeek可能反而会让业界对大模型的期待降低,DeepSeek一定程度上戳破了大模型的泡沫,让行业回归理性。

“之前是画大饼,现在是开始讲谁性价比更高了,因为大模型谁都能搓,但能搓出来既好用又便宜的才行。最近几个大模型发布的时候都在强调价格低。”

这说的确实也是事实。从2024年至今,各家大模型卷起了价格战。各大厂主力大模型纷纷降价,比如去年5月,通义千问GPT-4级主力模型Qwen-Long,API输入价格就直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。

其它诸如智谱AI等也都纷纷降价。有媒体冠上标题,“大模型定价进入了厘时代”,意思是每一千tokens价格不足1厘。

不过,一如普通从业者的意见分化,国内也有不少来自机构的声音认为,目前市场对DeepSeek的“追捧有点过了”

有大厂不愿意具名的业者就表示,“DeepSeek目前可能还威胁不到大厂,因为大厂也能做。”也有声音点出,可能DeepSeek目前更适合中小企业,因为中小企业一般都是“哪个便宜够用就用哪个”

李辉虽然觉得DeepSeek产品力很棒,但他仍然有两点疑问。DeepSeek-R1的成本宣称仅为国外大模型的三十分之一‌,事实果真如此?

第二个疑问是,既然有DeepSeek,就有可能哪天冒出来一个DeepFind,DeepSeek未必就是国内性价比大模型的终点。

就在昨日,有媒体报道,有“AI教母”之称的李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型,据称该模型在数学和编码能力测试中的表现,与Open AI的O1和DeepSeek的R1等尖端模型不相上下。媒体采访相关业内人士后发现,s1是基于阿里云通义千问模型进行了监督微调,意思是后者才是“真牛”。

不管怎么说,国内有竞争,对各方都是好事一件。对于普通企业和个体用户来说,能够不断以较低的成本使用能力更强的AI,就是利好。只是对从业者而言,在中国AI军团开始真正登上国际舞台肉搏的这个时代,痛苦和快感将是2025年的一体两面。