36氪「职场Bonus」(ID:ZhiChangHongLi)
DeepSeek爆火续写了AI行业的神话,但融资时对标OpenAI的百川智能,却并未迎来春天。
《职场Bonus》从多个独立信源独家获悉,近日百川智能发生了以下变动:
1.基础模型停训,相关核心负责人提出离职准备创业,聚焦AI Coding方向。
2.医疗线产品负责人准备离职创业。
3.人力正在做相关调整优化动作,人员或将达到百人规模,医疗To B业务作为此前百川的重点业务的部分,或将成为重点裁撤对象。
《职场Bonus》就上述信息向百川智能求证,公关否认了以上的说法,并回应称“均不属实,百川一直是把 AI 医疗作为发展方向,会一直做医学增强大模型”。
多位信源告知《职场Bonus》,本次调整涉及近百人,包含技术、医疗To B业务。此外百川智能在去年年中就已经不做预训练了,“退掉了预训练的卡,预训练组已经离职的快差不多了”。实际上,这也并不是百川第一次裁员。
今天早些时候,蓝鲸新闻报道称,百川智能的联合创始人焦可已经离职,另一位联合创始人陈炜鹏也将离职,目前还在走内部流程。这也和前文信源的说法一致。
据《智能涌现》,此前百川智能负责To B业务的商业服务部门被裁撤,员工均在3月3日当天签署离职协议。《职场Bonus》从知情人士处了解到,上次调整优化B端组共40人左右。
模型研发停摆,核心人员出走,裁撤此前“聚焦”的医疗To B业务,在加速前行的行业中,百川智能按下了暂停键。
基础模型训练停摆,核心负责人申请离职 ╱ 01
R2来临前的恐惧,“断臂”医疗 To B?╱ 02
急刹车,To C 寻生机 ╱ 03
今年初,模型研发技术负责人提离职,也是促成王小川调整优化决定的重要一环。《职场Bonus》从资深猎头处获悉,业内对百川的基础模型团队,认可度还是很高的。
核心技术负责人要出走,后续需重新招聘新技术负责人,待其适应后再推进研发工作。这一系列过程不光需要花费大量金钱和精力,时间也是更重要的成本。
但百川智能等不了这么久。业内人士告诉《职场Bonus》,造成现在这个局面,是因为去年年中王小川一意孤行转向医疗,导致基础技术被落下。
转向医疗,意味着要分更多的卡和算力,去训练新的模型,而彼时还兼有金融大模型的训练工作,留给基础模型的就不多了。也是去年年中,百川预训练也近乎停摆,“不怎么做了,新订的卡都退掉了。”
百川成立之初,是要做“中国的ChatGPT”的,拿麻了融资。彼时,王小川高喊“超级模型+超级应用”双轮驱动的发展战略。2023年,百川智能加速追赶,仅半年的时间,百川智能就发布了自己的开源模型baichuan-7B,模型能力也曾“手拿”ChatGLM,“脚踩”LLaMA。而开源7B模型后的26天,百川智能又开源了自己的商用大模型Baichuan-13B。
2024年上半年,王小川频繁在公开场合提到,“医疗是大模型‘皇冠上的明珠’”。医疗早就在王小川的心中埋下了深深的种子。2023年4月,在《智能涌现》与王小川的第一次对谈中,王小川就不吝表达了自己对生命健康的热爱和对医疗的兴趣。
不过,王小川在和《晚点》的对话中也曾表示,“不讲通用模型的故事,难拿到融资。”
虽然缓慢,但去年,百川的基础模型还是在跟进的,“至少那时候,多模态和强化学习还在做”,《职场Bonus》从一知情人处获悉,“但今年春节,DeepSeek来了,王小川突然不知道做模型有什么意义了。”
DeepSeek是开源模型,技术平权的另一面是,很多闭源自研模型在To B的价值就被削弱了,这中间也包括百川。其他大模型公司的员工向《职场Bonus》透露,有B端用户直接提出能否在部署闭源模型时的同时,接入DeepSeek模型。令人哭笑不得。
而与模型研发负责人的技术路径分歧,更让王小川看不清前路。知情人士告诉《职场Bonus》,这也是促使技术负责人离职的重要原因。王小川此前认为基础模型训练并不需要投入太多成本,并且判定自家技术半年之内追不上DeepSeek,因而春节过后基本什么都不做了。而前者并不认同这种做法。
去年的百川,融资消息频传,技术、业务也在跟进,公司整体还是风光无限的。
知情人士称,去年早些,百川就计划布局金融领域。入局金融,是因为金融行业市场化更完善,收益高。并且金融行业的资金还算充裕,有意愿,更有能力探索人工智能。
从《百川智能商业服务》公开信息来看,百川对金融的布局还是很深的。百川智能商业服务部门2024年给百川带来了中国银行、北电数智、招商银行、信雅达、天开集团等多个头部企业客户和合作伙伴。
而To B业务是百川造血等心脏,在2024年为百川带来了近1亿的收入,百川内部也曾预计2025年To B业务将成倍数增收。To B业务的增长令百川信心倍增,百川智能联合创始人茹立云在接受《财新》专访时曾提到,公司2025年订单签约额将在10-20亿元的水平。
而DeepSeek来了之后,一切都变了。
不光王小川,大模型六小虎都陷入思考:比自己更强、更火,还开源的模型来了,我们大模型研发继续进行的意义在哪儿?如果浪费大量时间精力跟上了,技术又更新了怎么办?To B的商业化模式定制成本居高不下,还要继续吗?
频传的DeepSeek-R2提前发布的消息,更是加剧了AI六小虎的担忧。2月25日,路透社消息称,DeepSeek正在加速推出其下一代AI模型R2,原计划于5月发布,但公司正在努力尽快推出。
另一接近百川智能的人士告诉《职场Bonus》,现在百川智能做的医疗商业化业务,也并不赚钱。大模型项目的定制化程度高,导致的成本高等问题,也是业内一直不看好大模型To B商业模式的关键。
协和医院接触过大模型研究的专家也告诉《职场Bonus》,医疗专用模型的普适性差。由于临床经验之间的差异,医院用自己研究中心数据训练出来的医学专用模型,只适用于自己中心,套到别人家就会有明显的误差。
不仅如此,单家医院用来训练大模型的数据量很有限,而医院与医院之间,也因为临床水平之间的差异,数据与数据之间很难互通。并且,出于对病人隐私的保护,医院的数据也是禁止出院的。这也增加了医疗模型的训练难度。
医疗To B本也是一块难啃的骨头。商业化来说,在我国的体系里,医疗是不能做盈利机构的行业之一。医院虽然以积极开放的态度拥抱AI,但上百万一年的定制化模型开支,对医院来说仍是一笔巨款。
大厂涌入医疗,更是让百川难上加难。年初,蚂蚁集团与好大夫在线正式宣布完成收购;近日,夸克招聘医疗大模型相关负责人;3月7日,华为正式宣布组建医疗卫生军团,聚焦AI辅助诊断及医疗大模型应用。
在“危急”形势下,百川“断臂”医疗 To B。
业内对王小川调整商业服务部的决定还是都比较唏嘘的。“比起调整金融,大家更希望看到他调整医疗。”一位投资人表示。
因为金融本就是IT天然大户,信息都是数字化的,并且数据量也很大,更适合在B端做出一些成果。百川本身技术也不弱,深度做To B场景,积累起自己的Know-How,理论上还是收益还是可观的。
而医疗本就是一个不太好B端商业化的行业,并且Know-How壁垒很高,增长也相对慢很多,PS倍数低 [1] 。
这个决定也侧面反映出王小川对To B商业模式的不太看好。但许多从业者指出,王小川对To B的认知确实还是比较浅。六小虎公司在To B商业化上还是有机会塑造优势的,因为B端商业化,实际上看的是谁更用客户的需求,模型能力排在下位。
“而这也并不能全怪王小川,To B和To C的逻辑确实不太一样,不互通是常事。”一位行业人员表示。
据《智能涌现》,零一万物最近又拆分数字人业务。此前则是“打包”预训练、Infra团队,靠拆分的手段“造血”。一位从业人员告诉《职场Bonus》,零一万物也是账上资金告急,不得不为之的举动。
但与零一万物不同的是,百川账上还有钱。一位接近百川的业内人士估测称,“百川智能账上应该还有30多亿”。王小川现在这么做,可能是想先精简团队成本,再细水长流,伺机而动。
3月17日,《智能涌现》也提到,百川正在讨论如何将医疗和“百小应”结合,研发C端医疗产品。
而前一阵Manus的爆火,已经验证了C端对大模型、Agent的热情。但现阶段来说,市面上能够将 Agent 产品打造出特色的公司屈指可数,而以百川智能的技术底色依旧可以胜任,这也为百川创造了良好的发展契机。而对王小川来说,能回到自己擅长的领域,未尝不是一件好事。
只要百川还留在牌桌上,就还有机会。
[1] PS倍数(市销率,Price-to-Sales Ratio,P/S)是一种用于公司估值的财务指标,它通过将公司的总市值或股价与销售收入进行对比,来衡量投资者对公司销售额的估值水平。高PS倍数表明市场对公司未来的增长潜力和盈利能力有较高的预期;低PS倍数可能表明公司当前被市场低估,尤其是如果公司具有稳定的销售收入和潜在的增长机会。
撰文 | 陈佳惠
编辑 | 陈桐
排版 | 宋九卿
封面图 | Marcelino (Unsplash)
36氪「职场Bonus」(ID:ZhiChangHongLi)
36氪「职场Bonus」(ID:ZhiChangHongLi)