智东西2月16日报道,杭州深度求索公司DeepSeek的爆火,用开源逼得一众头部大模型同行紧急调整战略布局。百度、阿里、腾讯、网易把旗下多款国民级产品接入DeepSeek,抖音集团猛推火山引擎和飞书,“大模型六小虎”的3家都将自家产品接入DeepSeek。
仅是这3天,就有腾讯、百度、网易3家大厂连番追加新动作:
“大模型六小虎”中有3家独角兽已积极拥抱DeepSeek:零一万物、MiniMax分别在海外版产品中接入DeepSeek R1,阶跃星辰则率先将其国内拳头AI产品跃问接入DeepSeek R1。
目前腾讯的ima.copilot、QQ音乐、腾讯元宝、微信、QQ浏览器、腾讯文档、腾讯云AI代码助手、腾讯元器、腾讯乐享、腾讯地图,百度的文小言、Apollo自动驾驶、百度地图、百度搜索、文心智能体平台以及百度智能云旗下客悦、曦灵、一见、甄知,阿里的通义灵码、钉钉,蚂蚁的支付宝百宝箱,字节的飞书,360的纳米AI搜索,网易的有道词典、《逆水寒》手游,这些产品都接入了DeepSeek。
与DeepSeek不构成直接竞品关系的手机品牌,更是无所顾虑地在自家AI助手中提供DeepSeek模型选项。八大手机品牌华为、荣耀、OPPO、vivo、魅族、努比亚、红魔、联想摩托罗拉,均已宣布将AI助手接入DeepSeek-R1。小米也在2月14日被曝对小米澎湃OS2的超级小爱说“打开深度思考”能使用DeepSeek-R1,而后该功能暂时下线。
有意思的是,尽管DeepSeek-R1在业界搅起腥风血雨,但至今DeepSeek官方公众号置顶的精选文章还是11月20日的DeepSeek-R1-Lite预览版和12月26日发布的DeepSeek-V3。
彻底引起全球大模型产业巨震的“导火索”,是1月20日正式发布的大招——DeepSeek-R1性能对标OpenAI o1正式版+开源模型权重+开放思维链输出+网页版和App免费可用+API每百万tokens输入只要1块钱+论文训练技术全部公开。
在被聚光灯对准的这些天,DeepSeek一直保持低调,除了1月27日发布春节AI贺词文章、1月28日开源多模态统一理解生成模型Janus-Pro外,就只在2月6日更新过一篇打假仿冒账号的《关于DeepSeek官方信息发布及服务渠道的说明》文章。
2月7日~11日,DeepSeek招聘页面发布多个社招岗位信息,包括深度学习研究员等【急】、核心系统研发工程师【急】、全栈开发工程师【急】、深度学习研发工程师【急】、数据百晓生、高级运维开发工程师、高级技术专家(50-100K/月等)、数据中心技术主管、资深系统运维工程师、招聘经理(20-60K/月)、高级数据采集工程师(25-50K/月)、AGI法务等。
人事变动方面,企业信用查询平台企查查显示,2月15日, DeepSeek关联公司 深度求索发生工商变更,裴湉由执行董事兼总经理改任经理、董事,新增王贤祖为财务负责人,同时经营范围新增互联网信息服务。
面对DeepSeek的强势崛起,其他大模型同行则恐怕度过了一个极其难忘的春节和节后开工。
下面,我们来回顾下从1月20日DeepSeek-R1横空出世至今,这四周,国内主流基础大语言模型供应商们都做了哪些事(括号内是这些企业的自研大模型名字)。
春节前,MiniMax、阶跃星辰、月之暗面、百川智能均发布了新模型,而且后三家都发布了推理模型。
节后,“大模型六小虎”动向各不相同,阶跃星辰最先在国内产品中接入DeepSeek,零一万物、MiniMax则在海外版产品中上新DeepSeek。 其中阶跃星辰、MiniMax都在主攻多模态,零一万物今年将重心转向轻量化模型和AI-First应用,因此与DeepSeek并未构成强竞争关系。
另外三家中,智谱忙着发布面向AI PC和智能手机的To B智能体合作,百川智能专注于做医疗模型和产品。 去年在Kimi上大举投流的月之暗面,则在今天才发表蛇年的首篇公众号文章。据虎嗅2月15日报道,月之暗面内部已将“持续拿到SOTA结果”确定为当下最重要的工作目标。
此外,有自研基础大模型的移动互联网独角兽APUS麒麟合盛也已宣布接入DeepSeek。
1、阶跃星辰(Step)
1月20日,发布极速响应、高性价比的轻量级推理模型Step-2 mini,以及专为创作而生的Step-2文学大师版。Step-2文学大师版已上线跃问App,网页端在官宣当周全量上线。
1月21日,宣布多模态理解大模型Step-1o Vision上线,语音模型Step-1o Audio能力升级。两款模型均在跃问网页版和App全量开放。
1月22日,发布视频生成模型Step-Video V2版本,支持在跃问网页端申请试用。
1月24日,宣布推出“跃问AI创意板”,在跃问最新版本上线,支持0代码基础、3步开发应用。
2月16日前,阶跃星辰跃问网页版接入DeepSeek,可免费体验,支持深度思考、搜索、上传文件。
传送门:yuewen.cn/chats/
2、MiniMax稀宇科技(ABAB)
1月20日,宣布全新升级的T2A-01系列语音模型,全球同步上线海螺语音产品,预置不同语种共计300+音色,支持自定义音色的通透性、力度以及叠加回声、广播、失真、电音等特殊效果。
2月16日,宣布海外网页版MiniMax Chat已接入DeepSeek R1,限时免费体验,暂不支持联网搜索(选MiniMax-Text-01是支持联网搜索的)。
传送门:chat.minimax.io
3、零一万物(Yi)
1月23日,发布2024年终总结,宣布将聚焦轻量化模型,加速AI-First应用探索,积极拥抱应用、穿透产业。
2月7日,发布人民日报专访零一万物CEO李开复博士的文章,强调2025年将会是AI-First应用爆发的元年。
2月12日,宣布海外版产品PopAi接入DeepSeek R1模型,提供深度思考和联网功能,网页版和App均已上线。
传送门:popai.pro
2月14日,宣布零一万物与苏州高新区联合成立的产业大模型基地正式授牌。该基地将作为聚焦垂直产业的大模型基地,重点打造制造、金融、医疗、政务等多个领域的行业大模型解决方案。
4、APUS麒麟合盛(天燕)
2月15日,宣布在官网上推出DeepSeek APUS加强版大模型。此版本以满血版DeepSeek R1大模型为基础,从“能用、会用、好用”三个方面进行全面优化与提升。
传送门:chat.apusai.com
5、智谱(GLM)
1月21日,宣布清影2.0现已在智谱清言全量上线,带来更强的视频生成能力。普通用户可以智谱清言上免费试用,会员享受快速通道(不扣积分的无限模式)。
1月23日,宣布首个面向公众、回车即用的电脑智能体(agent)GLM-PC开放体验,最新推出「深度思考」模式,并增加了专用来做逻辑推理和代码生成的功能,也提供了对Windows系统的支持。智谱正与联想、华硕等PC厂商展开深度合作探讨,推动AI PC创新与发展。
2月11日,宣布和三星基于Agentic GLM展开合作,将Agent体验带到三星最新手机Galaxy S25系列上。
2月11日,发布一则1月23日的旧新闻:智谱CEO张鹏出席中国银行《支持人工智能产业链发展行动方案》发布活动并发表致辞;智谱是中国银行总行的智能化场景建设合作伙伴,并与中行北京分行紧密合作。
6、百川智能(Baichuan)
1月24日,发布全场景深度推理模型Baichuan-M1-preview和医疗增强开源模型Baichuan-M1-14B。
1月26日,宣布开源全模态理解生成统一模型Baichuan-Omni-1.5上线,并开源两个评测集OpenMM-Medical、OpenAudioBench。
2月14日,宣布首个AI儿科医生正式“上岗”:国家儿童医学中心首都医科大学附属北京儿童医院在2月13日开展了国内首次“AI儿科医生+多学科专家”的双医并行多学科会诊,引入了由北京儿童医院与百川智能、小儿方健康科技联合研发的以Baichuan M1大模型为底座打造的“AI儿科医生”。
7、月之暗面(Kimi)
1月20日,发布全新SOTA模型k1.5多模态思考模型,声称k1.5“应该是全球范围内,OpenAI之外的公司首次实现o1正式版的多模态推理性能”,首次公开模型训练技术报告,宣布预览版将陆续灰度上线网页版和最新版App。
1月21日,宣布Kimi智能助手上线《2024年度认知天赋报告》。
1月26日,分享一些用户使用Kimi的年度故事,公布Kimi交互成绩单(2024年给出了40亿个问题的答案)。
1月31日,宣布Kimi智能助手最新版iOS和Android应用、网页版上线k1.5。
2月17日,公众号发文分享月之暗面研究员Flood Sung在知乎上回答的k1.5模型背后的完整思考过程。
科技巨头个个是狠角色,优势在于独立业务多,不用太在意自家大模型团队的感受。关键看谁能抢占发挥自家优势,抓住先机争取到更多的用户和收入。
接入DeepSeek的核心业务分为两大块,一块侧重提供算力+模型开发服务,另一块侧重应用。
模型方面,阿里通义、字节豆包都发布多款新模型。
在2月13日举行的全员会上,字节CEO梁汝波反思与创业公司相比,字节跳动在对待大模型新机会时的敏感度明显不足,提出今年字节在AI领域的重点目标包括追求“智能”上限、探索新的交互和加强规模效应,认为相比追求某个具体产品,把智能本身作为最重要的目标可以激发更多尝试、不忽略关键技术节点。
云服务方面,华为云打响DeepSeek上云第一枪,腾讯云、百度智能云、阿里云、火山引擎、浪潮云等纷纷跟上。蚂蚁亦宣布支付宝百宝箱支持用DeepSeek构建智能体。
应用方面,腾讯、360分别都将自家AI大模型产品腾讯元宝、纳米AI接入满血版DeepSeek-R1。百度文小言则含蓄一些,没有直接提供替换文心大模型的选项,只是将R1模型用于优化拍照解题功能。
QQ音乐、QQ浏览器、腾讯地图、百度地图、网易有道词典等国民级应用都接入DeepSeek了,全国TOP1月活的微信也刚刚开启DeepSeek灰度测试,不知道网易云音乐、百度浏览器、高德地图、QQ等应用会不会很快跟上。
一些拥有自研大语言模型的手机巨头,包括荣耀、OPPO、vivo、中兴(努比亚和红魔)、联想摩托罗拉,都已将AI助手接入DeepSeek。
由于大厂更新消息实在太密集,这里仅梳理了它们在大模型方面的相关动作,不涉及它们分享的教程及合作伙伴案例。
1、华为(盘古)
华为云:
华为计算:
华为数据存储:
鸿蒙版小艺助手:
2、腾讯(混元)
腾讯混元:
腾讯云:
ima.copilot:
QQ音乐:
腾讯元宝:
微信:
QQ浏览器:
3、百度(文心)
文心一言:
文小言:
百度智能云:
文心智能体平台:
Apollo智能驾驶:
百度地图:
百度搜索:
4、阿里巴巴(通义)
阿里云通义千问:
阿里云:
通义灵码:
5、字节(云雀)
豆包:
火山引擎:
飞书:
6、浪潮(海若)
浪潮云:
7、蚂蚁(AntGLM)
蚂蚁技术:
8、网易(玉言)
网易云商:
有道词典:
网易伏羲:
9、360(360智脑)
360:
纳米AI搜索:
10、联想(天禧)
联想小天:
联想智能云:
11、荣耀(魔法)
荣耀YOYO助理:
12、OPPO(AndesGPT)
ColorOS小布助手:
13、vivo(蓝心)
OriginOS蓝心小V:
14、中兴通讯(星云)
红魔:
努比亚:
15、小米(MiLM)
澎湃OS超级小爱:
其他拥有自研基础大模型的上市公司中,科大讯飞、商汤科技主要通过MaaS模式来提供DeepSeek模型服务,昆仑万维、出门问问、知乎将DeepSeek接入了自家产品,云天励飞、云从科技均宣布训推一体机成功适配DeepSeek。
1、科大讯飞(星火)
2、商汤科技(日日新)
3、昆仑万维(天工)
传送门:tiangong.cn
4、出门问问(序列猴子)
5、知乎(知海图AI)
传送门:zhida.zhihu.com/pro
6、云天励飞(天书)
7、云从科技(从容)
DeepSeek的大语言模型同行们,有的顺势而为,有的按兵不动,有的大举接入,有的卷生卷死。
阶跃星辰、腾讯、360均在自家AI大模型产品中加上了DeepSeek R1深度思考+联网搜索选项,阿里和豆包的自家模型更新最勤,腾讯、百度有来自不同业务的多款产品接入DeepSeek,百度还宣布将免费开放文心一言、开源文心大模型4.5。
去年卷投流最猛的Kimi和豆包两家,高层似乎都将取得最佳模型性能视作今年的重心,大有要在模型上与DeepSeek一较高下的架势。
周末,两大掌握巨量流量入口的微信、百度搜索接入DeepSeek,震动整个市场。而阿里、字节在产品接入方面的出手相对收敛,最先拥抱DeepSeek的是云服务和协同办公软件,阿里的淘宝、支付宝、高德以及字节的抖音,这些掌握高月活的超级App均未宣布全面接入DeepSeek。
接下来,“大模型六小虎”会如何讲好新故事?下一个将DeepSeek上架的产品,又会来自哪家大模型供应商呢?