本来节选自IT桔子报告《中国AI创业者人群画像报告(2024)》。
大模型赛道是这两年才在国内兴起的,当下已成为人工智能领域的重要分支,并迅速吸引了大量创业者和资本的关注。
IT桔子目前收录的国内大模型/AIGC相关创业公司有134家。
在当前的新闻舆论领域,国内大模型创业者的背景呈现出明显的多样性,但主要可以归纳为两大类。
第一类是那些曾在互联网大厂担任中高层技术骨干的专业人士。
这些人通常拥有丰富的行业经验和深厚的技术积累,他们在大型互联网公司中负责过关键技术岗位,对人工智能、机器学习、大数据处理等领域有着深刻的理解和实践经验;同时具备了项目管理、团队管理以及商业运营的能力,这使得他们在创业时能够快速适应市场变化,推动技术创新和产品开发。
根据IT桔子数据观察,大模型赛道里大厂派系的创业者代表包括:
第二类则是拥有顶尖高校科研工作背景的创业者。
这类创业者往往深耕学术界,有着深厚的理论基础和科研能力,他们或曾是高校的教授、主任、院长,专注于人工智能、计算机科学等前沿领域的研究。并且他们还擅长将最新的AI科研成果转化为应用,这些创业者通常对技术细节有着精准的把握,能够引领团队在技术研究和产品开发上取得突破。
AIGC/大模型赛道的学院派代表有:
这两类背景的创业者各有优势,但他们在国内大模型领域中扮演着重要的角色,而且一些头部大模型企业往往会组建具有互补型背景的创始团队,来充分发挥各自的优势,取长补短。
伴随着ChatGPT席卷全球,2023年后的大模型融资驶入了快车道,同时原搜狗CEO王小川、李开复这样的超级大佬也在去年下半年纷纷加入大模型创业浪潮中。
所以,几家头部企业基本都是2023下半年到2024年初这半年多的时间内密集融资,快速晋升独角兽。他们背后的投资方也是清一色的顶级头部机构,如红杉中国、经纬创投、深创投等,以及腾讯投资、阿里巴巴两大互联网巨头也各自下重注。
据IT桔子数据,截止2024年11月,目前国内的大模型/AIGC独角兽企业共有5家,分别是Minimax稀宇科技、智谱AI、百川智能、零一万物、月之暗面Moonshot AI。
IT桔子注意到,这5家独角兽在2024年均披露了新的融资,包括Minimax完成6亿美元战略融资,月之暗面今年完成3亿美元B轮融资,百川智能7月宣布了50亿元的A+轮融资,智谱AI在年内则有2笔新融资进账,可见大模型融资炙手可热。
这5家独角兽公司的核心创始团队,集中了连续成功创业者、顶尖高校毕业生、知名投资人、教授团队等因素。
MiniMax创始人闫俊杰:本科就读于东南大学数学专业,硕士毕业于重庆邮电大学信息与通信工程专业,博士毕业于中科院自动化所,并在清华大学计算机系完成博士后研究。曾在商汤科技担任副总裁、研究院副院长及智慧城市事业群CTO,负责深度学习工具链和底层算法的搭建以及通用智能技术的发展。
月之暗面创始人杨植麟:清华大学交叉信息学院、智源青年科学家,曾参与Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,并手握多项AI大语言模型领域核心技术论文。
百川智能创始人王小川:毕业于清华大学计算机科学与技术专业,曾任搜狗CEO。核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI顶尖人才组成。
零一万物创始人李开复:曾任谷歌全球副总裁兼大中华区总裁,微软全球副总裁,以及创新工场董事长兼首席执行官;团队成员包含前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管、前微软/SAP/Cisco副总裁等。
智谱AI CEO张鹏:毕业于清华大学计算机系,曾作为硕士研究生进入KEG实验室深造,此后攻读清华2018创新领军工程博士;董事长刘德兵、总裁王绍兰均为清华校友,分别出任智谱AI的董事长和总裁。
天时地利、超级知名创业者的下场参与,以及资本的助力等多种因素的加持下,成就了AIGC独角兽的快速诞生、而这样的火热已然持续了一年多。
不过,众所周知大模型研究对资金量需求及其庞大,虽然头部创企融资颇多,但后续发展依然需要持续的融资紧张。到2025年,他们是否还能够保持如此密集的融资节奏和高额的融资额度,还需观察。
在快节奏融资的当下,大模型独角兽的发展和成就如何呢?
据悉,智谱AI的GLM大模型在多轮多意图的语义理解能力以及文档精准有效的总结方面领先于国内外模型,并通过模型私有化、API调用完成GLM系列模型的商用落地。
Minimax稀宇科技布局了MoE架构,推出了文本大模型、语音大模型、图像大模型以及视频大模型,还与金山办公WPS合作打造了WPS AI产品,与掌阅科技合作打造“阅爱聊”。
月之暗面擅长长文本处理,Kimi智能助手支持200万字超长无损上下文,对科研友好。
零一万物计划分拆出独立AI应用公司“绿洲”,侧重to C产品,主推AI搜索应用。
人才和智力资源只是大模型创业起步的必要条件,要将事业做成,还需要多方面的要素。
AI大模型创业和发展面临的挑战和难点主要包括技术、硬件、商业化等几个方面。
技术挑战上,主要是可靠性问题,大模型有时会犯事实性错误,俗称“幻觉”,对于一些具体的数学问题,大模型逻辑推理能力与人类常识相悖;而且大模型训练需要大量的算力资源,算力成本压力大;高质量、标注好的大数据集构建获取难度又大等。
另外,如何将大模型技术转化为实际应用产品和服务,它需要解决性能、成本、稳定性等多个层面的问题,总之大模型的商业落地还有很长的道路要走。