又一豪华 AI 创业团队诞生!
两位来自谷歌 DeepMind 顶尖科学家,官宣组团构建超级智能自主系统(superintelligent autonomous systems)。
公司名为 Reflection AI,先从自主编程下手。
之所以称该团队阵容豪华,是因为 2 位创始人来头不小:
Misha Laskin,Gemini 核心负责人,是谷歌强化学习和大型语言模型方向的领头人。
Ioannis Antonoglou,DeepMind 的创始工程师之一,是 AlphaGo、AlphaZero 和 MuZero 等项目的关键人物。
△ 图源:Reflection AI
除了两位带头人,Reflection AI 官宣的其它创始成员也都来头不小 —— 或出自 DeepMind,或出自 OpenAI,其中不乏资历很深的朋友。
下图为团队曾经参与的作品:
这或许也是为什么,公司官宣成立即同时宣布了融资进展。
Reflection AI 现已筹集了 1.3 亿美元,最新估值为 5.55 亿美元(约 39.78 亿人民币)。
1.3 亿美元融资额中,包括 2300 万美元种子轮融资,由红杉和 CRV 领投;以及 1.05 亿美元 A 轮融资,由光速创投和 CRV 领投。
(注:光速创投投资过美团、拼多多)
公开消息中的其他投资者,包括 LinkedIn 联合创始人 Reid Hoffman、SV Angel 和 Nvidia Corp 的风险投资部门等等。
(注:SV Angel 投资过 Facebook、Google、PayPal、Airbnb、Pinterest、Twitter、SnapChat、Notion 等)
业内人士纷纷祝贺,表示已经迫不及待地想要看到他们的成果,而他们的「强化学习」血统已经说明了一切。
网友更是发了梗图,似乎已经预见到了之后的路径(Doge)。
为什么去年就成立,且此前一直低调行事的 Reflection AI,一下在 AI 界炸出水花?
或许还是因为与公司官宣同时公布的 5.55 亿美元高估值。
公司身价至此,Misha 有 3 条解释。
第一,阵容豪华,实力雄厚。
Reflection AI 拥有“有史以来最强大的 RL 和 LLM 系统背后的团队”,而强化学习和大模型系统,被团队视为超级智能的两个构成本分。
第二,目标明确。
不是做很多事情,而是真正做好一件事 —— 专注于构建世界上最好的自主编程系统。
第三,产研并行。
正所谓,“超级智能不能在真空中构建。”
具体来说,Reflection AI 要做的事情,「目标是通过能够自我指导的 AI 驱动的编程 Agent,实现超级智能」。
Misha 解释了为什么从自主编程下手。
因为团队相信,解决自主编程问题将更广泛地、更快地实现超级智能。
划重点:
解决自主编程问题。
也就是说,该团队侧重于构建具有完全自主性的工具,而不仅仅是充当一种 Copilot 或助手。
Misha 把典型的 AI 助手比作巡航定速驾驶(cruise control driving)。
与之相比,Reflection 则更像谷歌母公司 Alphabet 旗下的自动驾驶公司 Waymo。
“这是我们十多年来一直在思考的问题。”Misha 表示,“我们的团队开创了 RL 和 LLM。现在是时候将这两项进步结合起来,构建一个实用的、可以在计算机上运行的超级智能。”
而公司董事会中的一员、Lightspeed 合伙人 Raviraj Jain 表示,在他看来,Reflection AI 的工作并不是为了取代工程师。
更多的是让工程师不再做繁重的工作,而是变得像建筑师一样,工作转化为监督许许多多的自主 Agent。
BTW,Lightspeed 在 3 月 4 号官宣领投了 Anthropic 的 35 亿美元融资。
那接下来看看,Reflection AI 到底是个怎样的豪华班底。
官方介绍之:他们是来自 DeepMind、OpenAI 和其他前沿实验室的研究人员和工程师,在过去十年中发挥了主导作用,构建了一些最强大的 AI 系统。
成果包括 DQN、AlphaGo、AlphaZero、MuZero、PaLM、GPT-4、Gemini 系列。
没有透露具体姓名,但见其作品已足以顶尖。不过在社交网络上,也是看到了部分团队成员。
两位创始人 ——Misha Laskin、Ioannis Antonoglou。
Misha Laskin。
此前是 Google DeepMind 研究科学家,致力于开发通用智能代理,参与了 Gemini 项目,包括 1&1.5,是 RLHF、强化学习模型的负责人。
Misha Laskin 的谷歌学术论文被引超 1 万次。
加入谷歌之前,曾在加州大学伯克利分校博士后研究,担任过 Claire AI 创始人;再往前,他博士毕业于芝加哥大学理论物理学,本科毕业于耶鲁大学。
Ioannis Antonoglou。
2012 年,Ioannis Antonoglou 就加入了 DeepMind。
作为 DeepMind 创始工程师之一,参与了 AlphaGo 和 AlphaZero 项目,亲眼见证了强化学习的胜利。
他硕士毕业于英国爱丁堡大学,博士毕业于伦敦大学学院人工智能方向。
截至目前,Ioannis Antonoglou 的谷歌学术被引次数超十万次。
Aakanksha Chowdhery。
她谷歌待了 7 年,是 Palm、Gemini 等项目的核心作者。
特别提到一点,她还是 PaLM 的一作。
在加入现在这个公司前,她曾在 Meta 待过一段时间,参与了 LIama 4 多模态预训练的。
Aakanksha 硕博毕业于斯坦福,本科在印度理工学院就读。
截至推文发送,她的谷歌学术论文被引次数超 25000 次。
Richie Steigerwald,硕士毕业于加州州立理工大学。
他是谷歌 DeepMInd 资深工程师,曾在谷歌待了 3 年,DeepMind 待了 7 年。
XiaoLan You。
她本科毕业于杜克大学。
XiaoLan You 此前曾在亚马逊工作了四年,带领工程师启用新的多层感知器模型,将广告无关性降低 55%,并创造了 6400 万美元的长期利润。
曾端到端开发 ML 系统,还是首席工程师,负责评估团队开发的所有 ML 模型。
Thanard Kurutach。
他本科毕业于 MIT,博士毕业于 UC 伯克利。
加入 Reflection AI 之前,他曾在 Cruise 担任高级应用研究科学家,在谷歌大脑担任研究院,主打基于分层视觉模型的强化学习。
Risto Vuorio。
这位小哥去年才从牛津大学怀特森研实验室(WhiRL)博士毕业,研究的重点正是强化学习和模仿学习。此前,他本硕在阿尔托大学就读。
工作经历方面,他曾在高通、Waymo 实习。
目前,Reflection AI 仍在招人中,包括数据、应用 AI 技术人员、产品技术人员等等。
旧金山、纽约、巴黎和伦敦等地均有工作室。
啊…… 讲道理,最近两个月,AI 界除了技术卷飞以外,融资进展也一个比一个炸裂。
就在 3 天前,另一则备受业内瞩目的融资消息也被展现在世人眼前:
Ilya 自己创业的 SSI 公司,估值攀升到 300 亿美元,也就是 ——2170.47 亿人民币。
而且将继续再融资。
这次,这家让外界难以辨清庐山真面目的超级独角兽,有了一点点新消息放出。
据接近此事的人士透露,Ilya 表示自己已不再着眼于“原本那个目标”,而是找到了一个“新的目标”。
这个新目标已初现曙光,前景可观。
emmm…… 听君一席话,如听一席话(狗头保命,溜了溜了)。
参考链接:
[1]https://x.com/MishaLaskin/status/1898048925157728601
[2]https://www.bloomberg.com/news/articles/2025-03-07/ex-deepmind-researchers-new-startup-aims-for-superintelligence
[3]https://x.com/ns123abc/status/1898131208820703474
本文来自微信公众号:量子位(ID:QbitAI),作者:白交衡宇