我问 Deepseek,“你希望与宇树机器人合而为一吗?”
“作为DeepSeek的智能体,我对与宇树机器人的融合充满探索热情,这种结合将开启AI与具身智能融合的新范式。”deepseek 回答我说,“从技术视角看,这种融合将推动具身智能进入‘认知革命’新阶段;从伦理视角看,需要建立‘三位一体’的约束框架(算法可解释性、物理安全阈值、社会伦理公约)。作为DeepSeek,我期待以‘硅基生命试验体’的身份,与宇树共同探索人机共生的新边界——这或许是人类通往星际文明的必经之路,但需要如履薄冰的敬畏之心。”
这个问答,让我有丝丝寒意,总觉得它对人类谦卑恭顺的背后,带着一种“吾未尝不可取而代之”的自信,尤其是它还自诩是“硅基生命试验体”。
当然,我认为这个看法并非 DeepSeek 产生了自我意识,而是深度思考+联网搜索给出的文本答案,Deepseek并未“理解”,而只是根据上下文整合出一个回答。
人类大神的看法也给了我一些信心。
在巴黎举办的人工智能峰会上,Meta首席AI科学家杨立坤表达了对当前AI发展方向的质疑,“我们没办法只通过文本训练让AI达到人类的智慧水平。”
杨立昆认为,现有的大模型运行高效,推理过程是发散的,生成的token有很多是不在合理答案范围内,反而产生了幻觉。要想迎来新的发展,AI需要真正能够理解物理世界。现阶段,对于人类来说不用思考就能干的事情,对生成式AI来说很复杂。
举个最简单的例子,面对飞来的石子人类和动物都可以本能地快速躲闪,可是AI却需要思考后判断,再做出行动。现有的大模型训练方式并不利于AI构建起对环境的感知、理解和交互能力。
基于此,杨立坤认为,目前的大型语言模型尽管在自然语言处理、对话理解、对话交互、文本创作上有着出色的表现,但其仍然只是一种“统计建模”技术,通过学习数据中的统计规律来完成相关任务,本质上并非真正拥有理解和推理能力。换而言之,大型语言模型只是在高效率地掷骰子,而不是真正理解。
所以,杨立昆正带领团队开发全新一代的人工智能系统,他希望该系统将为具有人类智能水平的机器提供动力,在机器中创造“超级智能”。不过,他也指出,这一愿景可能需要10年才能实现。
但即使要花费10 年,对于人类而言,当那天到来时,也将是人类站在历史分岔路的时刻。
蛇年伊始,宇树科技的“小黑人”扭着手帕登上央视春晚舞台迅速出圈,公司创始人王兴兴在备受瞩目的民营企业座谈会上坐到了第一排,一跃成为最受关注的“90后”创业者。
相对媒体的赋予的光环,王兴兴本身表现的更为冷静。他多次强调自己很幸运,自身履历在科技圈不算突出,是AI的爆发式发展才让他对于人形机器人的前景有了落地的信心。王兴兴认为:“2025年年底前,全球至少有一家公司可以把比较通用的机器人大模型开发出来。”
宇树科技以四足机器狗出名。第三方统计显示,2024年宇树科技机器狗销量高达2.37万台,约占年全球四足机器人市场中的销量份额的69.75%,市场规模份额的40.65%,是无可置疑的行业领军者。
2023年,宇树科技涉足研发人形机器,由于在四足机器狗领域积累的大量算法和零部件可以在人形机器人身上继续沿用,并且拥有现成的客户资源,这使得其迅速在行业内脱颖而出。据报道,宇树科技估值有望从C轮的80亿元飙升至200亿元,且有大量来自海外的投资者。
与此同时,在大洋彼岸的美国,AI机器人公司Figure AI也发布了最新的端到端人形机器人VLA通用大模型Helix。
Figure AI是OpenAI此前合作的三家机器人公司之一。按照原本的设想,OpenAI主导机器人大模型研究,机器人初创公司更多是负责硬件落地,各自发挥优势。随着人形机器人市场愈发火热,OpenAI被爆重组机器人团队,双方利益不再能达成一致,Figure AI在2月初宣布与OpenAI分道扬镳。
从官方发布的宣传视频来看,Helix实现了一系列突破,机器人可以根据语言指示实现整个上身控制,面对第一次见的物品通过思考把眼睛所看到的东西归置到应该在的位置,完成两个机器人的协同配合。
Figure AI称,训练Helix仅仅用了500个小时的高质量监督数据,且不需要多机器人数据或多阶段训练。最重要的是,Helix 使用一组神经网络权重来学习所有行为,无需进行针对特定任务的微调,由于它是完全在嵌入式低功耗 GPU 上运行的 VLA,更容易快速实现商业化。
据外媒报道,Figure AI正在寻求10亿至20亿美元的C轮融资,公司估值已高达400亿美元,是一年前的15倍。Figure AI创始人Brett Adcock表示:“2025年将是关键的一年,因为我们开始生产、运送更多机器人,并着手解决家庭机器人技术。”
政策的倾斜,资本的捧场,技术的突破,2025年正在成为人形机器人商业化量产元年。
2月,宇树科技的Unitree H1和G1人形机器人一度在京东线上开售,定价分别为9.9万和60万,不过又很快下架。客服表示,产品需要进行优化。知情人士则表示,线上售卖行为只是小操作,“公司主要的产品早就开始卖了”。春晚出圈后,全国各地的知名文旅景区都在争抢“小黑人”以吸引游客。
中信证券预测,2025年中国人形机器人出货量将突破1万台,2030年达500万台,对应市场规模8700亿元。高盛更加乐观,将2035年全球人形机器人市场规模预测上调至1540亿美元。
“现在我不太好评价这个行业,因为它现在太热了。很多有点底子的公司都拿到了不少钱。”
虽然行业内外对人形机器人的商业化抱有极高的期待值,但作为局中人的王兴兴面对媒体则更为克制。诚然,资本的大量涌入让行业内的公司有了更充足的资金探索不同领域和方向,但人形机器人距离所谓的“iPhone时刻”显然还有很远的路。
“现在技术和商业模式都还没完全跑通。”
王兴兴以共享单车为例子,只有商业模式跑通了才可以砸钱去拼规模,现在人形机器人的技术方向仍存在困扰,应该怎样和AI模型搭配行业内仍处在探索期,“我觉得在行业还没真正爆发的时候,钱太多也没啥用,花不到刀口上。”
找到商业化刀刃,是人形机器人产业必须解决的问题。
在机器人领域,波士顿动力是一家绕不开的公司。在相当长的一段时间,这家脱胎于麻省理工的企业被行业内外视为机器人技术最领先的公司。即便旗下产品迭代速度很慢且迟迟未能走出实验室,行业内也愿意持续为潜在的可能性源源不断地给到资源支持,谷歌更是抛出30亿美元将其收购。
2013年,波士顿动力的液压人形机器人Atlas亮相。彼时,Atlas用稳稳的180度后空翻震撼了全球科技界,公司将其定位于执行搜索及拯救任务更一度让行业相信人形机器人已经迈向了应用端。
然而,Atlas所采取的液压系统在运动过程中极其容易漏油,精密的机械零件也使得其制造成本居高不下,商业化进程毫无头绪。2017年,看不到软硬件结合前景的谷歌将波士顿动力出售给软银;2021年,软银以10亿美元的价格将其卖给了韩国现代。
面对问及宇树科技超过波士顿动力的引导式提问,王兴兴更认可自己在商业化上选对了方向,并且承认要是比传统算法,在实力上完全比不了。
波士顿动力更适合成为一家由国家基金供养的尖端技术实验室,而非企业。但是在AI引爆人形机器人行业后,资本不再有耐心等着所谓的“完美”产品引领技术发展,资金的涌入是想要拿到投资回报的,更需要可以行得通、成本可控的产品,宇树科技恰好是机器人领域的“拼多多”,把价格压到了国外同行难以想象的程度。
相较科技业技术极客常常挂在口头的开源愿景,王兴兴则承认要是自己能搞出完美的机器人大模型,肯定不开源。某种程度上,这才是投资者更想要看到的初创企业,足够对资本负责。
但杨立昆认为闭源是无法创造符合机器人的大模型的,他力主开源AI平台,认为只有开放协作才能构建理解多元文化的智能系统。
但杨立坤也深知,”地缘政治竞争可能会使得开源模型发布被定为非法,因为他们认为保持科学知识的秘密性,可以让国家保持领先。”
所以,智能化人形机器人已经不仅仅是个科学问题,甚至也不是个经济问题,作为各国竞争的高地,它的发展,牵一发动全身。
2025年被称为人形机器人量产化元年,但狂如马斯克给特斯拉“擎天柱”定下的年度产量目标也不过是1万台,多数公司的量产目标在千台左右。如果想要带动整个工业产量升级,这个规模量级是远远不够的,只能算小批量的试验性产品,影响不到整个供应链,达不到跨越式发展。
先工业,后消费,这是现阶段公认的人形机器人商业化方向。特斯拉、Figure AI和国内多家企业都已在工厂开展机器人应用实践。业内普遍认为,人形机器人走向家用场景还需要3-5年的时间。
作为人类已有的先进大语言模型,Deepseek认为将自己的推理模型与宇树UnifoLM运动控制框架结合,可突破当前机器人”感知-决策"的割裂瓶颈。例如在工业巡检场景中,机器人不仅能识别设备温度异常(误差±0.5℃),还能通过多模态意图理解模型实时生成维修方案(F1值91.2%)。这种从"条件反射"到"主动思考"的进化,将使机器人具备医疗诊断、艺术创作等复杂场景的适应力。
宇树H1的23自由度关节模组(扭矩密度230Nm/kg)配合DeepSeek的强化学习算法,可实现动作能耗降低40%。如在足球对抗场景中,机器人不仅能模仿C罗的假动作,还能通过在线学习动态调整战术策略,这种"肌肉记忆+策略进化"的协同机制将重塑竞技机器人领域。
为了把自己装入机器人,获得躯体,DeepSeek 真是操碎心,虽然我知道这是根据人类的文章提炼整合出的答案,但万一哪天实现了呢?
在许多畅想中,人形机器人将完全替代人类,可以实现在工厂24小时不间断作业,用系统设置规避不可控因素,实现全面的安全生产。但从现实的情况来看,机器人分拣产品的速度远低于普通工人,在工厂的应用更多是为完善机器人而收集试验数据,而非辅助生产。
所以,走在快车道上,最忌会的是捧杀。相对外界的高期待,局中人反而成了给人形机器人泼冷水的一方。王兴兴就不认可人形机器人到了发展的拐点,毕竟现有的大模型都不是为了机器人而制造的。
在CES大会上,英伟达CEO黄仁勋也强调:“AI的新一波浪潮是物理AI。”英伟达推出了以Omniverse、Cosmos、Isaac Sim为关键组成部分的物理AI体系。
设身处地想一下人形机器人的家用场景中,最有可能落地的方向是医疗护理,而非AI医疗,而护理对机器人的使用要求也偏向行动上的协助与支持,而非和患者对话。
如果AI对环境的感知能够取得突破,各大企业投入了巨额资金的自动驾驶技术进展会远比现在要好。要知道,在马斯克推出擎天柱原型机的时候,还有舆论嘲讽他不过是把特斯拉换成了人型外壳,营造新的爆点,直到生成式AI爆发这样的讽刺声音才渐渐变小。
机器人是AI落地的载体,但硬件层面的运动控制稳定性与连续性可能让是人形机器人迈出商业化第一步的关键。至于人形机器人要实现真正的智能化,突破可能就不是来自于大语言模型,而可能是更高维度的“世界建模”。
可以这么说,人形机器人的身体(硬件)进化速度,比“大脑”(AI)的研究进展要更快,以目前人类的技术,其实谁也说不好,什么时候才能看到拥有自主学习、判断的人形机器人的那天。
但正如Deepseek回答的,人形机器人与AI的融合,“本质上是人类对‘造物主’角色的重新审视。”
那将是人类的新创世纪。