李飞飞谢赛宁：多模态LLM“空间大脑”觉醒，惊现世界模型雏形 - AI

7 x 24跟踪全球科技动态

热门话题

白天

搜索

资讯

李飞飞谢赛宁：多模态LLM“空间大脑”觉醒，惊现世界模型雏形

2024-12-23 / 阅读约2分钟

来源：凤凰网

新智元报道

编辑：Aeneas 好困

【新智元导读】李飞飞、谢赛宁团队又有重磅发现了：多模态LLM能够记住和回忆空间，甚至内部已经形成了局部世界模型，表现了空间意识！李飞飞兴奋表示，在2025年，空间智能的界限很可能会再次突破。

就在刚刚，李飞飞、谢赛宁等发现：多模态大语言模型居然能记住和回忆空间。

更震撼的是，MLLM的空间推理能力虽然仍是瓶颈，但这些模型中，已经出现了局部世界模型和空间意识的迹象！

论文地址：https://arxiv.org/abs/2412.14171

共同一作：Jihan Yang，Shusheng Yang，Anjali W. Gupta，Rilyn Han

李飞飞表示，非常喜欢这项「空间思维」（Thinking in Space）的研究。空间推理对于人类智能来说，至关重要。在2025年，空间智能的界限很可能会再被突破。

谢赛宁也表示，大家和李飞飞进行的关于空间智能的有趣头脑风暴，已经发展成了NYU、耶鲁和斯坦福之间的惊人合作。

他们相信，视觉空间智能在现实世界中的应用，比以往任何时候都更近了。比如AI眼镜，它可以向我们显示去过的地方，还能定位、导航。

因此，这个领域实在太令人着迷了。

前不久Ilya曾说，预训练结束了，数据如同化石燃料般难以再生，但不少研究者出来反驳说，人类只是用完了文本，海量的视频还在眼前。

此时李飞飞和谢赛宁的研究，可谓相当应景了。

更巧的是，就在不久前，谢赛宁还和LeCun等人合作完成了一项MetaMorph的工作。他们发现：LLM离理解和生成视觉内容已经不远了。

这些测试，大模型被人类完败

在项目主页一开始，团队就放出了非常有趣的人类AI大pk。

内容就是，和Gemini来比拼空间智能能力。

- 相对方向

比如这道题是，「如果我站在冰箱旁，正对着洗衣机，那么炉子是在左边、右边，还是在后面？」

备选答案是：A. 后面 B.右边 C.左边

上一篇：刚刚，又一家大模型独角兽获新融资：数亿美元

下一篇：智源研究院“百模”评测结果：字节跳动多项第一大厂AI整体领先

返回列表

热文阅读

2 天前

AMD锐龙5 7533HS APU携手联想经济型笔记本系列亮相

2 天前

初创公司 Atum Works 推出纳米级 3D 打印技术，芯片制造成本可削减 90%

2 天前

砸开核桃造“芯片”！“六个核桃”母公司16亿杀入半导体

2 天前

华进半导体“有源光芯片转接板及其制备方法”专利公布

2 天前

【IPO】粤芯半导体启动IPO辅导,广发证券担任辅导机构；证监会:同意同宇新材创业板IPO注册；万业企业年报及一季报实现材料设备双突破,一季度营收大幅提升近翻倍

2 天前

英特尔CEO陈立武会见魏哲家，暗示与台积电进行晶圆代工合作

2 天前

东京大学研发新型芯片冷却技术，是传统水冷的十倍

2 天前

英特尔似乎承认我们都知道的事实：没有人会购买AI PC

2 天前

三星呼吁美国商务部明确半导体出口管制条款，担忧阻碍创新

1 天前

紫光国微 2024 年报：归母净利润 11.79 亿元，同比下降 53.43%

上一篇：刚刚，又一家大模型独角兽获新融资：数亿美元

下一篇：智源研究院“百模”评测结果：字节跳动多项第一大厂AI整体领先

C114通信网
通信人家园

7 X 24跟踪全球科技动态

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们

C114通信网

通信人家园