AI「幻觉」可能在一般人看来是模型的胡言乱语,但它为科学家提供了新的灵感。David Baker 甚至利用 AI「幻觉」赢得了诺贝尔化学奖。纽约时报发文 AI 正在加速科学发展,但「幻觉」一词,在科学界仍有争议。
万万没想到,一直备受批评的 AI「幻觉」问题,竟然在科学领域具有极大的应用价值?
就在最近,计算机科学家 Amy McGovern 表示:「公众认为这完全是坏事。但实际上,它为科学家提供了新的灵感,让他们得以探索一些原本可能不会想到的思路。」
AI「幻觉」可以帮助科学家通过测试「梦幻式」的新概念,来追踪癌症、设计药物、发明医疗设备并揭示气象现象
科学在人们心中的形象冷静而理性。
然而,在科学发现的早期阶段,往往充满了直觉和大胆的猜想。正如科学哲学家 Paul Feyerabend 所言,这是一种「无拘无束」的探索状态。
如今,AI 的「幻觉」正在重新激发科学的创造力。
这种技术加速了科学家和发明家提出新想法并验证其是否符合现实的过程。
这可以被视为科学方法的加速版。以往需要数年完成的任务,现在可能在几天、几小时甚至几分钟内实现。
有时候,甚至帮助科学家加速了研究周期,开辟了全新的研究领域。
麻省理工学院教授 James J. Collins 说:「我们正在探索」。他最近称赞 AI 的「幻觉」加速了他对新型抗生素的研究进展。「我们让模型提出完全新颖的分子。」
科学家向生成式计算机模型输入特定主题的信息,然后让机器对主题进行重新加工,从而产生 AI 的「幻觉」。
结果可能有细微的偏差,也可能超越现实。有时,它们会带来重大发现。
去年十月,华盛顿大学的 David Baker 因其开创性的蛋白质研究获得了诺贝尔化学奖。这些复杂的分子是生命活动的关键动力。
诺贝尔委员会称赞他发现了快速构建完全不同于自然界中蛋白质的新方法,并称其成就「几乎不可能」。
在奖项宣布前的一次采访中,Baker 博士将 AI 的「突发想象」描述为「从零开始设计蛋白质」的关键。
他补充说,这项新技术帮助他的实验室获得了约 100 项专利,其中许多用于医疗用途。一个专利用于一种新的癌症治疗方法,另一个旨在支持全球抗击病毒感染的工作。他还创办或协助创立了超过 20 家生物技术公司。
他说:「发展速度非常快,即使是专门研究蛋白质的科学家,也不了解目前的进展有多大。」
他的实验室设计了多少种蛋白质?
他回答道:「一千万种,而且都是全新的。它们在自然界中并不存在。」
诺贝尔奖获得者 Baker 博士对「幻觉」采取了直截了当的态度。
在 2021 年,他在 Nature 上发表了一篇论文,标题为《通过深度网络幻觉进行从头蛋白质设计》(De novo protein design by deep network hallucination)。
论文地址:https://www.nature.com/articles/s41586-021-04184-w
标题中的「从零(De novo)」一词源自拉丁文,意为「从零开始」,与 1980 年代初科学家开始修改自然界已知蛋白质结构的做法形成了鲜明对比。
2003 年,Baker 博士及其同事实现了一个更宏伟的目标:从零构建世界上第一个全新蛋白质。
他们将其命名为 Top7。这一成就被视为一项重要的突破,因为蛋白质的复杂性堪称惊人。
专家将 DNA 的结构比作一串珍珠,而将大型蛋白质的结构比作纠结的毛球。即使是详细的图示,也只能粗略地表现蛋白质的复杂结构。
在流感病毒表面的血凝素蛋白的棱周围会形成一种粘合剂蛋白,针对这些易受攻击的点可以阻止病菌附着在肺部和其他地方的细胞上
随着 AI 发展成为一种强大的新技术,Baker 博士开始思考它是否能够加速从零开始的蛋白质设计。
他在 2021 年的论文中提到,新方法受到了谷歌 DeepDream 模型的启发。
DeepDream 模型可以将现有图像转化为迷幻风格,创造全新的视觉内容。
当人们看满月时看到一个人的脸,这被称为「空想性错觉」(pareidolia),即一种将模糊图案转化为有意义图像的感知现象。DeepDream 正是利用了这种特性来创造超现实的图像。
Baker 博士的计划是测试 AI 是否可以将这种「空想性错觉」应用于模糊的氨基酸集合 —— 氨基酸是蛋白质的基本构建块。
他的团队将随机的氨基酸序列输入一个经过训练的模型,而该模型能识别真实蛋白质的结构特征。
结果大大超出了预期。
论文指出,测试运行生成了数千种虚拟蛋白质,并将其比作互联网中泛滥的猫图片。
论文写道:「就像由深度网络幻觉生成的猫图像可以清晰地被识别为猫一样。这些人工蛋白质结构与天然结构相似,但并不完全相同。」
随后,贝克团队尝试将这些虚拟的蛋白质转化为现实 —— 这一过程类似于让电子猫变为真实存在的生物猫。首先,团队将这些虚拟分子的结构信息作为蓝图,用以生产形成基因的 DNA 链。接着,正如 2021 年的论文所述,当这些基因被插入微生物体内后,这些微生物成功产生了 129 种从未在科学或自然界中发现的新蛋白质。
2022 年初,Baker 博士将这一成就描述为「AI 加速从零蛋白质设计的首次实证」。
在他于 2022 年和 2023 年发表的后续论文中,「幻觉」一词仍然出现在标题中。
Baker 博士表示,他的实验室最近在创意生成方面取得了新突破,采用了一种称为扩散(diffusion)的 AI 方法。这也是 DALL-E 和 Sora 等流行视觉生成器的核心技术。
Baker 博士称赞扩散技术在设计新蛋白质方面比「幻觉」更高效,他说:「速度更快,成功率也更高。」
近年来,一些分析人士担心科学正在走向衰退。他们指出,过去几十年来,突破性发现的数量正在减少。
AI 的支持者则认为,创造性爆发正在扭转这一趋势。
在设计领域,Baker 博士及其同事看到一波波蛋白质催化剂即将诞生。这些催化剂可能帮助收集太阳能、将老旧工厂改造成高效节能设施,并为构建一个可持续的新世界提供支持。
Baker 团队的成员 Ian C. Haydon 认为这种加速仍在继续并表示「这令人难以置信。」
谷歌旗下 AI 公司 DeepMind 科学部负责人 Pushmeet Kohli 在一次采访中称赞了「幻觉」在促进科学发现方面的作用。
不久前,他的两位同事与 David Baker 博士共同分享了 2024 年的诺贝尔化学奖。
Pushmeet Kohli 表示:「我们拥有一项能够展现创造力的惊人工具」。
Pushmeet Kohli 博士举了一个例子,说明了这种工具的创造力。
2016 年,DeepMind 的计算机在围棋比赛中击败了世界冠军。
这场比赛的转折点是第 37 步,发生在比赛的早期阶段。
Kohli 博士回忆道:「我们一开始以为那是个错误。但随着比赛的进行,人们意识到那是一种天才的表现。因为,这些模型能够产生非常新颖的见解。」
他认同 AI 在加速生物科学的发展:「接下来的几年中会出现许多令人惊叹的成果」。
他认为,AI 正在解锁生命最深层的奥秘,并为治愈疾病、改善健康和延长寿命奠定了强大的新基础。
他说:「一旦我们破译并真正理解生命的语言,那将是奇迹」。
另一方面,曼哈顿纪念斯隆凯特琳癌症中心实验室负责人 Harini Veeraraghavan,在一篇关于利用 AI 改善模糊医学图像的论文中提到了「幻觉」一词。
这篇论文的标题部分直接写道「幻觉 MRI」。
论文地址:https://pmc.ncbi.nlm.nih.gov/articles/PMC7225573/pdf/nihms-1586979.pdf
得克萨斯大学奥斯汀分校的研究人员也接受了这一术语。他们的一篇论文标题写道:「从幻觉中学习」,讨论如何改进机器人导航。
论文地址:https://www.cs.utexas.edu/~xiao/papers/hallucination.pdf
尽管 AI「幻觉」在科学发现中的吸引力巨大,但一些科学家认为这一术语具有误导性。
他们认为,生成式 AI 模型的「想象」并非完全虚幻,而是具有一定实现可能性的,就像科学方法早期阶段的假设一样。因此,他们认为「幻觉」一词不够准确,并倾向于避免使用。
此外,「幻觉」一词还因其与迷幻药(如 LSD)导致的幻觉联想而受到质疑。迷幻药在过去曾让许多严肃的科学研究裹足不前。
最后,在科学和医学交流中,AI 生成的信息可能被错误信息所混淆,就像像聊天机器人的回复那样,这也让「幻觉」一词更加备受争议。
今年七月,白宫发布了一份关于促进公众信任 AI 研究的报告,其中唯一提到「幻觉」的部分是关于如何减少它们的存在。
诺贝尔奖委员会似乎也遵循了这一思路。在对 Baker 博士工作的详细评价中,没有提及 AI「幻觉」。相反,在新闻稿中,仅称赞了他的团队「创造了一种又一种富有想象力的蛋白质」。
科学界的部分机构似乎越来越倾向于将「幻觉」视为一个不宜提及的词汇。
尽管如此,专家们在纽约时报的采访中指出,科学 AI 的「想象」相比聊天机器人等的「幻觉」具有显著优势。
最根本的一点是,这种创造性爆发基于自然和科学的硬性事实,而非人类语言的歧义或互联网中的偏见和虚假信息。
加州理工学院的数学与计算机科学教授 Anima Anandkumar 表示:「我们正在教授 AI 物理学」。她曾担任 AI 芯片领先制造商英伟达的 AI 研究主管。
Anandkumar 博士补充说,对于科学而言,基于可靠事实的物理学基础可以带来高度准确的结果。
她指出,聊天机器人的大语言模型无法实际验证其陈述和断言的正确性。
她强调,最终的验证来自科学家将这些 AI 生成的构想与物理现实的具体细节进行比较。
她谈到 AI 的成果时说道:「你需要对其进行测试,AI 靠『幻觉』设计的新事物需要经过验证。」
最近,Anandkumar 博士及其同事利用 AI 的「幻觉」帮助设计了一种全新的导管。
这种导管可以显著减少细菌污染 —— 这一全球性问题每年导致数百万例尿路感染。
她表示,团队的 AI 模型设计了数千种导管几何形状,并最终选出其中最有效的一种。
这种新导管的内壁上覆盖着锯齿状突起,能够防止细菌附着并向上游移动,从而感染患者的膀胱。Anandkumar 博士提到,该团队正在讨论这种设备的商业化。
与其他科学家一样,Anandkumar 博士表示她不喜欢「幻觉」这个术语。
她的团队在关于新导管的论文中避免使用该词。
Amy McGovern 博士是 AI 研究所的负责人,也是俄克拉荷马大学气象学和计算机科学的教授。
她认为 AI 的「幻觉」或许更适合被称为「概率分布」—— 这是科学领域一个传统的术语。
她补充道,天气研究人员现在经常使用 AI 来创建数千种细微的预测变化或概率范围。这些丰富的想象帮助他们发现了可能引发极端事件(如致命热浪)的意外因素。
她认为这是一种非常有价值的工具。
参考资料:
https://www.nytimes.com/2024/12/23/science/ai-hallucinations-science.html#:~:text=The%20A.I.,they%20lead%20to%20major%20discoveries.
本文来自微信公众号:新智元(ID:AI_era)