中国科学技术大学一名博士研究生在实验室调试机器化学家系统“小来”。 新华社记者 张端摄
8天完成688次化学实验,7天研究1000种催化配方……人类夜以继日多年才能完成的工作,人工智能(AI)在短时间内就能完成。
“AI从一个研究领域变成了一类赋能技术。”在12月9日至10日召开的香山科学会议第768次学术讨论会上,中国科学院院士白春礼说,在化学领域,得益于AI的应用,化学反应预测与新化学物质的发现、化学试验的自动化与智能化等方面均取得了显著突破。
AI将如何改变化学研究?如何进一步推进AI与化学的深度融合?这些问题引发与会专家学者热议。
2个月内完成2000年的工作
AI让枯燥、危险、重复的化学实验来了个“大变身”:机器人自动操作化学合成平台,甚至具备观察、分析实验结果的能力。
中国科学技术大学研发的机器化学家系统“小来”,可以完成文献读取、合成、表征、性能测试、机器学习模型建立和优化等全流程任务。中国科学技术大学教授罗毅介绍,通过运用“小来”系统,团队加速了新材料的发现过程,2个月内就完成了需要验证2000年才能完成的复杂优化工作,利用火星陨石制备出实用的产氧电催化剂。
面向“远方”,AI能帮助人类探索出一条在地球外星系就地取材研制化学品的新路;聚焦“眼前”,有研究单位仅用一年时间,便利用高精准的预训练模型,从6000万个有机小分子的结构中筛选出符合冷却液不同性质和要求的目标分子,并成功完成这些分子的合成及实际产品的测试工作。
“科学研究的基本工具来自理论、实验和科学文献三方面。受工具的限制,过去的化学研究采取依赖经验和不断试错的方法,组织形式也往往是作坊模式。”中国科学院院士鄂维南说,AI将助力打造有效的理论、实验和文献工具平台,使科学研究迈向平台化模式。
中国科学院院士张锦也认为,利用AI、大数据、虚拟现实等工具,人类能够扩展思维,提升理解力,不断突破认知边界。通过构建覆盖研发全流程的一系列智能体来弥补短板,可以让科学家有工程思维、工程师有产品思维,打破实验室研究与产业化要求难以匹配的困境。
高效表达复杂微观世界
微观层面,AI在化学研究中的优势进一步显现。电子自旋、电荷密度、分子势能等与化学性质息息相关的参数,都变得可预测、可求解。
阿尔法折叠3这种模型为什么能准确预测蛋白质、DNA、RNA、配体等生命分子的结构及相互作用?白春礼介绍,它通过分析大量的输入和输出数据寻找规律,掌握分子间相互作用的力、角度等参数,再模拟出现实情况,预测可能的情况。
从读懂现象到摸清规律、再到高效表达复杂的微观世界,AI在化学领域让“不可能”的探索成为“可能”。
“在化学动力学理论研究方面,AI展现了巨大潜力。”中国科学院院士张东辉说,化学理论中的分子体系势能面构造存在“指数墙”困难,即计算量会随分子体系中原子个数增长而呈指数级增长。AI神经网络能高效表达复杂的高维函数,解决了这个难题。借助AI,团队解决了包含十几个原子的分子体系高精度势能面构造问题。
张东辉介绍,近年来,神经网络在求解电子运动薛定谔方程的基态波函数方面也取得了重要进展。在不存在费米共振的情况下,团队仅使用15000个参数,就能精确求解丙烷分子(包含11个原子)的振动能量。而这在此前被认为是难以求解的。
针对求解多电子薛定谔方程这一量子化学领域的核心问题,AI提供的新范式有望突破计算消耗随体系扩大呈指数级增长的瓶颈。中国科学院院士杨金龙介绍,基于生成式AI的“乾坤网络”(QiankunNet)可实现多电子薛定谔方程的直接求解。“化整为零、分而治之”的策略,使较复杂材料体系的计算从“不可能”逐步走向“可能”和“精准”。
模型建构需“垂直发力”
“化学是唯一能够获得稳定新物质的科学。”白春礼说,AI将为发现更多前所未有的反应类型与合成方法带来无限可能。
然而,要担负起“从0到1”的创新任务,AI仍面临巨大挑战。
一方面是化学数据的质量与可用性问题。“化学研究数据类型复杂且高度多样化,涵盖分子表征、光谱图像、实验记录等多模态数据。”中国科学院自动化研究所所长徐波解释,现有模型往往难以高效表征、难以整合不同模态数据里的信息。化学研究还需AI具备更高阶的推理能力,以完成化学反应预测、分子逆向设计、多步合成路径规划等任务。
另一方面是AI化学知识储备问题。现有算法多为“黑箱式”模型,融入的化学知识不够。换句话说,要拿下“化学博士学位”,AI还需“垂直发力”。徐波说,当前许多AI系统主要依赖数据驱动的方法,与不同领域知识结合程度不足。为解决这个问题,AI领域学者与化学学者正在进行跨领域合作,为化学领域开发专用算法和模型,发展各类科学化学语言表征等基本能力,以构建更强大的模型。
中国科学院院士、南京大学党委书记谭铁牛认为,应在基座大模型的基础上,着力建构以知识和数据双驱动的多任务多目标垂直模型。
白春礼也认为,加快AI和自动化实验的深度融合,亟需构建高质量、开放共享的化学基础数据库,并考虑数据安全管理等因素。他建议,应建立自主可控、开放共享的基础大模型,开发针对化学复杂问题的专用AI算法等,进一步加强学科交叉并重视AI化学领域的人才培养,加快建设AI化学生态平台。
文章来源:科技日报