机器学习在化学领域的应用
在化学数据和量子化学计算基础上训练的机器学习模型,能够预测分子性质、能量和反应,补充并加速了传统计算化学。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
将统计学习和神经网络模型应用于化学问题,学习从分子表示到性质、能量或新结构的映射。
Scope
涵盖化学领域的数据驱动模型:以力场速度近似量子化学能量的机器学习原子间势、用于分子的图神经网络和消息传递神经网络、用于分子设计的生成模型,以及数据质量、表示和训练数据外推的挑战。
Core questions
- 学习势能如何以极低的成本重现量子精度?
- 图神经网络如何直接作用于分子结构?
- 生成模型如何用于提出新颖分子?
- 如何评估和确保超出训练分布的泛化能力?
Key theories
- 机器学习原子间势
- 在量子化学参考数据上训练的神经网络势能,能够重现不同构型下的能量和力,从而实现接近量子精度但接近经典成本的模拟。
- 分子图上的消息传递
- 图神经网络在键合原子之间传播信息,直接从分子结构中学习表示,无需人工设计的描述符即可实现强大的性质预测。
Clinical relevance
机器学习正在通过加速性质和能量预测、通过学习势能扩展模拟范围以及实现分子和材料的生成设计来重塑计算化学。
History
Behler和Parrinello于2007年引入的神经网络势能,以及自2010年代中期图神经网络的兴起,加上大型参考数据集,推动了机器学习在分子和材料化学领域的快速发展。
Debates
- 泛化能力和数据需求
- 学习模型是否能可靠地外推到训练数据之外的化学领域,以及需要多少和何种类型的数据才能获得可靠的预测,仍然是核心的开放问题。
Key figures
- Jörg Behler
- Michele Parrinello
- Anatole von Lilienfeld
- Aspuru-Guzik
Related topics
Seminal works
- behler2007
- gilmer2017
Frequently asked questions
- 机器学习会取代量子化学吗?
- 不会完全取代;学习模型依赖于量子化学或实验参考数据进行训练,最好将其视为第一性原理方法的加速器和补充,而非替代品。
- 什么是机器学习原子间势?
- 它是一种经过训练的模型,旨在重现量子计算的能量和力,从而使分子动力学模拟的精度接近量子方法,但成本大大降低。