Apprentissage automatique pour la chimie
Les modèles d'apprentissage automatique entraînés sur des données chimiques et des calculs de chimie quantique prédisent les propriétés moléculaires, les énergies et les réactions, complétant et accélérant la chimie computationnelle traditionnelle.
Definition
L'application de l'apprentissage statistique et des modèles de réseaux neuronaux aux problèmes chimiques, apprenant des correspondances entre les représentations moléculaires et les propriétés, les énergies ou de nouvelles structures.
Scope
Couvre les modèles basés sur les données en chimie : les potentiels interatomiques appris par machine qui approximent les énergies de chimie quantique à la vitesse des champs de force, les réseaux neuronaux graphiques et à passage de messages pour les molécules, les modèles génératifs pour la conception moléculaire, et les défis liés à la qualité des données, à la représentation et à l'extrapolation au-delà des données d'entraînement.
Core questions
- Comment les potentiels appris peuvent-ils reproduire la précision quantique à une fraction du coût ?
- Comment les réseaux neuronaux graphiques opèrent-ils directement sur la structure moléculaire ?
- Comment les modèles génératifs sont-ils utilisés pour proposer de nouvelles molécules ?
- Comment la généralisation au-delà de la distribution d'entraînement est-elle évaluée et assurée ?
Key theories
- Potentiels interatomiques appris par machine
- Les potentiels de réseaux neuronaux entraînés sur des données de référence de chimie quantique reproduisent les énergies et les forces à travers différentes configurations, permettant des simulations avec une précision quasi-quantique à un coût quasi-classique.
- Passage de messages sur les graphes moléculaires
- Les réseaux neuronaux graphiques propagent l'information entre les atomes liés pour apprendre des représentations directement à partir de la structure moléculaire, atteignant une forte prédiction des propriétés sans descripteurs conçus manuellement.
Clinical relevance
L'apprentissage automatique est en train de remodeler la chimie computationnelle en accélérant la prédiction des propriétés et des énergies, en élargissant la portée de la simulation grâce aux potentiels appris, et en permettant la conception générative de molécules et de matériaux.
History
Les potentiels de réseaux neuronaux introduits par Behler et Parrinello en 2007 et l'essor des réseaux neuronaux graphiques à partir du milieu des années 2010, associés à de grands ensembles de données de référence, ont entraîné une croissance rapide de l'apprentissage automatique dans la chimie moléculaire et des matériaux.
Debates
- Généralisation et exigences en matière de données
- La question de savoir si les modèles appris extrapolent de manière fiable à la chimie en dehors de leurs données d'entraînement, et la quantité et le type de données nécessaires pour des prédictions fiables, restent des questions ouvertes centrales.
Key figures
- Jörg Behler
- Michele Parrinello
- Anatole von Lilienfeld
- Aspuru-Guzik
Related topics
Seminal works
- behler2007
- gilmer2017
Frequently asked questions
- L'apprentissage automatique remplacera-t-il la chimie quantique ?
- Pas entièrement ; les modèles appris dépendent de données de référence de chimie quantique ou expérimentales pour l'entraînement et sont mieux considérés comme des accélérateurs et des compléments plutôt que des remplacements pour les méthodes de premiers principes.
- Qu'est-ce qu'un potentiel interatomique appris par machine ?
- C'est un modèle entraîné pour reproduire les énergies et les forces issues des calculs quantiques, permettant la dynamique moléculaire avec une précision approchant les méthodes quantiques mais à un coût considérablement réduit.