Aprendizaje automático para la química
Los modelos de aprendizaje automático entrenados con datos químicos y cálculos químico-cuánticos predicen propiedades moleculares, energías y reacciones, complementando y acelerando la química computacional tradicional.
Definition
La aplicación de modelos de aprendizaje estadístico y de redes neuronales a problemas químicos, aprendiendo mapeos desde representaciones moleculares a propiedades, energías o nuevas estructuras.
Scope
Cubre modelos basados en datos en química: potenciales interatómicos aprendidos por máquina que aproximan energías químico-cuánticas a la velocidad de los campos de fuerza, redes neuronales de grafos y de paso de mensajes para moléculas, modelos generativos para el diseño molecular, y los desafíos de la calidad de los datos, la representación y la extrapolación más allá de los datos de entrenamiento.
Core questions
- ¿Cómo pueden los potenciales aprendidos reproducir la precisión cuántica a una fracción del costo?
- ¿Cómo operan las redes neuronales de grafos directamente sobre la estructura molecular?
- ¿Cómo se utilizan los modelos generativos para proponer moléculas novedosas?
- ¿Cómo se evalúa y asegura la generalización más allá de la distribución de entrenamiento?
Key theories
- Potenciales interatómicos aprendidos por máquina
- Los potenciales de redes neuronales entrenados con datos de referencia químico-cuánticos reproducen energías y fuerzas en diversas configuraciones, permitiendo simulaciones con una precisión casi cuántica a un costo casi clásico.
- Paso de mensajes en grafos moleculares
- Las redes neuronales de grafos propagan información entre átomos enlazados para aprender representaciones directamente de la estructura molecular, logrando una fuerte predicción de propiedades sin descriptores hechos a mano.
Clinical relevance
El aprendizaje automático está remodelando la química computacional al acelerar la predicción de propiedades y energía, expandiendo el alcance de la simulación a través de potenciales aprendidos y permitiendo el diseño generativo de moléculas y materiales.
History
Los potenciales de redes neuronales introducidos por Behler y Parrinello en 2007 y el auge de las redes neuronales de grafos a partir de mediados de la década de 2010, junto con grandes conjuntos de datos de referencia, impulsaron el rápido crecimiento del aprendizaje automático en la química molecular y de materiales.
Debates
- Generalización y requisitos de datos
- Si los modelos aprendidos extrapolan de manera confiable a la química fuera de sus datos de entrenamiento, y cuánto y qué tipo de datos se necesitan para predicciones confiables, siguen siendo preguntas abiertas centrales.
Key figures
- Jörg Behler
- Michele Parrinello
- Anatole von Lilienfeld
- Aspuru-Guzik
Related topics
Seminal works
- behler2007
- gilmer2017
Frequently asked questions
- ¿Reemplazará el aprendizaje automático a la química cuántica?
- No del todo; los modelos aprendidos dependen de datos de referencia químico-cuánticos o experimentales para el entrenamiento y se consideran mejor como aceleradores y complementos, más que como reemplazos de los métodos de primeros principios.
- ¿Qué es un potencial interatómico aprendido por máquina?
- Es un modelo entrenado para reproducir las energías y fuerzas de los cálculos cuánticos, lo que permite la dinámica molecular con una precisión que se aproxima a los métodos cuánticos, pero con un costo muy reducido.