Maschinelles Lernen für die Chemie
Auf chemischen Daten und quantenchemischen Berechnungen trainierte Modelle des maschinellen Lernens prognostizieren molekulare Eigenschaften, Energien und Reaktionen, wodurch die traditionelle Computerchemie ergänzt und beschleunigt wird.
Definition
Die Anwendung statistischer Lern- und neuronaler Netzmodelle auf chemische Probleme, die Abbildungen von molekularen Repräsentationen zu Eigenschaften, Energien oder neuen Strukturen lernt.
Scope
Umfasst datengesteuerte Modelle in der Chemie: maschinell gelernte interatomare Potenziale, die quantenchemische Energien mit der Geschwindigkeit von Kraftfeldern annähern, Graphen- und Message-Passing-Neuronale Netze für Moleküle, generative Modelle für das Moleküldesign sowie die Herausforderungen der Datenqualität, -repräsentation und Extrapolation über die Trainingsdaten hinaus.
Core questions
- Wie können gelernte Potenziale Quantengenauigkeit zu einem Bruchteil der Kosten reproduzieren?
- Wie operieren Graphen-Neuronale Netze direkt auf molekularer Struktur?
- Wie werden generative Modelle eingesetzt, um neuartige Moleküle vorzuschlagen?
- Wie wird die Generalisierung über die Trainingsverteilung hinaus bewertet und sichergestellt?
Key theories
- Maschinell gelernte interatomare Potenziale
- Auf quantenchemischen Referenzdaten trainierte neuronale Netzpotenziale reproduzieren Energien und Kräfte über Konfigurationen hinweg und ermöglichen Simulationen mit nahezu Quantengenauigkeit zu nahezu klassischen Kosten.
- Message-Passing auf molekularen Graphen
- Graphen-Neuronale Netze verbreiten Informationen zwischen gebundenen Atomen, um Repräsentationen direkt aus der molekularen Struktur zu lernen, wodurch eine starke Eigenschaftsvorhersage ohne handgefertigte Deskriptoren erreicht wird.
Clinical relevance
Maschinelles Lernen gestaltet die Computerchemie neu, indem es die Vorhersage von Eigenschaften und Energien beschleunigt, die Reichweite der Simulation durch gelernte Potenziale erweitert und das generative Design von Molekülen und Materialien ermöglicht.
History
Die 2007 von Behler und Parrinello eingeführten neuronalen Netzpotenziale und der Aufstieg von Graphen-Neuronalen Netzen ab Mitte der 2010er Jahre, zusammen mit großen Referenzdatensätzen, trieben das schnelle Wachstum des maschinellen Lernens in der Molekül- und Materialchemie voran.
Debates
- Generalisierung und Datenanforderungen
- Ob gelernte Modelle zuverlässig auf Chemie außerhalb ihrer Trainingsdaten extrapolieren und wie viele und welche Art von Daten für vertrauenswürdige Vorhersagen benötigt werden, bleiben zentrale offene Fragen.
Key figures
- Jörg Behler
- Michele Parrinello
- Anatole von Lilienfeld
- Aspuru-Guzik
Related topics
Seminal works
- behler2007
- gilmer2017
Frequently asked questions
- Wird maschinelles Lernen die Quantenchemie ersetzen?
- Nicht vollständig; gelernte Modelle sind für das Training auf quantenchemische oder experimentelle Referenzdaten angewiesen und sollten eher als Beschleuniger und Ergänzungen denn als Ersatz für Ab-initio-Methoden betrachtet werden.
- Was ist ein maschinell gelerntes interatomares Potenzial?
- Es ist ein Modell, das darauf trainiert ist, die Energien und Kräfte aus Quantenberechnungen zu reproduzieren, was Moleküldynamik mit einer Genauigkeit ermöglicht, die Quantenmethoden nahekommt, jedoch zu stark reduzierten Kosten.