Molekulare Darstellung und Deskriptoren
Computer benötigen maschinenlesbare Kodierungen von Molekülen; Liniennotationen, chemische Graphen, Fingerabdrücke und numerische Deskriptoren übersetzen die chemische Struktur in Formen, die gespeichert, durchsucht und modelliert werden können.
Definition
Die Kodierungen und berechneten Merkmale, die die molekulare Struktur digital darstellen, von kanonischen Zeichenketten und Graphen bis hin zu Fingerabdruck-Bitvektoren und numerischen Deskriptoren.
Scope
Umfasst die chemisch-graphische Ansicht von Molekülen, Liniennotationen wie SMILES und InChI, Strukturschlüssel und gehashte Fingerabdrücke sowie die breite Familie molekularer Deskriptoren, die die Struktur in numerische Merkmale für Ähnlichkeits- und prädiktive Modellierung umwandeln.
Core questions
- Wie werden Moleküle als Graphen und als kanonische Zeichenketten dargestellt?
- Worin besteht der Unterschied zwischen Strukturschlüsseln, gehashten Fingerabdrücken und numerischen Deskriptoren?
- Wie wird ein eindeutiger, kanonischer Identifikator wie InChI generiert?
- Wie beeinflusst die Wahl der Darstellung die nachfolgende Suche und Modellierung?
Key theories
- Chemischer Graph und Liniennotation
- Die Darstellung eines Moleküls als beschrifteter Graph aus Atomen und Bindungen und dessen Serialisierung in eine kompakte Liniennotation wie SMILES bildet die Grundlage für Speicherung, Austausch und Kanonisierung.
- Deskriptor- und Fingerabdruckkodierung
- Die Umwandlung der Struktur in numerische Deskriptoren fester Länge oder binäre Fingerabdrücke ermöglicht quantitative Vergleiche, Ähnlichkeitssuchen und maschinelle Lernmodelle.
Clinical relevance
Robuste molekulare Darstellungen sind die Grundlage jedes cheminformatischen Workflows, von der Datenbank-Deduplizierung und -Suche bis hin zu quantitativen Struktur-Aktivitäts-Modellen, die die Entdeckung von Medikamenten und Materialien leiten.
History
Von frühen Verbindungstabellen und der Morgan-Kanonisierung erhielt das Feld 1988 die SMILES-Notation und später den offenen InChI-Standard, zusammen mit einer Proliferation von Deskriptoren und Fingerabdrücken, die in Referenzwerken katalogisiert sind.
Key figures
- David Weininger
- Roberto Todeschini
- Peter Willett
- Stephen Heller
Related topics
Seminal works
- weininger1988
- todeschini2009
Frequently asked questions
- Worin besteht der Unterschied zwischen SMILES und InChI?
- SMILES ist eine flexible, menschenlesbare Liniennotation, die mehrere gültige Formen für ein Molekül haben kann, während InChI ein standardisierter, kanonischer Identifikator ist, der darauf ausgelegt ist, eine einzige eindeutige Zeichenkette pro Struktur zu liefern.
- Was ist ein molekularer Fingerabdruck?
- Es handelt sich um eine Bitvektor-Kodierung des Vorhandenseins struktureller Merkmale oder Fragmente, die schnelle Ähnlichkeitsvergleiche zwischen Molekülen unter Verwendung einfacher mengenbasierter Maße ermöglicht.