ScholarGate
Assistent

Molekulare Darstellung und Deskriptoren

Computer benötigen maschinenlesbare Kodierungen von Molekülen; Liniennotationen, chemische Graphen, Fingerabdrücke und numerische Deskriptoren übersetzen die chemische Struktur in Formen, die gespeichert, durchsucht und modelliert werden können.

Thema finden mit PaperMindDemnächstFind papers & topics
Tools & resources
Folien herunterladen
Learn & explore
VideoDemnächst

Definition

Die Kodierungen und berechneten Merkmale, die die molekulare Struktur digital darstellen, von kanonischen Zeichenketten und Graphen bis hin zu Fingerabdruck-Bitvektoren und numerischen Deskriptoren.

Scope

Umfasst die chemisch-graphische Ansicht von Molekülen, Liniennotationen wie SMILES und InChI, Strukturschlüssel und gehashte Fingerabdrücke sowie die breite Familie molekularer Deskriptoren, die die Struktur in numerische Merkmale für Ähnlichkeits- und prädiktive Modellierung umwandeln.

Core questions

  • Wie werden Moleküle als Graphen und als kanonische Zeichenketten dargestellt?
  • Worin besteht der Unterschied zwischen Strukturschlüsseln, gehashten Fingerabdrücken und numerischen Deskriptoren?
  • Wie wird ein eindeutiger, kanonischer Identifikator wie InChI generiert?
  • Wie beeinflusst die Wahl der Darstellung die nachfolgende Suche und Modellierung?

Key theories

Chemischer Graph und Liniennotation
Die Darstellung eines Moleküls als beschrifteter Graph aus Atomen und Bindungen und dessen Serialisierung in eine kompakte Liniennotation wie SMILES bildet die Grundlage für Speicherung, Austausch und Kanonisierung.
Deskriptor- und Fingerabdruckkodierung
Die Umwandlung der Struktur in numerische Deskriptoren fester Länge oder binäre Fingerabdrücke ermöglicht quantitative Vergleiche, Ähnlichkeitssuchen und maschinelle Lernmodelle.

Clinical relevance

Robuste molekulare Darstellungen sind die Grundlage jedes cheminformatischen Workflows, von der Datenbank-Deduplizierung und -Suche bis hin zu quantitativen Struktur-Aktivitäts-Modellen, die die Entdeckung von Medikamenten und Materialien leiten.

History

Von frühen Verbindungstabellen und der Morgan-Kanonisierung erhielt das Feld 1988 die SMILES-Notation und später den offenen InChI-Standard, zusammen mit einer Proliferation von Deskriptoren und Fingerabdrücken, die in Referenzwerken katalogisiert sind.

Key figures

  • David Weininger
  • Roberto Todeschini
  • Peter Willett
  • Stephen Heller

Related topics

Seminal works

  • weininger1988
  • todeschini2009

Frequently asked questions

Worin besteht der Unterschied zwischen SMILES und InChI?
SMILES ist eine flexible, menschenlesbare Liniennotation, die mehrere gültige Formen für ein Molekül haben kann, während InChI ein standardisierter, kanonischer Identifikator ist, der darauf ausgelegt ist, eine einzige eindeutige Zeichenkette pro Struktur zu liefern.
Was ist ein molekularer Fingerabdruck?
Es handelt sich um eine Bitvektor-Kodierung des Vorhandenseins struktureller Merkmale oder Fragmente, die schnelle Ähnlichkeitsvergleiche zwischen Molekülen unter Verwendung einfacher mengenbasierter Maße ermöglicht.

Methods for this concept

Related concepts