Representação Molecular e Descritores
Os computadores necessitam de codificações de moléculas legíveis por máquina; notações de linha, grafos químicos, impressões digitais e descritores numéricos traduzem a estrutura química em formas que podem ser armazenadas, pesquisadas e modeladas.
Definition
As codificações e características computadas que representam digitalmente a estrutura molecular, variando de cadeias de caracteres canônicas e grafos a vetores de bits de impressão digital e descritores numéricos.
Scope
Abrange a visão de grafo químico de moléculas, notações de linha como SMILES e InChI, chaves estruturais e impressões digitais (fingerprints) com hash, e a vasta família de descritores moleculares que transformam a estrutura em características numéricas para similaridade e modelagem preditiva.
Core questions
- Como as moléculas são representadas como grafos e como cadeias de caracteres canônicas?
- Qual a diferença entre chaves estruturais, impressões digitais com hash e descritores numéricos?
- Como é gerado um identificador único e canônico como o InChI?
- Como a escolha da representação molda a pesquisa e a modelagem subsequentes?
Key theories
- Grafo químico e notação de linha
- Representar uma molécula como um grafo rotulado de átomos e ligações, e serializá-la em uma notação de linha compacta como SMILES, fornece a base para armazenamento, troca e canonização.
- Codificação de descritores e impressões digitais
- Transformar a estrutura em descritores numéricos de comprimento fixo ou impressões digitais binárias permite comparação quantitativa, busca por similaridade e modelos de aprendizado de máquina.
Clinical relevance
Representações moleculares robustas são a base de todo fluxo de trabalho de quimioinformática, desde a deduplicação e busca em bancos de dados até modelos quantitativos de estrutura-atividade que guiam a descoberta de medicamentos e materiais.
History
Desde as primeiras tabelas de conexão e a canonização de Morgan, o campo obteve a notação SMILES em 1988 e, posteriormente, o padrão aberto InChI, juntamente com uma proliferação de descritores e impressões digitais catalogados em obras de referência.
Key figures
- David Weininger
- Roberto Todeschini
- Peter Willett
- Stephen Heller
Related topics
Seminal works
- weininger1988
- todeschini2009
Frequently asked questions
- Qual a diferença entre SMILES e InChI?
- SMILES é uma notação de linha flexível e legível por humanos que pode ter múltiplas formas válidas para uma molécula, enquanto InChI é um identificador padronizado e canônico projetado para fornecer uma única cadeia de caracteres única por estrutura.
- O que é uma impressão digital molecular (molecular fingerprint)?
- É um vetor de bits que codifica a presença de características ou fragmentos estruturais, permitindo comparações rápidas de similaridade entre moléculas usando medidas simples baseadas em conjuntos.