QSAR e Modelagem de Propriedades
As relações quantitativas estrutura-atividade e estrutura-propriedade constroem modelos estatísticos que preveem a atividade ou propriedade de uma molécula a partir de descritores numéricos de sua estrutura.
Definition
Modelos empíricos, baseados em dados, que relacionam a estrutura molecular, codificada como descritores, a uma propriedade medida ou atividade biológica para fins preditivos.
Scope
Abrange a construção de modelos QSAR e QSPR, os descritores e algoritmos de aprendizado que utilizam, a importância central da validação e do domínio de aplicabilidade, e as aplicações à atividade biológica e às propriedades físico-químicas e ADMET. Distingue modelos clássicos interpretáveis de modelos modernos baseados em aprendizado de máquina.
Core questions
- Como a atividade biológica ou uma propriedade é correlacionada com descritores moleculares?
- Como os modelos QSAR são validados para garantir uma preditividade genuína?
- O que é o domínio de aplicabilidade e por que ele é importante?
- Como os modelos QSAR clássicos e os modelos modernos de aprendizado de máquina diferem?
Key theories
- Análise de Hansch
- Correlaciona a atividade biológica com descritores físico-químicos, como lipofilicidade e parâmetros eletrônicos e estéricos, fundando a relação quantitativa estrutura-atividade.
- Validação e domínio de aplicabilidade
- A QSAR confiável requer validação externa rigorosa e um domínio de aplicabilidade definido, uma vez que os modelos extrapolam mal para estruturas diferentes dos seus dados de treinamento.
Clinical relevance
Os modelos QSAR e de propriedades guiam a otimização de leads, priorizam compostos para síntese e teste, e preveem a absorção, distribuição, metabolismo, excreção e toxicidade, além de informar a avaliação regulatória da segurança química.
History
Fundada pela análise de Hansch e Fujita de 1964, que correlacionava a atividade com parâmetros físico-químicos, a QSAR cresceu através de variantes tridimensionais e de aprendizado de máquina, com a OCDE posteriormente codificando princípios de validação para uso regulatório.
Debates
- Rigor da validação e overfitting
- Altas estatísticas de ajuste interno podem mascarar uma baixa preditividade real, portanto, há uma ênfase sustentada e um debate sobre a validação externa e a definição adequada do domínio de aplicabilidade.
Key figures
- Corwin Hansch
- Toshio Fujita
- Alexander Tropsha
- Johann Gasteiger
Related topics
Seminal works
- hansch1964
- tropsha2010
Frequently asked questions
- O que é o domínio de aplicabilidade de um modelo QSAR?
- É a região do espaço químico, definida pelos dados de treinamento, dentro da qual as previsões do modelo são consideradas confiáveis; as previsões para moléculas muito diferentes devem ser tratadas com cautela.
- Como um modelo QSAR é validado adequadamente?
- Além da validação cruzada interna, ele deve ser testado em um conjunto externo de compostos não utilizados no treinamento, uma vez que boas estatísticas internas por si só não garantem o desempenho preditivo.