ScholarGate
Assistant

Analyse quantitative structure-activité (QSAR)

L'analyse des relations quantitatives structure-activité (QSAR) transforme l'observation qualitative selon laquelle la structure détermine l'activité en un modèle mathématique : elle met en relation des descripteurs numériques de la structure moléculaire avec une activité biologique mesurée, afin de pouvoir prédire l'activité de composés non encore testés. Elle constitue le cœur quantitatif du raisonnement structure-activité en chimie médicinale.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

Une relation quantitative structure-activité est un modèle mathématique qui corrèle des descripteurs numériques de la structure chimique — tels que des propriétés physico-chimiques, topologiques, électroniques ou de champ tridimensionnel — avec une mesure quantitative de l'activité biologique, afin d'interpréter les tendances structure-activité et de prédire l'activité de composés non testés.

Scope

Cette entrée aborde la logique de la description numérique des molécules, l'analyse classique de type Hansch basée sur des paramètres physico-chimiques, le passage aux méthodes tridimensionnelles et basées sur les champs, la manière dont les modèles sont construits et validés, ainsi que leur utilisation et ce qui limite leur fiabilité. Elle traite la QSAR comme une méthodologie de modélisation, et non comme une directive clinique.

Core questions

  • Comment la structure chimique peut-elle être représentée numériquement sous forme de descripteurs ?
  • Comment une relation entre ces descripteurs et l'activité est-elle ajustée et interprétée ?
  • Qu'apportent les méthodes QSAR tridimensionnelles et basées sur les champs par rapport à l'analyse classique basée sur les paramètres ?
  • Comment un modèle QSAR est-il validé, et qu'est-ce qui définit son domaine de prédiction fiable ?

Key concepts

  • Descripteur moléculaire
  • Série congénérique
  • Analyse de Hansch et paramètres de substituants
  • Analyse de Free-Wilson (contribution additive de groupes)
  • QSAR 3D et champs moléculaires
  • Régression par les moindres carrés partiels
  • Validation de modèle et domaine d'applicabilité
  • Surapprentissage et corrélation fortuite

Key theories

QSAR de Hansch (énergie libre linéaire)
Au sein d'une série congénérique, l'activité biologique peut être exprimée comme une combinaison linéaire de paramètres physico-chimiques de substituants — typiquement un terme hydrophobe ainsi que des termes électroniques et stériques — basée sur des relations linéaires d'énergie libre, fournissant un modèle d'activité interprétable et prédictif.
QSAR tridimensionnelle basée sur les champs (CoMFA)
L'analyse comparative des champs moléculaires aligne un ensemble de molécules et calcule les champs d'interaction stériques et électrostatiques aux points de grille autour d'elles, puis relie ces valeurs de champ à l'activité par les moindres carrés partiels, capturant des informations structure-activité tridimensionnelles et produisant des cartes indiquant où les changements de champ affectent l'activité.

Mechanisms

La QSAR encode chaque molécule comme un ensemble de descripteurs — des paramètres physico-chimiques tels que la lipophilie, les termes électroniques et stériques dans l'analyse de Hansch classique ; des variables indicatrices pour la présence de groupes dans l'analyse de Free-Wilson ; ou, dans les méthodes tridimensionnelles, les valeurs des champs stériques et électrostatiques échantillonnés autour de molécules alignées. Une méthode statistique ou d'apprentissage automatique ajuste ensuite la relation entre ces descripteurs et l'activité mesurée pour un ensemble d'entraînement, produisant un modèle qui est interprété pour identifier quelles caractéristiques structurelles déterminent l'activité et utilisé pour prédire l'activité de nouveaux composés. Une utilisation fiable dépend d'une validation rigoureuse, d'une estimation honnête des performances prédictives et du respect du domaine d'applicabilité du modèle — la région de l'espace chimique couverte par les données d'entraînement — car les modèles peuvent autrement refléter une corrélation fortuite ou échouer en dehors des données sur lesquelles ils ont été construits.

Clinical relevance

La QSAR est à la base de la manière dont les molécules candidates sont priorisées et optimisées, et dont certaines prédictions de propriétés et de toxicité sont générées dans la découverte de médicaments et l'évaluation de la sécurité chimique. Le contenu est une information éducative sur une méthodologie de modélisation ; il décrit comment l'activité est prédite à partir de la structure et n'est pas une directive pour l'utilisation clinique d'un composé quelconque.

Evidence & guidelines

La méthodologie QSAR est documentée dans les articles fondateurs qui ont introduit l'analyse basée sur les paramètres et sur les champs, ainsi que dans des revues complètes examinant le développement du domaine, les pratiques de validation et les attentes en matière de bonnes pratiques. Il s'agit de principes de conception méthodologique et de modélisation plutôt que de lignes directrices de pratique clinique ; des directives formelles sur la validation existent dans la littérature réglementaire et de chimioinformatique, mais ne sont résumées ici qu'au niveau des principes.

History

La SAR quantitative a débuté en 1964 lorsque Hansch et Fujita ont corrélé l'activité biologique avec des paramètres physico-chimiques de substituants via des relations linéaires d'énergie libre, tandis que l'approche de Free-Wilson proposait un modèle parallèle de contribution additive de groupes. La compilation de données de partition par Leo et Hansch a fourni des descripteurs pour ce travail. En 1988, Cramer et ses collègues ont introduit l'analyse comparative des champs moléculaires, étendant la QSAR aux trois dimensions. Le domaine s'est ensuite étendu avec de nombreux types de descripteurs et de méthodes d'apprentissage automatique, et des revues telles que l'étude de Cherkasov et ses collègues en 2014 ont fait le point sur son développement, ses normes de validation et ses orientations futures.

Debates

Prédictivité, validation et domaine d'applicabilité
La rigueur avec laquelle les modèles QSAR doivent être validés pour être fiables — y compris les dangers du surapprentissage, de la corrélation fortuite et de l'extrapolation au-delà de l'ensemble d'entraînement — a été une préoccupation persistante, le domaine convergeant vers des exigences de validation externe et de domaines d'applicabilité explicites.

Key figures

  • Corwin Hansch
  • Toshio Fujita
  • Spencer Free
  • James Wilson
  • Richard Cramer
  • Alexander Tropsha

Related topics

Seminal works

  • hansch-fujita-1964
  • cramer-1988
  • cherkasov-2014

Frequently asked questions

Qu'est-ce que la QSAR ?
La QSAR, ou relation quantitative structure-activité, est un modèle mathématique qui relie les descripteurs numériques de la structure d'une molécule à une activité biologique mesurée, permettant de prédire l'activité de composés non testés et d'identifier les facteurs structurels déterminant l'activité.
Quelle est la différence entre la QSAR classique et la QSAR 3D ?
La QSAR classique (telle que l'analyse de Hansch) relie l'activité à des descripteurs physico-chimiques ou autres, tabulés, de substituants ou de molécules entières ; les méthodes de QSAR 3D, comme CoMFA, alignent les molécules en trois dimensions et utilisent les valeurs des champs stériques et électrostatiques autour d'elles, capturant des informations structure-activité spatiales et produisant des cartes indiquant où les changements affectent l'activité.

Methods for this concept

Related concepts