Métriques de conservation et de contrainte évolutives
Une séquence qui a peu changé entre les espèces, ou qui présente moins de variants que prévu au sein d'une espèce, est dite conservée ou contrainte — un signe que la sélection purificatrice a éliminé les changements délétères. Les métriques de conservation et de contrainte transforment ce signal évolutif en scores quantitatifs qui identifient les positions fonctionnellement importantes dans le génome.
Definition
La conservation évolutive est la persistance d'une séquence entre les espèces par le biais de la sélection purificatrice ; la contrainte est l'appauvrissement correspondant de la variation au sein d'une espèce. Les métriques de conservation et de contrainte sont des scores qui quantifient, position par position ou gène par gène, l'intensité avec laquelle la sélection a agi contre le changement.
Scope
Cette entrée couvre les scores de conservation inter-espèces et les métriques de contrainte intra-espèces, la logique évolutive qui les relie à la fonction, et leur rôle dans la priorisation des variants. Il s'agit d'un sujet méthodologique décrivant comment les scores sont dérivés et interprétés, et non d'un outil pour attribuer une signification clinique à un variant particulier.
Core questions
- Pourquoi la conservation entre espèces indique-t-elle une fonction biologique ?
- Comment les scores de conservation par base sont-ils calculés à partir d'alignements multiples ?
- Comment la contrainte est-elle mesurée à partir du déficit de variation au sein d'une espèce ?
- Comment ces métriques sont-elles utilisées pour prioriser les variants candidats ?
Key concepts
- Sélection purificatrice (négative)
- Scores de conservation inter-espèces
- phastCons et phyloP
- Contrainte intra-espèces
- Intolérance à la perte de fonction
- Nombre de variants observés vs attendus
Key theories
- Sélection purificatrice et taux de substitution réduit
- Les sites fonctionnellement importants subissent une sélection purificatrice (négative) qui élimine les mutations délétères, réduisant leur taux de substitution entre les espèces et appauvrissant la variation ségrégeante au sein d'une espèce ; les scores de conservation et de contrainte interprètent ce taux réduit ou cet appauvrissement comme une preuve de fonction.
Mechanisms
La conservation est inférée en comparant des séquences homologues entre espèces dans un alignement multiple et en déterminant où les substitutions sont plus rares que ne le prédit un taux neutre ; des méthodes telles que phastCons et phyloP formalisent cela sur une phylogénie. La contrainte utilise plutôt des données intra-espèces, comparant le nombre de variants réellement observés dans un gène ou une région avec le nombre attendu sous un modèle mutationnel neutre — un déficit substantiel indique une intolérance à la variation, en particulier aux changements de perte de fonction. De vastes ensembles de données de séquençage humain ont permis de quantifier cette contrainte à l'échelle du génome.
Clinical relevance
Les métriques de conservation et de contrainte sont largement utilisées comme preuves à l'appui lors de la priorisation des variants candidats en recherche et en génomique diagnostique, car les variants situés à des positions contraintes ou dans des gènes contraints sont, en moyenne, plus susceptibles d'avoir des conséquences fonctionnelles. Ces scores sont des résumés au niveau de la population et de l'évolution ; cette entrée décrit comment ils sont dérivés et ne constitue pas une base pour des décisions diagnostiques ou thérapeutiques individuelles.
Evidence & guidelines
L'évaluation de la conservation inter-espèces a été établie par des méthodes phylogénétiques telles que phastCons et phyloP, tandis que les efforts de séquençage humain à grande échelle ont quantifié la contrainte intra-espèces et l'intolérance à la perte de fonction à travers les gènes, fournissant la base empirique pour les métriques de contrainte maintenant utilisées dans la priorisation des variants.
History
L'analyse comparative de séquences a longtemps suggéré que les régions conservées étaient fonctionnelles, et la disponibilité de nombreux génomes alignés dans les années 2000 a permis de calculer des scores de conservation quantitatifs à l'échelle du génome. Avec de très grandes cohortes humaines dans les années 2010, l'attention s'est étendue à la contrainte intra-espèces, produisant des métriques d'intolérance au niveau des gènes et une carte à l'échelle du génome de la contrainte mutationnelle.
Key figures
- Adam Siepel
- David Haussler
- Katherine Pollard
- Daniel MacArthur
Related topics
Seminal works
- siepel-2005
- lek-2016
- karczewski-2020
Frequently asked questions
- Quelle est la différence entre conservation et contrainte ?
- La conservation est mesurée entre les espèces, en fonction de la faible modification d'une séquence au cours du temps évolutif ; la contrainte est mesurée au sein d'une espèce, en fonction de la quantité de variation manquante par rapport à l'attente neutre. Les deux reflètent la sélection purificatrice mais utilisent des données différentes.
- Un score de contrainte élevé signifie-t-il qu'un variant est pathogène ?
- Non. La contrainte et la conservation sont des signaux statistiques d'importance fonctionnelle moyennés sur des positions ou des gènes ; elles peuvent soutenir la priorisation des variants mais n'établissent pas à elles seules qu'un variant individuel provoque une maladie.
Methods for this concept
Related concepts
- Variation génomique et génomique des populations
- Annotation fonctionnelle des variants génomiques
- Cadres de classification des variants de séquence
- Diversité nucléotidique et classification des variants
- Interprétation des variants pathogènes et bénins
- Spectre de fréquence allélique et spectre de fréquence des sites