ScholarGate
Assistant

Stratification de la population et ascendance dans les GWAS

La stratification de la population est la différence systématique d'ascendance entre les individus comparés dans une étude génétique. Lorsque les cas et les témoins diffèrent par leur origine ancestrale, toute variation dont la fréquence diffère entre ces ascendances semblera associée au trait, même si elle n'a aucun rôle causal – un facteur de confusion qui peut générer de faux positifs à travers l'ensemble du génome. La détection et l'ajustement de l'ascendance constituent donc une garantie essentielle pour la validité des tests d'association.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

La stratification de la population est un facteur de confusion de l'association génotype-phénotype dû à des différences d'ascendance systématiques entre les groupes comparés, et son contrôle est l'ensemble des méthodes – principalement les composantes principales d'ascendance et les modèles mixtes – qui ajustent les tests d'association afin que les signaux reflètent des effets intra-ascendance plutôt que l'ascendance elle-même.

Scope

Ce sujet aborde les raisons pour lesquelles les différences d'ascendance faussent les tests d'association, la manière dont la stratification est détectée (inflation génomique, analyse en composantes principales), comment elle est corrigée (covariables basées sur les composantes principales, modèles mixtes, contrôle génomique), et la préoccupation plus large en matière d'équité selon laquelle le biais d'ascendance européenne des GWAS limite la transférabilité des résultats et des scores polygéniques. Il s'agit d'une référence méthodologique, et non d'une directive clinique.

Core questions

  • Comment les différences d'ascendance entre les cas et les témoins créent-elles des associations fallacieuses ?
  • Comment la stratification est-elle détectée, et qu'indique un facteur d'inflation du contrôle génomique élevé ?
  • Comment l'analyse en composantes principales corrige-t-elle l'ascendance ?
  • Quand les modèles mixtes sont-ils préférés pour gérer la structure et la parenté ?
  • Pourquoi le biais d'ascendance européenne des GWAS limite-t-il la généralisabilité ?

Key concepts

  • Biais de confusion par l'ascendance
  • Contrôle génomique et facteur d'inflation (lambda)
  • Analyse en composantes principales des génotypes
  • Marqueurs informatifs d'ascendance
  • Modèles linéaires mixtes pour la structure et la parenté
  • Mélange génétique et ascendance continue
  • Transférabilité des résultats et des scores polygéniques entre les ascendances

Mechanisms

Si des sous-groupes d'ascendance différente sont inégalement représentés parmi les cas et les témoins, et si le risque de maladie et les fréquences alléliques diffèrent entre ces sous-groupes, la fréquence allélique suivra le trait par l'ascendance plutôt que par la causalité, gonflant les statistiques de test à l'échelle du génome. La détection repose sur cette signature pangénomique : le facteur d'inflation du contrôle génomique résume à quel point la statistique de test médiane dépasse son attente nulle, et l'analyse en composantes principales des génotypes pangénomiques révèle les axes de variation de l'ascendance parmi les échantillons. La correction inclut généralement les principales composantes principales comme covariables dans la régression, ce qui absorbe le signal d'ascendance, ou utilise des modèles linéaires mixtes qui tiennent conjointement compte de la structure et de la parenté cryptique via une matrice de parenté génétique. Des panels de référence tels que le 1000 Genomes Project aident à positionner les échantillons sur une carte d'ascendance mondiale et à éclairer l'imputation. Étant donné que la plupart des échantillons de GWAS sont d'ascendance européenne, même les analyses bien corrigées produisent des estimations d'effet et des scores polygéniques qui se transfèrent imparfaitement à d'autres populations.

Clinical relevance

L'ajustement pour l'ascendance est essentiel à la validité des preuves génétiques utilisées dans la recherche sur les maladies, et la composition ancestrale des études a un impact direct sur la biologie de qui est représentée dans les découvertes et les scores génomiques. Ce sujet est descriptif des méthodes et des considérations d'équité ; il ne constitue pas une base pour des tests génétiques individuels ou une interprétation clinique.

Evidence & guidelines

Les normes ici proviennent de la littérature méthodologique plutôt que des directives cliniques. Price et al. (2006) ont introduit la correction par composantes principales (l'approche EIGENSTRAT) comme solution évolutive ; Price et al. (2010) ont examiné et étendu les stratégies, y compris les modèles mixtes ; le 1000 Genomes Project (2015) a fourni la référence diversifiée nécessaire pour caractériser l'ascendance ; et Visscher et al. (2017) soulignent les conséquences en termes de généralisabilité et d'équité du déséquilibre d'ascendance.

History

La préoccupation selon laquelle l'ascendance pourrait fausser l'association génétique est antérieure aux GWAS, et des approches précoces telles que le contrôle génomique et l'association structurée ont été développées pour y remédier. L'introduction en 2006 de l'analyse en composantes principales a fourni un moyen rapide et pangénomique de modéliser l'ascendance continue et est devenue une pratique standard, complétée plus tard par des méthodes de modèles mixtes qui gèrent également la parenté. À mesure que les GWAS se sont étendues aux biobanques, le domaine a de plus en plus reconnu que le contrôle de la stratification au sein d'échantillons majoritairement européens ne résout pas le problème plus vaste de la sous-représentation d'autres ascendances.

Debates

Les corrections d'ascendance éliminent-elles entièrement le facteur de confusion, ou peuvent-elles aussi supprimer un signal réel ?
Les composantes principales et les modèles mixtes contrôlent efficacement la stratification dans la plupart des contextes, mais distinguer le facteur de confusion de la biologie réellement corrélée à l'ascendance – et éviter une sur-correction qui effacerait des effets réels – demeure un jugement méthodologique, en particulier pour les traits présentant une structure géographique subtile.
Le biais d'ascendance européenne des GWAS compromet-il l'équité et la validité ?
Les résultats et les scores polygéniques dérivés principalement d'échantillons d'ascendance européenne se transfèrent imparfaitement à d'autres populations, soulevant des préoccupations scientifiques quant à la généralisabilité et des préoccupations d'équité quant à la distribution des bénéfices de la médecine génomique.

Key figures

  • Alkes Price
  • David Reich
  • Nick Patterson
  • Noah Zaitlen
  • Peter Visscher

Related topics

Seminal works

  • price-2006
  • price-2010

Frequently asked questions

Comment la stratification de la population crée-t-elle de faux résultats de GWAS ?
Si les cas et les témoins diffèrent par leur ascendance, les variants dont la fréquence diffère entre ces ascendances semblent associés au trait par l'ascendance plutôt que par la causalité, produisant des associations fallacieuses à travers le génome.
Comment la stratification est-elle généralement corrigée ?
L'approche standard inclut les principales composantes principales des génotypes pangénomiques comme covariables, ou utilise un modèle linéaire mixte, de sorte que les tests d'association reflètent les effets au sein de l'ascendance plutôt que les différences d'ascendance elles-mêmes.

Methods for this concept

Related concepts