Stratification de la population et ascendance dans les GWAS
La stratification de la population est la différence systématique d'ascendance entre les individus comparés dans une étude génétique. Lorsque les cas et les témoins diffèrent par leur origine ancestrale, toute variation dont la fréquence diffère entre ces ascendances semblera associée au trait, même si elle n'a aucun rôle causal – un facteur de confusion qui peut générer de faux positifs à travers l'ensemble du génome. La détection et l'ajustement de l'ascendance constituent donc une garantie essentielle pour la validité des tests d'association.
Definition
La stratification de la population est un facteur de confusion de l'association génotype-phénotype dû à des différences d'ascendance systématiques entre les groupes comparés, et son contrôle est l'ensemble des méthodes – principalement les composantes principales d'ascendance et les modèles mixtes – qui ajustent les tests d'association afin que les signaux reflètent des effets intra-ascendance plutôt que l'ascendance elle-même.
Scope
Ce sujet aborde les raisons pour lesquelles les différences d'ascendance faussent les tests d'association, la manière dont la stratification est détectée (inflation génomique, analyse en composantes principales), comment elle est corrigée (covariables basées sur les composantes principales, modèles mixtes, contrôle génomique), et la préoccupation plus large en matière d'équité selon laquelle le biais d'ascendance européenne des GWAS limite la transférabilité des résultats et des scores polygéniques. Il s'agit d'une référence méthodologique, et non d'une directive clinique.
Core questions
- Comment les différences d'ascendance entre les cas et les témoins créent-elles des associations fallacieuses ?
- Comment la stratification est-elle détectée, et qu'indique un facteur d'inflation du contrôle génomique élevé ?
- Comment l'analyse en composantes principales corrige-t-elle l'ascendance ?
- Quand les modèles mixtes sont-ils préférés pour gérer la structure et la parenté ?
- Pourquoi le biais d'ascendance européenne des GWAS limite-t-il la généralisabilité ?
Key concepts
- Biais de confusion par l'ascendance
- Contrôle génomique et facteur d'inflation (lambda)
- Analyse en composantes principales des génotypes
- Marqueurs informatifs d'ascendance
- Modèles linéaires mixtes pour la structure et la parenté
- Mélange génétique et ascendance continue
- Transférabilité des résultats et des scores polygéniques entre les ascendances
Mechanisms
Si des sous-groupes d'ascendance différente sont inégalement représentés parmi les cas et les témoins, et si le risque de maladie et les fréquences alléliques diffèrent entre ces sous-groupes, la fréquence allélique suivra le trait par l'ascendance plutôt que par la causalité, gonflant les statistiques de test à l'échelle du génome. La détection repose sur cette signature pangénomique : le facteur d'inflation du contrôle génomique résume à quel point la statistique de test médiane dépasse son attente nulle, et l'analyse en composantes principales des génotypes pangénomiques révèle les axes de variation de l'ascendance parmi les échantillons. La correction inclut généralement les principales composantes principales comme covariables dans la régression, ce qui absorbe le signal d'ascendance, ou utilise des modèles linéaires mixtes qui tiennent conjointement compte de la structure et de la parenté cryptique via une matrice de parenté génétique. Des panels de référence tels que le 1000 Genomes Project aident à positionner les échantillons sur une carte d'ascendance mondiale et à éclairer l'imputation. Étant donné que la plupart des échantillons de GWAS sont d'ascendance européenne, même les analyses bien corrigées produisent des estimations d'effet et des scores polygéniques qui se transfèrent imparfaitement à d'autres populations.
Clinical relevance
L'ajustement pour l'ascendance est essentiel à la validité des preuves génétiques utilisées dans la recherche sur les maladies, et la composition ancestrale des études a un impact direct sur la biologie de qui est représentée dans les découvertes et les scores génomiques. Ce sujet est descriptif des méthodes et des considérations d'équité ; il ne constitue pas une base pour des tests génétiques individuels ou une interprétation clinique.
Evidence & guidelines
Les normes ici proviennent de la littérature méthodologique plutôt que des directives cliniques. Price et al. (2006) ont introduit la correction par composantes principales (l'approche EIGENSTRAT) comme solution évolutive ; Price et al. (2010) ont examiné et étendu les stratégies, y compris les modèles mixtes ; le 1000 Genomes Project (2015) a fourni la référence diversifiée nécessaire pour caractériser l'ascendance ; et Visscher et al. (2017) soulignent les conséquences en termes de généralisabilité et d'équité du déséquilibre d'ascendance.
History
La préoccupation selon laquelle l'ascendance pourrait fausser l'association génétique est antérieure aux GWAS, et des approches précoces telles que le contrôle génomique et l'association structurée ont été développées pour y remédier. L'introduction en 2006 de l'analyse en composantes principales a fourni un moyen rapide et pangénomique de modéliser l'ascendance continue et est devenue une pratique standard, complétée plus tard par des méthodes de modèles mixtes qui gèrent également la parenté. À mesure que les GWAS se sont étendues aux biobanques, le domaine a de plus en plus reconnu que le contrôle de la stratification au sein d'échantillons majoritairement européens ne résout pas le problème plus vaste de la sous-représentation d'autres ascendances.
Debates
- Les corrections d'ascendance éliminent-elles entièrement le facteur de confusion, ou peuvent-elles aussi supprimer un signal réel ?
- Les composantes principales et les modèles mixtes contrôlent efficacement la stratification dans la plupart des contextes, mais distinguer le facteur de confusion de la biologie réellement corrélée à l'ascendance – et éviter une sur-correction qui effacerait des effets réels – demeure un jugement méthodologique, en particulier pour les traits présentant une structure géographique subtile.
- Le biais d'ascendance européenne des GWAS compromet-il l'équité et la validité ?
- Les résultats et les scores polygéniques dérivés principalement d'échantillons d'ascendance européenne se transfèrent imparfaitement à d'autres populations, soulevant des préoccupations scientifiques quant à la généralisabilité et des préoccupations d'équité quant à la distribution des bénéfices de la médecine génomique.
Key figures
- Alkes Price
- David Reich
- Nick Patterson
- Noah Zaitlen
- Peter Visscher
Related topics
Seminal works
- price-2006
- price-2010
Frequently asked questions
- Comment la stratification de la population crée-t-elle de faux résultats de GWAS ?
- Si les cas et les témoins diffèrent par leur ascendance, les variants dont la fréquence diffère entre ces ascendances semblent associés au trait par l'ascendance plutôt que par la causalité, produisant des associations fallacieuses à travers le génome.
- Comment la stratification est-elle généralement corrigée ?
- L'approche standard inclut les principales composantes principales des génotypes pangénomiques comme covariables, ou utilise un modèle linéaire mixte, de sorte que les tests d'association reflètent les effets au sein de l'ascendance plutôt que les différences d'ascendance elles-mêmes.
Methods for this concept
Related concepts
- Stratification de la population et Admixture
- Stratification de la population et diversité génétique humaine
- Méthodes d'inférence d'ascendance et d'admixture
- Conception, exécution et méthodes statistiques des GWAS
- Études d'association pangénomique et découverte de variants
- Cartographie des QTL et des Caractères Complexes