Stratification de la population et Admixture
La stratification de la population est la présence de différences systématiques d'ascendance génétique entre les groupes comparés d'une étude génétique, et l'admixture est le mélange d'ascendances au sein d'individus issus de populations précédemment séparées. Les deux créent une structure de population qui peut fausser les études d'association génétique, générant des liens fallacieux entre un variant et une maladie simplement parce que la fréquence allélique et le risque de maladie diffèrent tous deux selon l'ascendance.
Definition
La stratification de la population est un facteur de confusion dans une étude d'association génétique causée par des différences d'ascendance entre les groupes, dans laquelle les fréquences alléliques et le risque de maladie varient tous deux au sein des sous-populations ; l'admixture est la présence, chez des individus, d'une ascendance génétique provenant de deux ou plusieurs populations historiquement distinctes, une source de structure connexe.
Scope
Ce sujet aborde comment la structure de population apparaît, pourquoi elle fausse les études d'association génétique cas-témoins, et les principales méthodes utilisées pour la détecter et l'ajuster. Il est présenté comme un sujet méthodologique en épidémiologie génétique — concernant la validité des études — et non comme une déclaration sur la biologie ou la classification des groupes de populations humaines.
Core questions
- Les groupes comparés dans une étude génétique proviennent-ils de la même population sous-jacente ?
- Une association apparente variant-maladie pourrait-elle s'expliquer par l'ascendance plutôt que par la causalité ?
- Comment la structure de population peut-elle être détectée à partir de données génétiques ?
- Comment les tests d'association peuvent-ils être ajustés afin que la structure n'augmente pas les faux positifs ?
Key concepts
- Facteur de confusion lié à l'ascendance
- Structure et sous-structure de population
- Admixture
- Différences de fréquence allélique
- Contrôle génomique
- Analyse en composantes principales de l'ascendance
- Modèles mixtes pour la parenté
Mechanisms
Si les cas et les témoins d'une étude d'association diffèrent par leur ascendance, tout variant dont la fréquence diffère entre ces groupes ancestraux apparaîtra associé à la maladie chaque fois que le risque de maladie diffère également entre les groupes, même lorsque le variant n'a aucun rôle causal. Il s'agit d'un facteur de confusion classique, l'ascendance génétique étant le facteur de confusion. Les méthodes y remédient en mesurant et en ajustant l'ascendance : le contrôle génomique (genomic control) rééchelonne les statistiques de test à l'aide d'un facteur d'inflation estimé à partir de nombreux marqueurs ; l'analyse en composantes principales (principal components analysis) résume l'ascendance à partir de génotypes à l'échelle du génome et inclut ces composantes comme covariables ; et les modèles mixtes (mixed models) tiennent compte à la fois de la structure générale et de la parenté cryptique. L'admixture, où les individus portent une ascendance mixte, peut être gérée par des approches connexes qui estiment l'ascendance locale ou globale.
Clinical relevance
Le contrôle de la structure de population est essentiel à la validité des preuves d'association génétique qui éclairent la compréhension du risque de maladies chroniques, car une stratification non contrôlée peut produire de fausses associations qui induisent en erreur les recherches ultérieures. En tant que sujet de référence, cette entrée explique une menace pour la validité des études et comment elle est traitée ; elle ne fournit pas de conseils pour les tests génétiques individuels ou leur interprétation.
Epidemiology
L'inquiétude concernant la stratification s'est accrue à mesure que les études d'association génétique prenaient de l'ampleur, car même de modestes différences d'ascendance entre les cas et les témoins peuvent augmenter les taux de faux positifs parmi les nombreux variants testés dans une étude à l'échelle du génome. Le développement du contrôle génomique et, par la suite, de l'ajustement par composantes principales et par modèles mixtes a rendu possibles de grandes études d'association multi-ascendance tout en maintenant les taux de faux positifs sous contrôle.
History
La conscience que l'ascendance pouvait fausser les études d'association est antérieure à l'ère génomique, mais des solutions pratiques ont émergé à la fin des années 1990 et dans les années 2000. Pritchard et Rosenberg ont proposé d'utiliser des marqueurs non liés pour détecter la stratification, Devlin et Roeder ont introduit le contrôle génomique pour corriger les statistiques de test gonflées, et Price et ses collègues ont montré en 2006 que l'analyse en composantes principales pouvait corriger efficacement la stratification dans les études d'association à l'échelle du génome, une approche qui est devenue une pratique courante.
Debates
- Dans quelle mesure l'ajustement statistique peut-il éliminer complètement le facteur de confusion lié à l'ascendance ?
- Le contrôle génomique, les composantes principales et les modèles mixtes réduisent l'inflation due à la structure de population, mais le débat se poursuit sur le facteur de confusion résiduel dû à une structure fine ou récente et sur la façon dont ces corrections se transfèrent bien à travers des populations diverses et admixes.
Key figures
- Jonathan Pritchard
- Noah Rosenberg
- Bernie Devlin
- Kathryn Roeder
- Alkes Price
- David Reich
Related topics
Seminal works
- pritchard-rosenberg-1999
- devlin-roeder-1999
- price-2006
Frequently asked questions
- Pourquoi la stratification de population entraîne-t-elle de fausses associations ?
- Lorsque les cas et les témoins diffèrent par leur ascendance, les variants dont la fréquence diffère simplement entre les groupes ancestraux peuvent sembler associés à la maladie chaque fois que le risque de maladie diffère également selon l'ascendance ; ainsi, l'association reflète un facteur de confusion lié à l'ascendance plutôt qu'un effet causal du variant.
- Comment les études modernes corrigent-elles la structure de population ?
- Les approches courantes estiment l'ascendance à partir de données à l'échelle du génome et l'ajustent, par exemple en incluant les composantes principales de l'ascendance comme covariables, en appliquant le contrôle génomique pour rééchelonner les statistiques de test, ou en utilisant des modèles mixtes qui tiennent compte de la parenté et de la structure.
Methods for this concept
Related concepts
- Stratification de la population et ascendance dans les GWAS
- Stratification de la population et diversité génétique humaine
- Méthodes d'inférence d'ascendance et d'admixture
- Cartographie des QTL et des Caractères Complexes
- Appariement et stratification des études
- Génétique des populations et susceptibilité aux maladies chroniques