Stratification de la population et diversité génétique humaine
La diversité génétique humaine est structurée : les fréquences alléliques varient de manière organisée selon la géographie et l'ascendance, de sorte que les populations sont différenciées plutôt que de constituer un pool unique et indivis. La stratification de la population fait référence à cette structure et au biais qu'elle peut introduire dans les études génétiques lorsque les cas et les témoins diffèrent systématiquement en termes d'ascendance.
Definition
La stratification de la population est la présence de différences systématiques dans les fréquences alléliques entre les sous-populations au sein d'un échantillon, résultant d'ascendances distinctes ; la diversité génétique fait ici référence à la manière dont cette variation est répartie au sein et entre les populations humaines.
Scope
Cette entrée aborde les mesures de la différenciation génétique entre les populations, le schéma général de la diversité humaine mondiale, et la stratification en tant que facteur de confusion dans les études d'association, ainsi que les méthodes utilisées pour la détecter et la corriger. Il s'agit d'un sujet méthodologique et descriptif qui évite toute interprétation clinique ou sociale des catégories de population.
Core questions
- Comment la différenciation génétique entre les populations est-elle quantifiée ?
- Comment la variation génétique humaine est-elle répartie au sein des populations par rapport à entre elles ?
- Comment la stratification de la population biaise-t-elle les études d'association génétique ?
- Comment la stratification est-elle détectée et corrigée statistiquement ?
Key concepts
- Statistiques F et FST
- Diversité intra-population vs inter-populations
- Isolement par la distance
- Composantes principales de l'ascendance
- Facteur de confusion dans les études d'association
- Panels de populations de référence
Key theories
- Statistiques F et la partition de la diversité
- Les statistiques F hiérarchiques de Wright, formalisées pour l'estimation par Nei et par Weir et Cockerham, partitionnent la variance génétique en composantes intra- et inter-populations ; le FST résume la proportion de la diversité totale attribuable aux différences entre les populations et constitue la mesure standard de la différenciation.
Mechanisms
La différenciation s'accumule à mesure que la dérive génétique, la migration limitée et la sélection locale entraînent une divergence des fréquences alléliques entre les populations ; la part de la diversité totale attribuable aux différences entre les populations est quantifiée par le FST. Chez l'homme, la majeure partie de la variation génétique se situe au sein des populations, avec une composante plus petite mais structurée entre elles qui suit la géographie. Dans les études d'association, si l'ascendance diffère entre les cas et les témoins et qu'elle est également corrélée à la fréquence allélique, des associations fallacieuses peuvent apparaître ; les méthodes qui résument l'ascendance — notamment l'analyse en composantes principales des génotypes à l'échelle du génome — sont utilisées pour détecter et ajuster cette stratification.
Clinical relevance
La prise en compte de la structure de la population est essentielle à la validité des études d'association génétique qui éclairent les connaissances médicales, car une stratification non corrigée peut générer de fausses associations. La conscience de la diversité influe également sur la transférabilité des découvertes génomiques entre les populations. Cette entrée décrit la structure de la population comme une considération méthodologique et ne constitue pas une base pour des décisions individuelles de diagnostic ou de traitement.
Evidence & guidelines
L'estimation de la différenciation repose sur l'analyse de la diversité génique de Nei et les statistiques F de Weir-Cockerham, tandis que les études à l'échelle du génome de la variation humaine mondiale et les grands panels de référence décrivent la structure empirique de la diversité humaine. La correction par analyse en composantes principales est une méthode standard pour gérer la stratification dans les études d'association.
History
Wright a introduit les statistiques F pour décrire les populations structurées, et Nei, puis Weir et Cockerham, ont fourni des estimateurs pratiques. Les débats sur la manière dont la variation humaine est répartie remontent aux travaux de Lewontin dans les années 1970 ; le génotypage à l'échelle du génome a ensuite cartographié en détail les relations humaines mondiales, et les méthodes basées sur les composantes principales sont devenues la norme pour contrôler la stratification une fois que de grands ensembles de données de génotypes sont apparus.
Key figures
- Sewall Wright
- Masatoshi Nei
- Bruce Weir
- David Reich
- Alkes Price
Related topics
Seminal works
- nei-1973
- weir-cockerham-1984
- price-2006
Frequently asked questions
- Que mesure réellement le FST ?
- Le FST est la proportion de la diversité génétique totale qui est due aux différences de fréquences alléliques entre les populations plutôt qu'à la variation au sein de celles-ci ; des valeurs proches de zéro indiquent une faible différenciation, et des valeurs plus élevées en indiquent une plus grande.
- Pourquoi la stratification de la population est-elle un problème dans les études d'association ?
- Si la proportion d'ascendances différentes diffère entre les cas et les témoins, toute variante dont la fréquence varie également avec l'ascendance peut apparaître associée au trait même lorsqu'elle n'a aucun rôle causal ; la stratification doit donc être détectée et corrigée.