Déséquilibre de liaison et sélection de SNP marqueurs
Le déséquilibre de liaison (DL) est la co-occurrence non aléatoire d'allèles à différentes positions du génome : les variants proches tendent à être hérités ensemble sous forme de blocs d'haplotypes. Cette corrélation rend les études d'association pangénomiques (GWAS) abordables – une puce de génotypage n'a besoin de génotyper qu'un sous-ensemble de SNP « marqueurs » (tag SNPs) soigneusement choisis, car chaque marqueur représente statistiquement les variants non typés avec lesquels il est en fort DL.
Definition
Le déséquilibre de liaison est l'association statistique entre des allèles à deux loci ou plus — leur co-occurrence sur les haplotypes plus ou moins souvent que prévu s'ils étaient indépendants — et le marquage par SNP (SNP tagging) est l'utilisation d'un sous-ensemble de variants qui, par le biais du DL, capturent la variation des sites voisins non typés.
Scope
Ce sujet explique ce qu'est le DL, comment il est mesuré (D' et r-carré), pourquoi il forme des blocs façonnés par la recombinaison et l'histoire des populations, comment les SNP marqueurs sont sélectionnés pour capturer efficacement la variation commune, et comment le DL permet à la fois la cartographie d'association et complique la localisation des variants causaux. Il s'agit d'une référence méthodologique, et non d'une directive clinique.
Core questions
- Que signifie le fait que deux variants soient en déséquilibre de liaison ?
- Comment D' et le r-carré sont-ils utilisés pour quantifier le DL, et en quoi diffèrent-ils ?
- Pourquoi le génome se divise-t-il en blocs d'haplotypes, et qu'est-ce qui détermine leurs limites ?
- Comment les SNP marqueurs sont-ils choisis pour qu'une puce capture la majeure partie de la variation commune ?
- Pourquoi le DL rend-il difficile l'identification du variant causal réel au sein d'une région associée ?
Key concepts
- Haplotype et bloc d'haplotypes
- D' (coefficient de déséquilibre normalisé)
- r-carré (corrélation entre marqueurs)
- Points chauds de recombinaison
- Sélection de SNP marqueurs
- Panels d'haplotypes de référence (HapMap, 1000 Génomes)
- Cartographie fine (fine-mapping) et ambiguïté des variants causaux
Mechanisms
Les allèles situés à des loci proches sont hérités ensemble jusqu'à ce que la recombinaison les sépare. Ainsi, au fil des générations, le DL diminue avec la distance génétique et est rompu aux points chauds de recombinaison, produisant des blocs de forte corrélation interne. Deux mesures courantes le quantifient : D' indique si une recombinaison s'est produite entre deux sites, tandis que le r-carré mesure la capacité d'un variant à en prédire un autre et influence directement la puissance perdue lorsqu'un SNP marqueur remplace un variant causal non typé. Parce que les variants au sein d'un bloc sont fortement corrélés, une puce peut génotyper un ensemble choisi de SNP marqueurs et récupérer la majeure partie de la variation commune, et les variants manquants peuvent être imputés statistiquement à l'aide de panels de référence séquencés tels que HapMap et le Projet 1000 Génomes. La même corrélation qui permet le marquage signifie également qu'un signal d'association est partagé entre de nombreux variants d'un bloc, ainsi, l'identification du véritable variant causal nécessite une cartographie fine (fine-mapping) supplémentaire plutôt que de simplement retenir le marqueur le plus significatif.
Clinical relevance
La structure du DL sous-tend la manière dont les preuves génétiques pangénomiques sont générées et dont les régions d'association sont interprétées dans la recherche sur les maladies. Ce sujet est descriptif de la méthode et de la génétique des populations ; il ne constitue pas une base pour les tests génétiques individuels ou l'interprétation clinique.
Evidence & guidelines
La connaissance de la structure du DL humain repose sur de vastes ressources de référence plutôt que sur des directives cliniques. Le Projet International HapMap (2007) a cartographié le DL et les SNP marqueurs à l'échelle du génome, le Projet 1000 Génomes (2015) a étendu les haplotypes de référence à travers diverses populations, et des revues telles que Slatkin (2008) et Bush et Moore (2012) expliquent comment les mesures de DL et le marquage sont appliqués dans la cartographie d'association.
History
Le concept d'association allélique est antérieur à la génomique, mais son importance pratique a crû avec la découverte au début des années 2000 que le génome humain possède une structure d'haplotypes en blocs façonnée par des points chauds de recombinaison. Le Projet HapMap a ensuite catalogué le DL à l'échelle du génome et a rendu la sélection de SNP marqueurs (tag-SNP) réalisable, ce qui a directement permis les premières puces GWAS abordables. Le Projet 1000 Génomes a ensuite élargi les panels de référence à de nombreuses populations, améliorant l'imputation et révélant comment les schémas de DL diffèrent selon l'ascendance.
Debates
- Les schémas de DL sont-ils transférables entre les populations ?
- La structure des haplotypes et le DL varient avec l'histoire des populations, ainsi, les SNP marqueurs et les panels d'imputation optimisés pour une ascendance capturent imparfaitement la variation dans une autre, contribuant à la performance réduite des puces et des scores dérivés de populations européennes dans d'autres populations.
Key figures
- Montgomery Slatkin
- Mark Daly
- David Altshuler
- Goncalo Abecasis
- William Bush
Related topics
Seminal works
- slatkin-2008
- hapmap-2007
- 1000g-2015
Frequently asked questions
- Comment le déséquilibre de liaison permet-il à une GWAS de ne typer que certains variants ?
- Parce que les variants d'un bloc d'haplotypes sont fortement corrélés, un SNP marqueur génotypé véhicule des informations sur ses voisins non typés, ainsi, une puce de marqueurs bien choisis capture la majeure partie de la variation commune dans le génome.
- Quelle est la différence entre D' et le r-carré ?
- D' mesure si la recombinaison a historiquement séparé deux allèles, tandis que le r-carré mesure la capacité d'un variant à en prédire statistiquement un autre ; le r-carré est la quantité la plus pertinente pour la puissance des tests d'association basés sur les SNP marqueurs.
Methods for this concept
Related concepts
- Déséquilibre de liaison
- Blocs d'haplotypes et organisation structurelle au niveau de la population
- Études d'association pangénomique et découverte de variants
- Cartographie des QTL et des Caractères Complexes
- Liaison génétique, recombinaison et cartographie génique
- Stratification de la population et ascendance dans les GWAS