Spectre de fréquence allélique et spectre de fréquence des sites
Le spectre de fréquence allélique (ou des sites) est la distribution des fréquences des variants dans un échantillon : il dénombre combien de sites variables possèdent un allèle présent en une copie, deux copies, et ainsi de suite, jusqu'à la taille de l'échantillon. Étant donné que l'histoire démographique et la sélection naturelle laissent chacune une empreinte distinctive sur cette distribution, le spectre constitue l'un des résumés les plus informatifs des données de génétique des populations.
Definition
Le spectre de fréquence des sites est la distribution, sur l'ensemble des sites variables d'un échantillon, du nombre de copies de l'allèle dérivé (ou mineur) ; de manière équivalente, il tabule combien de sites possèdent chaque fréquence allélique possible dans l'échantillon.
Scope
Cette entrée couvre la définition du spectre de fréquence plié et déplié, son espérance sous des modèles neutres, et son utilisation comme cible pour l'inférence démographique et de sélection. Il s'agit d'un sujet méthodologique et ne fournit pas d'interprétation clinique d'une fréquence de variant spécifique.
Core questions
- Comment le spectre de fréquence est-il défini pour un échantillon de séquences ?
- À quoi ressemble le spectre sous une population neutre de taille constante ?
- Comment la croissance démographique, les goulots d'étranglement et la sélection déforment-ils le spectre ?
- Comment le spectre est-il utilisé pour ajuster des modèles démographiques ?
Key concepts
- Spectre plié vs déplié
- Allèles dérivés et ancestraux
- Excès de variants rares
- D de Tajima
- Inférence démographique
- Effet de la croissance démographique sur la variation rare
Key theories
- Espérance coalescente du spectre de fréquence
- Sous le modèle de coalescence neutre standard, le nombre attendu de sites avec un allèle dérivé présent i fois est proportionnel à 1/i, ce qui donne un excès caractéristique de variants rares ; les déviations par rapport à cette attente, résumées par des statistiques telles que le D de Tajima, sont utilisées pour détecter des changements démographiques ou de la sélection.
Mechanisms
Chaque site de ségrégation contribue son nombre d'allèles échantillonné au spectre. Sous le modèle de coalescence neutre, le spectre attendu est fortement pondéré vers les variants rares, et les événements démographiques le remodèlent de manière prévisible : une croissance démographique récente gonfle le nombre de variants très rares, tandis que les goulots d'étranglement les appauvrissent. La sélection déplace également le spectre localement. Les méthodes d'inférence ajustent des modèles démographiques ou de sélection en faisant correspondre le spectre observé à son espérance, et le séquençage profond de grands échantillons a montré une abondance de variants codants rares, compatible avec une croissance démographique humaine récente et rapide.
Clinical relevance
Le spectre de fréquence sous-tend les seuils de fréquence allélique utilisés lors du filtrage des variants en génomique clinique, car la rareté d'un variant dans les populations de référence fait partie de la manière dont sa signification potentielle est évaluée. Cette entrée explique la distribution des fréquences au niveau de la population et ne constitue pas une base pour des décisions diagnostiques ou thérapeutiques individuelles.
Evidence & guidelines
L'espérance neutre du spectre trouve son origine dans la théorie de la coalescence et dans la statistique de test de Tajima, tandis que des études empiriques d'exomes humains et des cadres d'inférence démographique montrent comment le spectre observé est utilisé pour reconstituer l'histoire des populations et caractériser le fardeau des variants rares.
History
Le spectre de fréquence a émergé de la théorie de la diffusion et de la coalescence comme un résumé compact des données de polymorphisme. Avec le séquençage à l'échelle du génome et de l'exome, il est devenu une cible d'inférence pratique, et les analyses de grands échantillons humains au début des années 2010 ont utilisé le spectre pour démontrer une croissance explosive récente et l'excès de variants rares qui en a résulté.
Key figures
- Fumio Tajima
- Simon Gravel
- Laurent Excoffier
- Carlos Bustamante
Related topics
Seminal works
- tajima-1989
- gravel-2011
- tennessen-2012
Frequently asked questions
- Quelle est la différence entre le spectre plié et le spectre déplié ?
- Le spectre déplié distingue l'allèle dérivé de l'allèle ancestral, ce qui nécessite de connaître quel allèle est ancestral ; le spectre plié, utilisé lorsque l'état ancestral est inconnu, dénombre plutôt le nombre de copies de l'allèle mineur.
- Pourquoi le spectre de fréquence montre-t-il autant de variants rares ?
- Même sous un modèle neutre simple, les variants rares sont censés prédominer, et la croissance démographique humaine récente a encore amplifié ce phénomène, produisant un large excès de variants très rares dans les grands échantillons.