ScholarGate
Assistant

Annotation fonctionnelle des variants génomiques

Le séquençage d'un génome révèle des millions de variants, mais la plupart sont de conséquence inconnue. L'annotation fonctionnelle est le processus qui consiste à attribuer une signification biologique à chaque variant — où il se situe, quel gène ou élément régulateur il affecte, et quelle est sa probabilité d'altérer la fonction — afin que les quelques variants importants puissent être distingués de ceux qui ne le sont pas.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

L'annotation fonctionnelle des variants génomiques est l'attribution d'un contexte biologique et d'une conséquence fonctionnelle prédite aux variants de séquence, incluant leur localisation génomique, les gènes ou éléments régulateurs affectés, l'effet moléculaire (tel que faux-sens, non-sens, altérant l'épissage, ou régulateur), et un impact prédit sur la fonction.

Scope

Ce sujet couvre l'annotation des variants mononucléotidiques, des insertions, des délétions et des changements structurels : la localisation des variants par rapport aux gènes et aux régions régulatrices, la classification de leur conséquence moléculaire, et la prédiction de leur délétérion pour les sites codants et non codants. Il traite l'annotation comme un sujet méthodologique et de référence et ne fournit pas d'interprétation de variants pour des cas cliniques individuels.

Core questions

  • Où se situe un variant par rapport aux gènes, aux exons, aux sites d'épissage et aux éléments régulateurs ?
  • Quelle est sa conséquence moléculaire — modifie-t-il une protéine, perturbe-t-il l'épissage ou affecte-t-il la régulation ?
  • Quelle est la probabilité que le variant soit délétère pour la fonction ?
  • Comment les variants non codants, qui ne présentent pas de lecture simple modifiant les protéines, peuvent-ils être interprétés ?

Key concepts

  • Localisation du variant et classification de la conséquence
  • Variants faux-sens, non-sens, décalage de cadre et d'épissage
  • Prédiction de la délétérion pour les variants codants
  • Annotation des variants non codants et régulateurs
  • Sources d'annotation de référence (modèles de gènes, conservation, cartes d'éléments fonctionnels)
  • Loci de caractères quantitatifs d'expression (eQTLs)

Mechanisms

Les pipelines d'annotation cartographient d'abord chaque variant sur un génome de référence et un ensemble de modèles de gènes pour déterminer sa position et sa conséquence de base — qu'il se situe dans un exon codant, un site d'épissage, une région non traduite, ou une région intergénique — en utilisant des outils tels qu'ANNOVAR et SnpEff. Pour les variants codants qui modifient un acide aminé, des algorithmes de prédiction tels que SIFT estiment si la substitution est tolérée ou délétère, en s'appuyant sur la conservation des séquences entre les espèces. Les variants non codants sont plus difficiles à interpréter car ils ne modifient pas une protéine ; ici, l'annotation repose sur des cartes d'éléments fonctionnels tels que ceux d'ENCODE et sur les liens entre les variants génétiques et l'expression génique (eQTLs) catalogués par des projets tels que GTEx. Le résultat est une description stratifiée de chaque variant qui soutient la priorisation en aval.

Clinical relevance

L'annotation des variants est une étape fondamentale dans la recherche génomique et dans les pipelines analytiques utilisés pour interpréter les données de séquençage. Elle décrit comment les variants candidats sont caractérisés et priorisés ; les prédictions qu'elle génère sont des hypothèses computationnelles et ne constituent pas, à elles seules, une détermination de pathogénicité ou une base pour des décisions diagnostiques ou thérapeutiques individuelles.

History

Alors que le séquençage à haut débit rendait les données d'exome entier et de génome entier courantes à la fin des années 2000, le goulot d'étranglement est passé de la génération de variants à leur interprétation. Des prédicteurs basés sur la conservation tels que SIFT (2009) ont abordé les variants codants, tandis que des moteurs d'annotation généraux tels qu'ANNOVAR (2010) et SnpEff (2012) ont systématisé l'attribution de conséquences à travers les types de variants. De grands catalogues d'éléments fonctionnels tels qu'ENCODE (2012) et des ressources d'expression telles que GTEx (2015) ont ensuite étendu l'interprétation au génome non codant, qui constitue la grande majorité de la variation.

Debates

Comment les variants non codants doivent-ils être interprétés ?
Les variants codants ont une lecture moléculaire relativement interprétable, mais la plupart des variations sont non codantes et n'ont pas de conséquence protéique directe ; leur interprétation dépend des cartes d'éléments fonctionnels et des preuves d'eQTL dont l'exhaustivité et la spécificité tissulaire restent limitantes.

Key figures

  • Kai Wang
  • Pauline Ng
  • Steven Henikoff
  • Pablo Cingolani

Related topics

Seminal works

  • kumar-2009
  • wang-2010
  • cingolani-2012
  • encode-2012

Frequently asked questions

Que signifie annoter un variant ?
Cela signifie attribuer un contexte biologique au variant : où il se situe par rapport aux gènes et aux éléments régulateurs, quelle conséquence moléculaire il a, et quelle est sa probabilité d'affecter la fonction — afin que les variants importants puissent être distingués des variants neutres.
Pourquoi les variants non codants sont-ils plus difficiles à annoter que les variants codants ?
Les variants codants peuvent être lus par rapport au code génétique pour prédire un changement de protéine, mais les variants non codants n'ont pas une telle lecture directe ; leur interprétation repose sur des cartes d'éléments régulateurs et sur des liens entre les variants et l'expression génique, qui sont encore incomplets.

Methods for this concept

Related concepts