ScholarGate
Assistant

Normes et annotation du génome de référence

Un génome de référence est une séquence consensus, organisée et représentative pour une espèce, qui sert de système de coordonnées partagé pour l'alignement et l'interprétation des nouvelles données de séquençage. Sa maintenance sous forme de versions successives (builds) et l'ajout d'une annotation biologique sont essentiels pour assurer la comparabilité des résultats génomiques entre les études, les laboratoires et au fil du temps.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

Un génome de référence est une séquence nucléotidique consensus, organisée, choisie pour représenter le génome d'une espèce, maintenue sous forme d'assemblages versionnés (builds) et annotée avec les localisations des gènes et d'autres éléments fonctionnels, qui fournit un cadre de coordonnées stable pour l'alignement et l'interprétation des données génomiques.

Scope

Cet article aborde la nature d'un assemblage de référence, son versionnement en builds successifs (tels que l'assemblage humain GRCh38 et l'assemblage télomère-à-télomère), le rôle de l'annotation dans l'identification des gènes et des caractéristiques fonctionnelles, ainsi que l'évolution vers des références plus complètes et représentatives. Il s'agit d'un sujet de référence et d'infrastructure, et non d'une directive clinique.

Core questions

  • Qu'est-ce qu'un génome de référence et pourquoi le domaine se standardise-t-il sur un seul ?
  • Comment et pourquoi les assemblages de référence sont-ils versionnés en builds successifs ?
  • Qu'apporte l'annotation génomique à une séquence de référence ?

Key concepts

  • Assemblage de référence (séquence consensus)
  • Build du génome et versionnement (par exemple, GRCh38)
  • Annotation du génome
  • Système de coordonnées pour l'alignement
  • Assemblage télomère-à-télomère (sans lacunes)
  • Lacunes d'assemblage et finition

Mechanisms

Un génome de référence est assemblé à partir de données de séquençage de haute qualité pour former un consensus qui représente l'espèce plutôt qu'un individu unique, puis publié sous forme de build versionné afin que les coordonnées génomiques restent stables et citables. L'annotation superpose à la séquence les positions des gènes, des transcrits et des éléments régulateurs et répétitifs, transformant les coordonnées brutes en cartes biologiquement interprétables. Les builds successifs intègrent des corrections, comblent les lacunes et améliorent la représentation ; la référence humaine a progressé du brouillon de 2001 et de la séquence euchromatique finie de 2004 au build GRCh38 et finalement à un assemblage télomère-à-télomère complet qui a résolu les régions auparavant inaccessibles.

Clinical relevance

Étant donné que l'appel et l'interprétation des variants sont exprimés en coordonnées de référence, le choix et la version du génome de référence affectent directement la manière dont les découvertes génomiques sont rapportées et comparées. Cet article décrit l'infrastructure de référence comme un matériel éducatif et ne constitue pas une base pour des décisions cliniques ou diagnostiques individuelles.

Evidence & guidelines

La référence est documentée par des rapports primaires de consortiums et des évaluations d'assemblage plutôt que par des directives cliniques : le brouillon initial (2001) et la séquence euchromatique finie (2004), l'évaluation du build GRCh38 (Schneider et al., 2017), et le génome humain complet télomère-à-télomère (Nurk et al., 2022) définissent la norme actuelle et sa trajectoire.

History

Le génome de référence humain a débuté avec le brouillon de séquence de 2001 et la séquence euchromatique finie de 2004, puis a été maintenu et amélioré par le Genome Reference Consortium à travers des builds successifs culminant avec GRCh38. Les lacunes persistantes dans les régions répétitives et centromériques ont finalement été comblées par le consortium télomère-à-télomère, qui a produit le premier génome humain complet et sans lacunes en 2022 et a redéfini ce qu'une norme de référence peut être.

Key figures

  • Deanna Church
  • Valerie Schneider
  • Adam Phillippy
  • Karen Miga

Related topics

Seminal works

  • ihgsc-2004
  • schneider-2017
  • nurk-2022-ref

Frequently asked questions

Pourquoi un génome de référence a-t-il différentes versions ou builds ?
À mesure que le séquençage et l'assemblage s'améliorent, la référence est révisée pour corriger les erreurs, combler les lacunes et mieux représenter l'espèce ; chaque nouvelle version reçoit un numéro de build afin que les coordonnées génomiques restent stables et que les résultats demeurent comparables.
Qu'est-ce que l'annotation du génome ?
L'annotation est le processus qui consiste à marquer l'emplacement des gènes, des transcrits, des éléments régulateurs et d'autres caractéristiques sur la séquence de référence, transformant une chaîne de nucléotides en une carte biologiquement interprétable.

Methods for this concept

Related concepts