ScholarGate
Assistent

Referenzgenom-Standards und Annotation

Ein Referenzgenom ist eine kuratierte, repräsentative Konsensussequenz für eine Spezies, die als gemeinsames Koordinatensystem dient, an dem neue Sequenzdaten ausgerichtet und interpretiert werden. Die Pflege als versionierte Builds und die Überlagerung mit biologischen Annotationen ermöglichen die Vergleichbarkeit genomischer Ergebnisse über Studien, Labore und Zeit hinweg.

Thema finden mit PaperMindDemnächstFind papers & topics
Tools & resources
Folien herunterladen
Learn & explore
VideoDemnächst

Definition

Ein Referenzgenom ist eine kuratierte Konsensus-Nukleotidsequenz, die zur Repräsentation des Genoms einer Spezies ausgewählt wird, als versionierte Assemblies (Builds) gepflegt und mit den Positionen von Genen und anderen funktionellen Elementen annotiert wird, und die einen stabilen Koordinatenrahmen für die Ausrichtung und Interpretation genomischer Daten bietet.

Scope

Der Eintrag behandelt, was ein Referenz-Assembly ist, wie es in aufeinanderfolgende Builds (wie das menschliche GRCh38-Assembly und das Telomer-zu-Telomer-Assembly) versioniert wird, die Rolle der Annotation bei der Kennzeichnung von Genen und funktionellen Merkmalen sowie die Entwicklung hin zu vollständigeren und repräsentativeren Referenzen. Es handelt sich um ein Referenz- und Infrastrukturthema, nicht um eine klinische Leitlinie.

Core questions

  • Was ist ein Referenzgenom und warum standardisiert das Fachgebiet auf eines?
  • Wie und warum werden Referenz-Assemblies in aufeinanderfolgende Builds versioniert?
  • Was fügt die Genomannotation einer Referenzsequenz hinzu?

Key concepts

  • Referenz-Assembly (Konsensussequenz)
  • Genom-Build und Versionierung (z. B. GRCh38)
  • Genomannotation
  • Koordinatensystem für die Ausrichtung
  • Telomer-zu-Telomer (lückenloses) Assembly
  • Assembly-Lücken und -Fertigstellung

Mechanisms

Ein Referenzgenom wird aus hochwertigen Sequenzdaten zu einem Konsens assembliert, der die Spezies und nicht ein einzelnes Individuum repräsentiert, und dann als versionierter Build veröffentlicht, damit genomische Koordinaten stabil und zitierfähig bleiben. Die Annotation überlagert die Sequenz mit den Positionen von Genen, Transkripten sowie regulatorischen und repetitiven Elementen und verwandelt Rohkoordinaten in biologisch interpretierbare Karten. Aufeinanderfolgende Builds integrieren Korrekturen, füllen Lücken und verbessern die Repräsentation; die menschliche Referenz entwickelte sich vom Entwurf von 2001 und der fertigen euchromatischen Sequenz von 2004 zum GRCh38-Build und schließlich zu einem vollständigen Telomer-zu-Telomer-Assembly, das zuvor unzugängliche Regionen auflöste.

Clinical relevance

Da die Variantenbestimmung und -interpretation in Referenzkoordinaten ausgedrückt werden, beeinflusst die Wahl und Version des Referenzgenoms direkt, wie genomische Befunde berichtet und verglichen werden. Dieser Eintrag beschreibt die Referenzinfrastruktur als Bildungsmaterial und ist keine Grundlage für individuelle klinische oder diagnostische Entscheidungen.

Evidence & guidelines

Die Referenz wird durch primäre Konsortialberichte und Assembly-Evaluierungen dokumentiert und nicht durch klinische Leitlinien: Der ursprüngliche Entwurf (2001) und die fertige euchromatische Sequenz (2004), die Evaluierung des GRCh38-Builds (Schneider et al., 2017) und das vollständige Telomer-zu-Telomer-Humangenom (Nurk et al., 2022) definieren den aktuellen Standard und seine Entwicklung.

History

Das menschliche Referenzgenom begann mit der Entwurfssequenz von 2001 und der fertigen euchromatischen Sequenz von 2004, wurde dann vom Genome Reference Consortium über aufeinanderfolgende Builds, die in GRCh38 gipfelten, gepflegt und verbessert. Hartnäckige Lücken in repetitiven und zentromerischen Regionen wurden schließlich vom Telomer-zu-Telomer-Konsortium geschlossen, das 2022 das erste vollständige, lückenlose Humangenom erstellte und neu definierte, was ein Referenzstandard sein kann.

Key figures

  • Deanna Church
  • Valerie Schneider
  • Adam Phillippy
  • Karen Miga

Related topics

Seminal works

  • ihgsc-2004
  • schneider-2017
  • nurk-2022-ref

Frequently asked questions

Warum hat ein Referenzgenom verschiedene Versionen oder Builds?
Mit der Verbesserung der Sequenzierung und des Assemblies wird die Referenz überarbeitet, um Fehler zu korrigieren, Lücken zu schließen und die Spezies besser zu repräsentieren; jede Veröffentlichung erhält eine Build-Version, damit genomische Koordinaten stabil bleiben und Ergebnisse vergleichbar sind.
Was ist Genomannotation?
Annotation ist der Prozess der Kennzeichnung, wo Gene, Transkripte, regulatorische Elemente und andere Merkmale auf der Referenzsequenz liegen, wodurch eine Nukleotidkette in eine biologisch interpretierbare Karte umgewandelt wird.

Methods for this concept

Related concepts