Was bedeutet es, eine Variante zu annotieren?

Es bedeutet, der Variante einen biologischen Kontext zuzuordnen: wo sie sich relativ zu Genen und regulatorischen Elementen befindet, welche molekulare Konsequenz sie hat und wie wahrscheinlich es ist, dass sie die Funktion beeinflusst – damit wichtige Varianten von neutralen unterschieden werden können.

Warum sind nicht-kodierende Varianten schwieriger zu annotieren als kodierende?

Kodierende Varianten können anhand des genetischen Codes gelesen werden, um eine Proteinveränderung vorherzusagen, aber nicht-kodierende Varianten haben keinen so direkten Auslesewert; ihre Interpretation stützt sich auf Karten regulatorischer Elemente und auf Verbindungen zwischen Varianten und Genexpression, die noch unvollständig sind.

Funktionelle Annotation genomischer Varianten

Die Sequenzierung eines Genoms liefert Millionen von Varianten, von denen die meisten jedoch unbekannte Konsequenzen haben. Funktionelle Annotation ist der Prozess, jeder Variante eine biologische Bedeutung zuzuweisen – wo sie sich befindet, welches Gen oder regulatorische Element sie beeinflusst und wie wahrscheinlich es ist, dass sie die Funktion verändert –, damit die wenigen relevanten Varianten von den vielen irrelevanten unterschieden werden können.

Thema finden mit PaperMindDemnächstFind papers & topics

Tools & resources

Folien herunterladen

Learn & explore

VideoDemnächst

Definition

Die funktionelle Annotation genomischer Varianten ist die Zuweisung von biologischem Kontext und vorhergesagter funktioneller Konsequenz zu Sequenzvarianten, einschließlich ihrer genomischen Lokalisation, betroffener Gene oder regulatorischer Elemente, molekularer Effekte (wie Missense, Nonsense, Spleiß-verändernd oder regulatorisch) und einer vorhergesagten Auswirkung auf die Funktion.

Scope

Dieses Thema behandelt die Annotation von Einzelnukleotidvarianten, Insertionen, Deletionen und strukturellen Veränderungen: die Lokalisierung von Varianten relativ zu Genen und regulatorischen Regionen, die Klassifizierung ihrer molekularen Konsequenz und die Vorhersage ihrer Schädlichkeit für kodierende und nicht-kodierende Stellen. Es behandelt die Annotation als methodisches und Referenzthema und bietet keine Varianteninterpretation für individuelle klinische Fälle.

Core questions

Wo befindet sich eine Variante relativ zu Genen, Exons, Spleißstellen und regulatorischen Elementen?
Was ist ihre molekulare Konsequenz – verändert sie ein Protein, stört sie das Spleißen oder beeinflusst sie die Regulation?
Wie wahrscheinlich ist es, dass die Variante die Funktion schädigt?
Wie können nicht-kodierende Varianten, denen ein einfacher proteinverändernder Auslesewert fehlt, interpretiert werden?

Key concepts

Lokalisierung der Variante und Klassifizierung der Konsequenz
Missense-, Nonsense-, Frameshift- und Spleißvarianten
Vorhersage der Schädlichkeit für kodierende Varianten
Annotation von nicht-kodierenden und regulatorischen Varianten
Referenz-Annotationsquellen (Genmodelle, Konservierung, Karten funktioneller Elemente)
Expressions-quantitative Trait Loci (eQTLs)

Mechanisms

Annotations-Pipelines ordnen jede Variante zunächst einem Referenzgenom und einem Satz von Genmodellen zu, um ihre Position und grundlegende Konsequenz zu bestimmen – ob sie in einem kodierenden Exon, einer Spleißstelle, einer untranslatierten Region oder einer intergenischen Region liegt – unter Verwendung von Tools wie ANNOVAR und SnpEff. Für kodierende Varianten, die eine Aminosäure verändern, schätzen Vorhersagealgorithmen wie SIFT, ob die Substitution toleriert oder schädigend ist, basierend auf der Sequenzerhaltung über Spezies hinweg. Nicht-kodierende Varianten sind schwieriger zu interpretieren, da sie kein Protein verändern; hier stützt sich die Annotation auf Karten funktioneller Elemente, wie die von ENCODE, und auf Verbindungen zwischen genetischen Varianten und Genexpression (eQTLs), die von Projekten wie GTEx katalogisiert wurden. Das Ergebnis ist eine geschichtete Beschreibung jeder Variante, die die nachgelagerte Priorisierung unterstützt.

Clinical relevance

Die Variantenannotation ist ein grundlegender Schritt in der Genomforschung und in den Analyse-Pipelines zur Interpretation von Sequenzierungsdaten. Sie beschreibt, wie Kandidatenvarianten charakterisiert und priorisiert werden; die von ihr erzeugten Vorhersagen sind rechnerische Hypothesen und stellen für sich genommen keine Bestimmung der Pathogenität oder eine Grundlage für individuelle diagnostische oder Behandlungsentscheidungen dar.

History

Als die Hochdurchsatzsequenzierung in den späten 2000er Jahren Ganz-Exom- und Ganz-Genom-Daten routinemäßig machte, verlagerte sich der Engpass von der Generierung von Varianten zu deren Interpretation. Konservierungsbasierte Prädiktoren wie SIFT (2009) befassten sich mit kodierenden Varianten, während allgemeine Annotations-Engines wie ANNOVAR (2010) und SnpEff (2012) die Zuweisung von Konsequenzen über verschiedene Variantentypen hinweg systematisierten. Große Kataloge funktioneller Elemente wie ENCODE (2012) und Expressionsressourcen wie GTEx (2015) erweiterten dann die Interpretation auf das nicht-kodierende Genom, das den Großteil der Variation ausmacht.

Debates

Wie sollen nicht-kodierende Varianten interpretiert werden?: Kodierende Varianten haben einen relativ interpretierbaren molekularen Auslesewert, aber die meisten Variationen sind nicht-kodierend und haben keine direkte Proteinkonsequenz; ihre Interpretation hängt von Karten funktioneller Elemente und eQTL-Evidenz ab, deren Vollständigkeit und Gewebespezifität weiterhin limitierend sind.

Key figures

Kai Wang
Pauline Ng
Steven Henikoff
Pablo Cingolani

Seminal works

kumar-2009
wang-2010
cingolani-2012
encode-2012

Frequently asked questions

Was bedeutet es, eine Variante zu annotieren?: Es bedeutet, der Variante einen biologischen Kontext zuzuordnen: wo sie sich relativ zu Genen und regulatorischen Elementen befindet, welche molekulare Konsequenz sie hat und wie wahrscheinlich es ist, dass sie die Funktion beeinflusst – damit wichtige Varianten von neutralen unterschieden werden können.
Warum sind nicht-kodierende Varianten schwieriger zu annotieren als kodierende?: Kodierende Varianten können anhand des genetischen Codes gelesen werden, um eine Proteinveränderung vorherzusagen, aber nicht-kodierende Varianten haben keinen so direkten Auslesewert; ihre Interpretation stützt sich auf Karten regulatorischer Elemente und auf Verbindungen zwischen Varianten und Genexpression, die noch unvollständig sind.