ScholarGate
Assistent

Gen-Ontologie und biologische Datenbanken

Die Interpretation von Genomen in großem Maßstab erfordert eine gemeinsame, maschinenlesbare Sprache für die Funktionen von Genen. Die Gen-Ontologie stellt diese Sprache bereit – ein strukturiertes Vokabular molekularer Funktionen, biologischer Prozesse und zellulärer Lokalisationen –, während kuratierte Datenbanken wie KEGG und Reactome das Pathway- und Reaktionswissen liefern, anhand dessen genomische Ergebnisse gelesen werden.

Thema finden mit PaperMindDemnächstFind papers & topics
Tools & resources
Folien herunterladen
Learn & explore
VideoDemnächst

Definition

Die Gen-Ontologie ist ein strukturiertes, hierarchisches kontrolliertes Vokabular, das Genprodukt-Attribute in drei Domänen beschreibt – molekulare Funktion, biologischer Prozess und zelluläre Komponente – und biologische Datenbanken sind kuratierte Repositorien (wie KEGG, Reactome und Protein-Assoziationsressourcen), die funktionelles, Pathway- und Interaktionswissen speichern, das zur Annotation und Interpretation genomischer Daten verwendet wird.

Scope

Dieses Thema behandelt kontrollierte biologische Vokabulare und die wichtigsten Wissensdatenbanken, die kuratierte funktionelle und Pathway-Informationen speichern: die Struktur und Verwendung der Gen-Ontologie, wie Gene mit Evidenzcodes zu Ontologie-Begriffen annotiert werden und die Rolle von Pathway- und Interaktionsdatenbanken. Es handelt sich um ein Referenz- und Bildungsthema und bietet keine klinische Anleitung.

Core questions

  • Wie kann die Funktion eines Genprodukts konsistent und berechenbar beschrieben werden?
  • Was erfassen die drei Domänen der Gen-Ontologie und wie sind sie organisiert?
  • Wie wird die Stärke einer Annotation angegeben, zum Beispiel durch Evidenzcodes?
  • Welche Datenbanken enthalten Pathway-, Reaktions- und Interaktionswissen und wie unterscheiden sie sich?

Key concepts

  • Kontrolliertes Vokabular und Ontologie
  • Molekulare Funktion, biologischer Prozess, zelluläre Komponente
  • Gerichteter azyklischer Graph (DAG)-Struktur der GO
  • Annotation und Evidenzcodes
  • Pathway-Datenbanken (KEGG, Reactome)
  • Proteininteraktions- und Assoziationsdatenbanken (STRING)

Mechanisms

Die Gen-Ontologie organisiert Begriffe als gerichteten azyklischen Graphen, in dem spezifische Begriffe von allgemeineren Begriffen in drei unabhängigen Domänen erben: molekulare Funktion (die biochemische Aktivität eines Genprodukts), biologischer Prozess (das größere Programm, zu dem es beiträgt) und zelluläre Komponente (wo es wirkt). Gene werden durch Annotationen mit Begriffen verknüpft, wobei jede Annotation mit einem Evidenzcode versehen ist, der festhält, ob die Unterstützung experimentell, computergestützt oder durch Kuratoren abgeleitet ist. Komplementäre Datenbanken erfassen Wissen, das die Ontologie nicht abdeckt: KEGG und Reactome kodieren Pathways als Netzwerke von Reaktionen und Beziehungen, und Protein-Assoziationsressourcen wie STRING aggregieren Evidenz für funktionelle Verbindungen zwischen Proteinen. Zusammen stellen diese Ressourcen die kuratierten Gensätze und Referenzannotationen bereit, die nachgeschaltete Anreicherungs- und Netzwerkmethoden nutzen.

Clinical relevance

Ontologien und kuratierte Datenbanken sind die gemeinsame Infrastruktur, die die genomische Interpretation über Studien hinweg reproduzierbar macht, indem sie das Vokabular und die Gensätze für Annotation, Anreicherung und Netzwerkanalyse bereitstellen. Sie beschreiben, wie biologisches Wissen für die Berechnung organisiert ist, und dienen als Referenzressourcen und nicht als Grundlage für individuelle diagnostische oder Behandlungsentscheidungen.

History

Die Gen-Ontologie wurde im Jahr 2000 von einem Konsortium von Modellorganismus-Datenbanken ins Leben gerufen, um die Beschreibung der Genfunktion über Spezies hinweg zu vereinheitlichen, und wurde zum De-facto-Standardvokabular für die funktionelle Genomik. Im selben Jahr formalisierte KEGG das Pathway-Wissen als berechenbare Karten, und Reactome fügte später eine manuell kuratierte, reaktionsebene Pathway-Wissensdatenbank hinzu. Protein-Assoziationsdatenbanken wie STRING erweiterten die Kuration auf funktionelle und physikalische Interaktionen und vervollständigten so ein Ökosystem von Ressourcen, auf das die meisten Anreicherungs- und Netzwerkanalysen heute angewiesen sind.

Key figures

  • Michael Ashburner
  • Judith Blake
  • Minoru Kanehisa
  • Peter D'Eustachio

Related topics

Seminal works

  • ashburner-2000
  • kanehisa-2000
  • jassal-2020

Frequently asked questions

Was sind die drei Domänen der Gen-Ontologie?
Molekulare Funktion (die biochemische Aktivität eines Genprodukts), biologischer Prozess (das umfassendere Programm, zu dem es beiträgt) und zelluläre Komponente (wo in der Zelle es wirkt). Diese drei Domänen sind unabhängig voneinander organisiert.
Warum tragen Gen-Ontologie-Annotationen Evidenzcodes?
Evidenzcodes dokumentieren, wie eine Annotation gestützt wurde – zum Beispiel experimentelle Evidenz versus computergestützte Inferenz –, damit Benutzer beurteilen können, wie zuverlässig eine gegebene Gen-zu-Begriff-Zuordnung ist.

Methods for this concept

Related concepts