ScholarGate
Assistant

Ontologie génique et bases de données biologiques

L'interprétation des génomes à grande échelle nécessite un langage commun et lisible par machine pour décrire la fonction des gènes. L'Ontologie Génique (Gene Ontology) fournit ce langage — un vocabulaire structuré des fonctions moléculaires, des processus biologiques et des localisations cellulaires — tandis que des bases de données curatées telles que KEGG et Reactome fournissent les connaissances sur les voies et les réactions à l'aune desquelles les résultats génomiques sont interprétés.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

L'Ontologie Génique est un vocabulaire contrôlé structuré et hiérarchique décrivant les attributs des produits géniques à travers trois domaines — fonction moléculaire, processus biologique et composant cellulaire — et les bases de données biologiques sont des répertoires curatés (tels que KEGG, Reactome et les ressources d'association de protéines) qui stockent des connaissances fonctionnelles, de voies et d'interactions utilisées pour annoter et interpréter les données génomiques.

Scope

Ce sujet couvre les vocabulaires biologiques contrôlés et les principales bases de connaissances qui stockent des informations fonctionnelles et de voies curatées : la structure et l'utilisation de l'Ontologie Génique, la manière dont les gènes sont annotés aux termes de l'ontologie avec des codes de preuve, et le rôle des bases de données de voies et d'interactions. Il s'agit d'un sujet de référence et éducatif qui ne fournit pas de conseils cliniques.

Core questions

  • Comment la fonction d'un produit génique peut-elle être décrite de manière cohérente et calculable ?
  • Que couvrent les trois domaines de l'Ontologie Génique, et comment sont-ils organisés ?
  • Comment la force d'une annotation est-elle indiquée, par exemple par des codes de preuve ?
  • Quelles bases de données contiennent des connaissances sur les voies, les réactions et les interactions, et en quoi diffèrent-elles ?

Key concepts

  • Vocabulaire contrôlé et ontologie
  • Fonction moléculaire, processus biologique, composant cellulaire
  • Structure de graphe acyclique dirigé (DAG) de GO
  • Annotation et codes de preuve
  • Bases de données de voies (KEGG, Reactome)
  • Bases de données d'interaction et d'association de protéines (STRING)

Mechanisms

L'Ontologie Génique organise les termes sous forme de graphe acyclique dirigé dans lequel les termes spécifiques héritent de termes plus généraux à travers trois domaines indépendants : la fonction moléculaire (l'activité biochimique d'un produit génique), le processus biologique (le programme plus large auquel il contribue) et le composant cellulaire (où il agit). Les gènes sont liés aux termes par des annotations, chacune étant étiquetée avec un code de preuve qui indique si le support est expérimental, computationnel ou inféré par un curateur. Des bases de données complémentaires capturent des connaissances que l'ontologie ne couvre pas : KEGG et Reactome encodent les voies sous forme de réseaux de réactions et de relations, et des ressources d'association de protéines telles que STRING agrègent des preuves de liens fonctionnels entre les protéines. Ensemble, ces ressources fournissent les ensembles de gènes curatés et les annotations de référence que les méthodes d'enrichissement et de réseau en aval utilisent.

Clinical relevance

Les ontologies et les bases de données curatées constituent l'infrastructure partagée qui rend l'interprétation génomique reproductible entre les études, fournissant le vocabulaire et les ensembles de gènes utilisés dans l'annotation, l'enrichissement et l'analyse de réseaux. Elles décrivent comment les connaissances biologiques sont organisées pour le calcul et servent de ressources de référence plutôt que de base pour des décisions diagnostiques ou thérapeutiques individuelles.

History

L'Ontologie Génique a été lancée en 2000 par un consortium de bases de données d'organismes modèles afin d'unifier la description de la fonction génique à travers les espèces, et elle est devenue le vocabulaire standard de facto pour la génomique fonctionnelle. La même année, KEGG a formalisé les connaissances sur les voies sous forme de cartes calculables, et Reactome a ensuite ajouté une base de connaissances sur les voies, curatée manuellement et au niveau des réactions. Les bases de données d'association de protéines telles que STRING ont étendu la curation aux interactions fonctionnelles et physiques, complétant ainsi un écosystème de ressources dont dépendent désormais la plupart des analyses d'enrichissement et de réseau.

Key figures

  • Michael Ashburner
  • Judith Blake
  • Minoru Kanehisa
  • Peter D'Eustachio

Related topics

Seminal works

  • ashburner-2000
  • kanehisa-2000
  • jassal-2020

Frequently asked questions

Quels sont les trois domaines de l'Ontologie Génique ?
La fonction moléculaire (l'activité biochimique d'un produit génique), le processus biologique (le programme plus large auquel il contribue) et le composant cellulaire (où il agit dans la cellule). Ces trois domaines sont organisés indépendamment.
Pourquoi les annotations de l'Ontologie Génique comportent-elles des codes de preuve ?
Les codes de preuve enregistrent la manière dont une annotation a été étayée — par exemple, preuve expérimentale versus inférence computationnelle — afin que les utilisateurs puissent juger de la fiabilité d'une attribution gène-terme donnée.

Methods for this concept

Related concepts