Ontologi Gen dan Basis Data Biologis
Menginterpretasikan genom dalam skala besar membutuhkan bahasa yang sama dan dapat dibaca mesin untuk menjelaskan fungsi gen. Ontologi Gen menyediakan bahasa tersebut — sebuah kosakata terstruktur tentang fungsi molekuler, proses biologis, dan lokasi seluler — sementara basis data terkurasi seperti KEGG dan Reactome menyediakan pengetahuan jalur dan reaksi yang menjadi dasar pembacaan hasil genomik.
Definition
Ontologi Gen adalah kosakata terkontrol yang terstruktur dan hierarkis yang menggambarkan atribut produk gen di tiga domain — fungsi molekuler, proses biologis, dan komponen seluler — dan basis data biologis adalah repositori terkurasi (seperti KEGG, Reactome, dan sumber daya asosiasi protein) yang menyimpan pengetahuan fungsional, jalur, dan interaksi yang digunakan untuk menganotasi dan menginterpretasikan data genomik.
Scope
Topik ini mencakup kosakata biologis terkontrol dan basis pengetahuan utama yang menyimpan informasi fungsional dan jalur yang terkurasi: struktur dan penggunaan Ontologi Gen, bagaimana gen dianotasi ke istilah ontologi dengan kode bukti, dan peran basis data jalur dan interaksi. Ini adalah subjek referensi dan edukasi dan tidak memberikan panduan klinis.
Core questions
- Bagaimana fungsi produk gen dapat dijelaskan secara konsisten dan dapat dihitung?
- Apa yang dicakup oleh tiga domain Ontologi Gen, dan bagaimana mereka diatur?
- Bagaimana kekuatan anotasi ditunjukkan, misalnya melalui kode bukti?
- Basis data mana yang menyimpan pengetahuan jalur, reaksi, dan interaksi, dan bagaimana perbedaannya?
Key concepts
- Kosakata terkontrol dan ontologi
- Fungsi molekuler, proses biologis, komponen seluler
- Struktur grafik asiklik terarah (DAG) dari GO
- Anotasi dan kode bukti
- Basis data jalur (KEGG, Reactome)
- Basis data interaksi dan asosiasi protein (STRING)
Mechanisms
Ontologi Gen mengatur istilah-istilah sebagai grafik asiklik terarah di mana istilah-istilah spesifik mewarisi dari istilah yang lebih umum di tiga domain independen: fungsi molekuler (aktivitas biokimia produk gen), proses biologis (program yang lebih besar yang menjadi kontribusinya), dan komponen seluler (tempat ia beraksi). Gen dihubungkan ke istilah melalui anotasi, masing-masing ditandai dengan kode bukti yang mencatat apakah dukungannya bersifat eksperimental, komputasi, atau disimpulkan oleh kurator. Basis data pelengkap menangkap pengetahuan yang tidak tercakup oleh ontologi: KEGG dan Reactome mengkodekan jalur sebagai jaringan reaksi dan hubungan, dan sumber daya asosiasi protein seperti STRING mengumpulkan bukti hubungan fungsional antar protein. Bersama-sama, sumber daya ini menyediakan set gen terkurasi dan anotasi referensi yang digunakan oleh metode pengayaan dan jaringan hilir.
Clinical relevance
Ontologi dan basis data terkurasi adalah infrastruktur bersama yang membuat interpretasi genomik dapat direproduksi di berbagai studi, menyediakan kosakata dan set gen yang digunakan dalam anotasi, pengayaan, dan analisis jaringan. Mereka menjelaskan bagaimana pengetahuan biologis diorganisasikan untuk komputasi dan berfungsi sebagai sumber daya referensi daripada sebagai dasar untuk keputusan diagnostik atau pengobatan individual.
History
Ontologi Gen diluncurkan pada tahun 2000 oleh konsorsium basis data organisme model untuk menyatukan cara fungsi gen dijelaskan di berbagai spesies, dan menjadi kosakata standar de facto untuk genomik fungsional. Pada tahun yang sama, KEGG memformalkan pengetahuan jalur sebagai peta yang dapat dihitung, dan Reactome kemudian menambahkan basis pengetahuan jalur tingkat reaksi yang dikurasi secara manual. Basis data asosiasi protein seperti STRING memperluas kurasi ke interaksi fungsional dan fisik, melengkapi ekosistem sumber daya yang kini menjadi sandaran sebagian besar analisis pengayaan dan jaringan.
Key figures
- Michael Ashburner
- Judith Blake
- Minoru Kanehisa
- Peter D'Eustachio
Related topics
Seminal works
- ashburner-2000
- kanehisa-2000
- jassal-2020
Frequently asked questions
- Apa saja tiga domain dari Ontologi Gen?
- Fungsi molekuler (aktivitas biokimia produk gen), proses biologis (program yang lebih luas yang menjadi kontribusinya), dan komponen seluler (tempat di dalam sel ia beraksi). Ketiga domain ini diatur secara independen.
- Mengapa anotasi Ontologi Gen membawa kode bukti?
- Kode bukti mencatat bagaimana suatu anotasi didukung — misalnya bukti eksperimental versus inferensi komputasi — sehingga pengguna dapat menilai seberapa andal penugasan gen-ke-istilah tertentu.
Methods for this concept
- Pathway Enrichment Analysis
- Bayesian Pathway Enrichment Analysis
- Machine learning-assisted pathway enrichment analysis
- Gene Set Enrichment Analysis
- Network-based gene set enrichment analysis
- Network-based pathway enrichment analysis
- Multi-omics Pathway Enrichment Analysis
- Differential pathway enrichment analysis