Gene Ontology และฐานข้อมูลทางชีวภาพ
การตีความจีโนมในวงกว้างจำเป็นต้องมีภาษากลางที่เครื่องจักรสามารถอ่านได้เพื่ออธิบายหน้าที่ของยีน Gene Ontology เป็นภาษาดังกล่าว ซึ่งเป็นคำศัพท์ที่มีโครงสร้างของหน้าที่ระดับโมเลกุล กระบวนการทางชีวภาพ และตำแหน่งภายในเซลล์ ในขณะที่ฐานข้อมูลที่ได้รับการดูแลจัดการ เช่น KEGG และ Reactome ให้ความรู้เกี่ยวกับวิถีและปฏิกิริยาที่ใช้ในการอ่านผลลัพธ์ทางจีโนม
Definition
Gene Ontology คือคำศัพท์ที่มีโครงสร้างและลำดับชั้นที่ควบคุมได้ ซึ่งอธิบายคุณลักษณะของผลิตภัณฑ์ยีนในสามโดเมน ได้แก่ หน้าที่ระดับโมเลกุล กระบวนการทางชีวภาพ และองค์ประกอบของเซลล์ และฐานข้อมูลทางชีวภาพคือแหล่งเก็บข้อมูลที่ได้รับการดูแลจัดการ (เช่น KEGG, Reactome และแหล่งข้อมูลการเชื่อมโยงโปรตีน) ที่เก็บความรู้ด้านหน้าที่ วิถี และการปฏิสัมพันธ์ที่ใช้ในการระบุและตีความข้อมูลจีโนม
Scope
หัวข้อนี้ครอบคลุมคำศัพท์ทางชีวภาพที่มีการควบคุมและฐานความรู้หลักที่เก็บข้อมูลหน้าที่และวิถีที่ได้รับการดูแลจัดการ: โครงสร้างและการใช้งานของ Gene Ontology วิธีการระบุยีนเข้ากับคำศัพท์ของออนโทโลยีด้วยรหัสหลักฐาน และบทบาทของฐานข้อมูลวิถีและการปฏิสัมพันธ์ หัวข้อนี้เป็นแหล่งอ้างอิงและให้ความรู้ ไม่ได้ให้คำแนะนำทางคลินิก
Core questions
- จะอธิบายหน้าที่ของผลิตภัณฑ์ยีนในลักษณะที่สอดคล้องและสามารถคำนวณได้อย่างไร?
- โดเมนทั้งสามของ Gene Ontology ครอบคลุมอะไรบ้าง และจัดระเบียบอย่างไร?
- ความแข็งแกร่งของการระบุบ่งชี้ได้อย่างไร เช่น ผ่านรหัสหลักฐาน?
- ฐานข้อมูลใดบ้างที่เก็บความรู้เกี่ยวกับวิถี ปฏิกิริยา และการปฏิสัมพันธ์ และแตกต่างกันอย่างไร?
Key concepts
- คำศัพท์ควบคุมและออนโทโลยี
- หน้าที่ระดับโมเลกุล กระบวนการทางชีวภาพ องค์ประกอบของเซลล์
- โครงสร้างกราฟแบบมีทิศทางไม่มีวงวน (DAG) ของ GO
- การระบุและรหัสหลักฐาน
- ฐานข้อมูลวิถี (KEGG, Reactome)
- ฐานข้อมูลการปฏิสัมพันธ์และการเชื่อมโยงโปรตีน (STRING)
Mechanisms
Gene Ontology จัดระเบียบคำศัพท์เป็นกราฟแบบมีทิศทางไม่มีวงวน (directed acyclic graph) ซึ่งคำศัพท์เฉพาะจะสืบทอดมาจากคำศัพท์ที่กว้างกว่าในสามโดเมนอิสระ: หน้าที่ระดับโมเลกุล (กิจกรรมทางชีวเคมีของผลิตภัณฑ์ยีน), กระบวนการทางชีวภาพ (โปรแกรมที่ใหญ่กว่าที่ผลิตภัณฑ์ยีนมีส่วนร่วม) และองค์ประกอบของเซลล์ (ตำแหน่งที่ผลิตภัณฑ์ยีนทำงาน) ยีนจะเชื่อมโยงกับคำศัพท์ด้วยการระบุ ซึ่งแต่ละรายการจะมีรหัสหลักฐานที่บันทึกว่าการสนับสนุนนั้นมาจากการทดลอง การคำนวณ หรือการอนุมานโดยผู้ดูแลจัดการ ฐานข้อมูลเสริมจะรวบรวมความรู้ที่ออนโทโลยีไม่มี: KEGG และ Reactome เข้ารหัสวิถีเป็นเครือข่ายของปฏิกิริยาและความสัมพันธ์ และแหล่งข้อมูลการเชื่อมโยงโปรตีน เช่น STRING รวบรวมหลักฐานการเชื่อมโยงการทำงานระหว่างโปรตีน ทรัพยากรเหล่านี้ร่วมกันให้ชุดยีนที่ได้รับการดูแลจัดการและคำอธิบายอ้างอิงที่วิธีการเสริมสร้างและเครือข่ายปลายน้ำนำไปใช้
Clinical relevance
ออนโทโลยีและฐานข้อมูลที่ได้รับการดูแลจัดการเป็นโครงสร้างพื้นฐานร่วมกันที่ทำให้การตีความจีโนมสามารถทำซ้ำได้ในการศึกษาต่างๆ โดยจัดหาคำศัพท์และชุดยีนที่ใช้ในการระบุ การเสริมสร้าง และการวิเคราะห์เครือข่าย สิ่งเหล่านี้อธิบายว่าความรู้ทางชีวภาพถูกจัดระเบียบสำหรับการคำนวณอย่างไร และทำหน้าที่เป็นแหล่งอ้างอิงมากกว่าเป็นพื้นฐานสำหรับการวินิจฉัยหรือการตัดสินใจในการรักษาเฉพาะบุคคล
History
Gene Ontology เปิดตัวในปี 2000 โดยกลุ่มฐานข้อมูลสิ่งมีชีวิตต้นแบบเพื่อรวมวิธีการอธิบายหน้าที่ของยีนในสิ่งมีชีวิตต่างๆ และกลายเป็นคำศัพท์มาตรฐานโดยพฤตินัยสำหรับการศึกษาจีโนมเชิงหน้าที่ ในปีเดียวกัน KEGG ได้กำหนดความรู้เกี่ยวกับวิถีให้เป็นแผนที่ที่สามารถคำนวณได้ และ Reactome ได้เพิ่มฐานความรู้เกี่ยวกับวิถีระดับปฏิกิริยาที่ได้รับการดูแลจัดการด้วยตนเองในภายหลัง ฐานข้อมูลการเชื่อมโยงโปรตีน เช่น STRING ได้ขยายการดูแลจัดการไปยังการปฏิสัมพันธ์เชิงหน้าที่และทางกายภาพ ทำให้ระบบนิเวศของทรัพยากรที่การวิเคราะห์การเสริมสร้างและเครือข่ายส่วนใหญ่พึ่งพาเสร็จสมบูรณ์
Key figures
- Michael Ashburner
- Judith Blake
- Minoru Kanehisa
- Peter D'Eustachio
Related topics
Seminal works
- ashburner-2000
- kanehisa-2000
- jassal-2020
Frequently asked questions
- โดเมนทั้งสามของ Gene Ontology คืออะไร?
- หน้าที่ระดับโมเลกุล (กิจกรรมทางชีวเคมีของผลิตภัณฑ์ยีน), กระบวนการทางชีวภาพ (โปรแกรมที่กว้างกว่าที่ผลิตภัณฑ์ยีนมีส่วนร่วม) และองค์ประกอบของเซลล์ (ตำแหน่งที่ผลิตภัณฑ์ยีนทำงานภายในเซลล์) โดเมนทั้งสามนี้จัดระเบียบอย่างอิสระ
- เหตุใดการระบุ Gene Ontology จึงมีรหัสหลักฐาน?
- รหัสหลักฐานบันทึกว่าการระบุได้รับการสนับสนุนอย่างไร เช่น หลักฐานจากการทดลองเทียบกับการอนุมานจากการคำนวณ เพื่อให้ผู้ใช้สามารถตัดสินความน่าเชื่อถือของการกำหนดจากยีนไปยังคำศัพท์ที่กำหนดได้
Methods for this concept
- Pathway Enrichment Analysis
- Bayesian Pathway Enrichment Analysis
- Machine learning-assisted pathway enrichment analysis
- Gene Set Enrichment Analysis
- Network-based gene set enrichment analysis
- Network-based pathway enrichment analysis
- Multi-omics Pathway Enrichment Analysis
- Differential pathway enrichment analysis