الأنطولوجيا الجينية وقواعد البيانات البيولوجية
يتطلب تفسير الجينومات على نطاق واسع لغة مشتركة قابلة للقراءة آليًا لوظائف الجينات. توفر الأنطولوجيا الجينية هذه اللغة — وهي مفردات منظمة للوظائف الجزيئية، والعمليات البيولوجية، والمواقع الخلوية — بينما توفر قواعد البيانات المنسقة مثل KEGG و Reactome المعرفة بالمسارات والتفاعلات التي تُقرأ على أساسها النتائج الجينومية.
Definition
الأنطولوجيا الجينية هي مفردات منظمة وهرمية تصف سمات المنتجات الجينية عبر ثلاثة مجالات — الوظيفة الجزيئية، والعملية البيولوجية، والمكون الخلوي — وقواعد البيانات البيولوجية هي مستودعات منسقة (مثل KEGG، و Reactome، وموارد ارتباط البروتين) تخزن المعرفة الوظيفية والمسارية والتفاعلية المستخدمة لترميز وتفسير البيانات الجينومية.
Scope
يغطي هذا الموضوع المفردات البيولوجية المنظمة وقواعد المعرفة الرئيسية التي تخزن المعلومات الوظيفية والمسارية المنسقة: بنية واستخدام الأنطولوجيا الجينية، وكيفية ترميز الجينات بمصطلحات الأنطولوجيا مع رموز الأدلة، ودور قواعد بيانات المسارات والتفاعلات. إنه موضوع مرجعي وتعليمي ولا يقدم إرشادات سريرية.
Core questions
- كيف يمكن وصف وظيفة المنتج الجيني بطريقة متسقة وقابلة للحساب؟
- ماذا تشمل المجالات الثلاثة للأنطولوجيا الجينية، وكيف يتم تنظيمها؟
- كيف تُشار إلى قوة الترميز، على سبيل المثال من خلال رموز الأدلة؟
- ما هي قواعد البيانات التي تحتوي على معرفة المسارات، والتفاعلات، وكيف تختلف؟
Key concepts
- المفردات المنظمة والأنطولوجيا
- الوظيفة الجزيئية، العملية البيولوجية، المكون الخلوي
- بنية الرسم البياني الموجه اللا دوري (DAG) للأنطولوجيا الجينية
- الترميز ورموز الأدلة
- قواعد بيانات المسارات (KEGG, Reactome)
- قواعد بيانات تفاعل وارتباط البروتين (STRING)
Mechanisms
تنظم الأنطولوجيا الجينية المصطلحات كـ رسم بياني موجه لا دوري (directed acyclic graph) حيث ترث المصطلحات المحددة من مصطلحات أكثر عمومية عبر ثلاثة مجالات مستقلة: الوظيفة الجزيئية (النشاط الكيميائي الحيوي للمنتج الجيني)، والعملية البيولوجية (البرنامج الأكبر الذي يساهم فيه)، والمكون الخلوي (المكان الذي يعمل فيه). ترتبط الجينات بالمصطلحات عن طريق الترميزات، وكل منها موسوم برمز دليل يسجل ما إذا كان الدعم تجريبيًا، أو حسابيًا، أو استُنتج بواسطة المنسق. تلتقط قواعد البيانات التكميلية المعرفة التي لا تحتويها الأنطولوجيا: تقوم KEGG و Reactome بترميز المسارات كشبكات من التفاعلات والعلاقات، وتجمع موارد ارتباط البروتين مثل STRING الأدلة على الروابط الوظيفية بين البروتينات. توفر هذه الموارد معًا مجموعات الجينات المنسقة والترميزات المرجعية التي تستهلكها طرق الإثراء والشبكات اللاحقة.
Clinical relevance
تُعد الأنطولوجيات وقواعد البيانات المنسقة البنية التحتية المشتركة التي تجعل التفسير الجينومي قابلاً للتكرار عبر الدراسات، حيث توفر المفردات ومجموعات الجينات المستخدمة في الترميز، والإثراء، وتحليل الشبكات. وهي تصف كيفية تنظيم المعرفة البيولوجية للحوسبة وتعمل كموارد مرجعية بدلاً من أن تكون أساسًا لقرارات التشخيص أو العلاج الفردية.
History
أُطلقت الأنطولوجيا الجينية في عام 2000 من قبل اتحاد قواعد بيانات الكائنات النموذجية لتوحيد كيفية وصف وظيفة الجينات عبر الأنواع، وأصبحت المفردات المعيارية الفعلية لعلم الجينوم الوظيفي. في نفس العام، قامت KEGG بإضفاء الطابع الرسمي على معرفة المسارات كخرائط قابلة للحساب، وأضافت Reactome لاحقًا قاعدة معرفية للمسارات على مستوى التفاعل منسقة يدويًا. وسعت قواعد بيانات ارتباط البروتين مثل STRING التنسيق ليشمل التفاعلات الوظيفية والفيزيائية، مما أكمل نظامًا بيئيًا من الموارد التي تعتمد عليها معظم تحليلات الإثراء والشبكات الآن.
Key figures
- Michael Ashburner
- Judith Blake
- Minoru Kanehisa
- Peter D'Eustachio
Related topics
Seminal works
- ashburner-2000
- kanehisa-2000
- jassal-2020
Frequently asked questions
- ما هي المجالات الثلاثة للأنطولوجيا الجينية؟
- الوظيفة الجزيئية (النشاط الكيميائي الحيوي للمنتج الجيني)، والعملية البيولوجية (البرنامج الأوسع الذي يساهم فيه)، والمكون الخلوي (المكان الذي يعمل فيه داخل الخلية). تُنظم هذه المجالات الثلاثة بشكل مستقل.
- لماذا تحمل ترميزات الأنطولوجيا الجينية رموز الأدلة؟
- تسجل رموز الأدلة كيفية دعم الترميز — على سبيل المثال، الأدلة التجريبية مقابل الاستدلال الحسابي — حتى يتمكن المستخدمون من الحكم على مدى موثوقية تعيين الجين للمصطلح المحدد.
Methods for this concept
- Pathway Enrichment Analysis
- Bayesian Pathway Enrichment Analysis
- Machine learning-assisted pathway enrichment analysis
- Gene Set Enrichment Analysis
- Network-based gene set enrichment analysis
- Network-based pathway enrichment analysis
- Multi-omics Pathway Enrichment Analysis
- Differential pathway enrichment analysis