जीन ऑन्कोलॉजी और जैविक डेटाबेस
जीनोम की बड़े पैमाने पर व्याख्या करने के लिए, जीनों के कार्य के लिए एक साझा, मशीन-पठनीय भाषा की आवश्यकता होती है। जीन ऑन्कोलॉजी वह भाषा प्रदान करती है — आणविक कार्यों, जैविक प्रक्रियाओं और सेलुलर स्थानों की एक संरचित शब्दावली — जबकि KEGG और Reactome जैसे क्यूरेटेड डेटाबेस मार्ग और प्रतिक्रिया ज्ञान प्रदान करते हैं जिसके विरुद्ध जीनोमिक परिणामों को पढ़ा जाता है।
Definition
जीन ऑन्कोलॉजी एक संरचित, पदानुक्रमित नियंत्रित शब्दावली है जो तीन डोमेन — आणविक कार्य, जैविक प्रक्रिया और सेलुलर घटक — में जीन-उत्पाद विशेषताओं का वर्णन करती है, और जैविक डेटाबेस क्यूरेटेड रिपॉजिटरी (जैसे KEGG, Reactome, और प्रोटीन-एसोसिएशन संसाधन) हैं जो कार्यात्मक, मार्ग और इंटरेक्शन ज्ञान संग्रहीत करते हैं जिसका उपयोग जीनोमिक डेटा को एनोटेट और व्याख्या करने के लिए किया जाता है।
Scope
यह विषय नियंत्रित जैविक शब्दावली और प्रमुख ज्ञान आधारों को शामिल करता है जो क्यूरेटेड कार्यात्मक और मार्ग जानकारी संग्रहीत करते हैं: जीन ऑन्कोलॉजी की संरचना और उपयोग, साक्ष्य कोड के साथ ऑन्कोलॉजी शब्दों में जीनों को कैसे एनोटेट किया जाता है, और मार्ग और इंटरेक्शन डेटाबेस की भूमिका। यह एक संदर्भ और शैक्षिक विषय है और नैदानिक मार्गदर्शन प्रदान नहीं करता है।
Core questions
- एक जीन उत्पाद के कार्य को एक सुसंगत, संगणनीय तरीके से कैसे वर्णित किया जा सकता है?
- जीन ऑन्कोलॉजी के तीन डोमेन क्या कैप्चर करते हैं, और वे कैसे व्यवस्थित होते हैं?
- एक एनोटेशन की शक्ति को कैसे इंगित किया जाता है, उदाहरण के लिए साक्ष्य कोड के माध्यम से?
- कौन से डेटाबेस मार्ग, प्रतिक्रिया और इंटरेक्शन ज्ञान रखते हैं, और वे कैसे भिन्न होते हैं?
Key concepts
- नियंत्रित शब्दावली और ऑन्कोलॉजी
- आणविक कार्य, जैविक प्रक्रिया, सेलुलर घटक
- GO की निर्देशित चक्रीय ग्राफ (DAG) संरचना
- एनोटेशन और साक्ष्य कोड
- मार्ग डेटाबेस (KEGG, Reactome)
- प्रोटीन इंटरेक्शन और एसोसिएशन डेटाबेस (STRING)
Mechanisms
जीन ऑन्कोलॉजी शब्दों को एक निर्देशित चक्रीय ग्राफ के रूप में व्यवस्थित करती है जिसमें विशिष्ट शब्द तीन स्वतंत्र डोमेन में अधिक सामान्य शब्दों से विरासत में मिलते हैं: आणविक कार्य (एक जीन उत्पाद की जैव रासायनिक गतिविधि), जैविक प्रक्रिया (बड़ा कार्यक्रम जिसमें यह योगदान देता है), और सेलुलर घटक (जहां यह कार्य करता है)। जीन को एनोटेशन द्वारा शब्दों से जोड़ा जाता है, प्रत्येक को एक साक्ष्य कोड के साथ टैग किया जाता है जो रिकॉर्ड करता है कि समर्थन प्रायोगिक, कम्प्यूटेशनल, या क्यूरेटर-अनुमानित है। पूरक डेटाबेस उस ज्ञान को कैप्चर करते हैं जो ऑन्कोलॉजी नहीं करता है: KEGG और Reactome प्रतिक्रियाओं और संबंधों के नेटवर्क के रूप में मार्गों को एन्कोड करते हैं, और STRING जैसे प्रोटीन-एसोसिएशन संसाधन प्रोटीन के बीच कार्यात्मक लिंक के साक्ष्य को एकत्रित करते हैं। साथ में ये संसाधन क्यूरेटेड जीन सेट और संदर्भ एनोटेशन प्रदान करते हैं जिनका उपयोग डाउनस्ट्रीम संवर्धन और नेटवर्क विधियां करती हैं।
Clinical relevance
ऑन्कोलॉजी और क्यूरेटेड डेटाबेस साझा बुनियादी ढांचा हैं जो अध्ययनों में जीनोमिक व्याख्या को प्रतिलिपि प्रस्तुत करने योग्य बनाते हैं, एनोटेशन, संवर्धन और नेटवर्क विश्लेषण में उपयोग की जाने वाली शब्दावली और जीन सेट की आपूर्ति करते हैं। वे वर्णन करते हैं कि कम्प्यूटेशन के लिए जैविक ज्ञान को कैसे व्यवस्थित किया जाता है और व्यक्तिगत नैदानिक या उपचार निर्णयों के आधार के बजाय संदर्भ संसाधनों के रूप में कार्य करते हैं।
History
जीन ऑन्कोलॉजी को 2000 में मॉडल-जीव डेटाबेस के एक संघ द्वारा लॉन्च किया गया था ताकि प्रजातियों में जीन कार्य का वर्णन करने के तरीके को एकीकृत किया जा सके, और यह कार्यात्मक जीनोमिक्स के लिए वास्तविक मानक शब्दावली बन गई। उसी वर्ष KEGG ने मार्ग ज्ञान को संगणनीय मानचित्रों के रूप में औपचारिक रूप दिया, और Reactome ने बाद में एक मैन्युअल रूप से क्यूरेटेड, प्रतिक्रिया-स्तर मार्ग ज्ञानकोष जोड़ा। STRING जैसे प्रोटीन-एसोसिएशन डेटाबेस ने कार्यात्मक और भौतिक इंटरैक्शन के लिए क्यूरेशन का विस्तार किया, जिससे संसाधनों का एक पारिस्थितिकी तंत्र पूरा हुआ जिस पर अब अधिकांश संवर्धन और नेटवर्क विश्लेषण निर्भर करते हैं।
Key figures
- Michael Ashburner
- Judith Blake
- Minoru Kanehisa
- Peter D'Eustachio
Related topics
Seminal works
- ashburner-2000
- kanehisa-2000
- jassal-2020
Frequently asked questions
- जीन ऑन्कोलॉजी के तीन डोमेन क्या हैं?
- आणविक कार्य (एक जीन उत्पाद की जैव रासायनिक गतिविधि), जैविक प्रक्रिया (बड़ा कार्यक्रम जिसमें यह योगदान देता है), और सेलुलर घटक (कोशिका में जहां यह कार्य करता है)। ये तीनों डोमेन स्वतंत्र रूप से व्यवस्थित होते हैं।
- जीन ऑन्कोलॉजी एनोटेशन में साक्ष्य कोड क्यों होते हैं?
- साक्ष्य कोड रिकॉर्ड करते हैं कि एक एनोटेशन को कैसे समर्थित किया गया था — उदाहरण के लिए प्रायोगिक साक्ष्य बनाम कम्प्यूटेशनल अनुमान — ताकि उपयोगकर्ता यह तय कर सकें कि एक दिए गए जीन-से-शब्द असाइनमेंट कितना विश्वसनीय है।
Methods for this concept
- Pathway Enrichment Analysis
- Bayesian Pathway Enrichment Analysis
- Machine learning-assisted pathway enrichment analysis
- Gene Set Enrichment Analysis
- Network-based gene set enrichment analysis
- Network-based pathway enrichment analysis
- Multi-omics Pathway Enrichment Analysis
- Differential pathway enrichment analysis