फाइलोजेनेटिक अनुमान
फाइलोजेनेटिक अनुमान उन विधियों का समूह है जिनका उपयोग वर्ण डेटा से विकासात्मक वृक्षों के पुनर्निर्माण के लिए किया जाता है, जो समानता और अंतर के पैटर्न को वंश के बारे में परिकल्पनाओं में बदल देता है।
Definition
फाइलोजेनेटिक अनुमान आनुवंशिक वर्णों, अक्सर आणविक अनुक्रमों से टैक्सोन के बीच विकासात्मक संबंधों का अनुमान है। यह एक वृक्ष उत्पन्न करता है, जिसमें शाखाओं का क्रम और कभी-कभी शाखाओं की लंबाई होती है, जो एक स्पष्ट इष्टतम मानदंड या संभाव्य मॉडल के तहत डेटा को सर्वोत्तम रूप से समझाता है।
Scope
यह विषय प्रमुख वृक्ष-निर्माण विधियों, दूरी, पारसीमोनी, अधिकतम संभावना और बायेसियन अनुमान, उनके द्वारा माने गए अनुक्रम विकास के मॉडल, समर्थन का आकलन करने के लिए बूटस्ट्रैप और पश्च संभाव्यताओं के उपयोग, और लंबी-शाखा आकर्षण जैसी उन कमियों को शामिल करता है जो अनुमान को गुमराह कर सकती हैं।
Core questions
- दूरी, पारसीमोनी, संभावना और बायेसियन विधियाँ वृक्षों के अनुमान में कैसे भिन्न हैं?
- कौन से मॉडल बताते हैं कि डीएनए अनुक्रम शाखाओं के साथ कैसे बदलते हैं?
- एक वृक्ष में विश्वास, जैसे बूटस्ट्रैप समर्थन या पश्च संभाव्यता, का आकलन कैसे किया जाता है?
- लंबी-शाखा आकर्षण जैसे कौन से कलाकृतियाँ गलत वृक्षों का कारण बन सकती हैं?
Key theories
- इष्टतमता-आधारित और मॉडल-आधारित वृक्ष अनुमान
- वृक्षों को वर्ण परिवर्तनों को कम करके (पारसीमोनी), युग्मित दूरियों को फिट करके (दूरी विधियाँ), या एक स्पष्ट प्रतिस्थापन मॉडल (संभावना और बायेसियन विधियाँ) के तहत डेटा की संभावना को अधिकतम करके चुना जा सकता है।
- समर्थन का बूटस्ट्रैप आकलन
- प्रतिस्थापन के साथ वर्णों का पुनर्नमूनाकरण और वृक्षों का पुनर्निर्माण यह अनुमान लगाता है कि डेटा प्रत्येक क्लेड का कितनी दृढ़ता से समर्थन करता है, जिससे अनुमानित संबंधों में विश्वास का एक मानक माप मिलता है।
Mechanisms
नेबर-जॉइनिंग जैसी दूरी विधियाँ अनुक्रम अंतरों को एक मैट्रिक्स में परिवर्तित करती हैं और क्लस्टरिंग द्वारा एक वृक्ष का निर्माण करती हैं, जिससे कुछ जानकारी के नुकसान पर गति मिलती है। पारसीमोनी सबसे कम वर्ण परिवर्तनों की आवश्यकता वाले वृक्ष का चयन करती है। अधिकतम संभावना और बायेसियन विधियाँ प्रतिस्थापन के स्पष्ट मॉडल अपनाती हैं, जो असमान आधार आवृत्तियों, संक्रमण-ट्रांसवर्जन पूर्वाग्रह, और साइट-वार दर भिन्नता को ध्यान में रखती हैं, और उस वृक्ष (और मापदंडों) की खोज करती हैं जो डेटा को सर्वोत्तम रूप से समझाता है। समर्थन का आकलन संभावना और पारसीमोनी के लिए बूटस्ट्रैप द्वारा या बायेसियन विश्लेषण में पश्च संभाव्यताओं द्वारा किया जाता है। लंबी-शाखा आकर्षण और मॉडल की गलत विशिष्टता आत्मविश्वास से गलत वृक्ष उत्पन्न कर सकती है, इसलिए विधि का चुनाव और मॉडल की पर्याप्तता मायने रखती है।
Clinical relevance
फाइलोजेनेटिक अनुमान वायरल और बैक्टीरियल संचरण के इतिहास का पुनर्निर्माण करता है, प्रकोपों के स्रोत की पहचान करता है, और प्रतिरोधी या विषैले उपभेदों के उद्भव की तारीख बताता है, जिससे यह जीनोमिक महामारी विज्ञान का एक मुख्य उपकरण बन जाता है।
History
क्लैडिस्टिक और दूरी विधियाँ 1960-1970 के दशक में उभरीं; सैतो और नेई ने 1987 में नेबर-जॉइनिंग की शुरुआत की, और फेल्सेनस्टीन ने अनुक्रमों के लिए अधिकतम संभावना और 1985 में फाइलोजेनी के लिए बूटस्ट्रैप का बीड़ा उठाया। बायेसियन अनुमान और तब से बड़े जीनोमिक डेटासेट मानक बन गए हैं।
Debates
- पारसीमोनी बनाम मॉडल-आधारित विधियाँ
- एक लंबे समय से चली आ रही कार्यप्रणाली संबंधी बहस इस बात पर है कि पारसीमोनी या स्पष्ट संभाव्य मॉडल अधिक विश्वसनीय वृक्ष देते हैं, खासकर जब परिवर्तन की दरें असमान हों और लंबी-शाखा आकर्षण का जोखिम हो।
Key figures
- Joseph Felsenstein
- Masatoshi Nei
- Naruya Saitou
- Willi Hennig
Related topics
Seminal works
- saitouNei1987
- felsenstein1985
- felsensteinBook2004
Frequently asked questions
- कौन सी विधि सही विकासात्मक वृक्ष देती है?
- कोई भी विधि सही होने की गारंटी नहीं देती है; अधिकतम संभावना और बायेसियन अनुमान जैसी मॉडल-आधारित विधियों को आमतौर पर अनुक्रम डेटा के लिए पसंद किया जाता है, लेकिन सभी विधियों को असमान विकासात्मक दरों और मॉडल उल्लंघनों द्वारा गुमराह किया जा सकता है, इसलिए समर्थन उपाय आवश्यक हैं।
- बूटस्ट्रैप मान का क्या अर्थ है?
- एक बूटस्ट्रैप मान यह दर्शाता है कि डेटा को पुनर्नमूनाकरण करने और वृक्ष का पुनर्निर्माण करने पर एक विशेष समूहन कितनी बार दोहराया जाता है; उच्च मान इंगित करते हैं कि विश्लेषण किए गए वर्णों द्वारा समूहन का दृढ़ता से समर्थन किया जाता है।