डेटा विज़ुअलाइज़ेशन
डेटा विज़ुअलाइज़ेशन डेटा का ग्राफिकल प्रदर्शन है ताकि इसके पैटर्न, वितरण और संबंधों को सीधे समझा जा सके। अच्छी तरह से चुने गए डिस्प्ले — हिस्टोग्राम, बॉक्स प्लॉट, स्कैटर प्लॉट और अन्य — तिरछापन (skew), क्लस्टरिंग और आउटलायर्स जैसी विशेषताओं को उजागर करते हैं जिन्हें केवल संख्यात्मक सारांश छिपा सकते हैं, जिससे ग्राफिक्स डेटा का वर्णन और अन्वेषण करने का एक अभिन्न अंग बन जाते हैं।
Definition
डेटा विज़ुअलाइज़ेशन डेटा और सांख्यिकीय सारांशों को ग्राफिक रूप से — हिस्टोग्राम, बॉक्स प्लॉट और स्कैटर प्लॉट जैसे प्लॉट्स के माध्यम से — प्रस्तुत करने का अभ्यास है, ताकि वितरण आकार, तुलना और संबंध को नेत्रहीन रूप से स्पष्ट किया जा सके।
Scope
यह प्रविष्टि डेटा को सारांशित करने में ग्राफिकल डिस्प्ले की भूमिका, स्वास्थ्य विज्ञान में उपयोग किए जाने वाले प्रमुख चार्ट प्रकारों और ग्राफिकल धारणा के सिद्धांतों को शामिल करती है जो कुछ डिस्प्ले को दूसरों की तुलना में अधिक पठनीय बनाते हैं। यह एक पद्धतिगत संदर्भ है और नैदानिक मार्गदर्शन प्रदान नहीं करता है।
Core questions
- कौन सा डिस्प्ले प्रश्न में डेटा की विशेषता — वितरण, तुलना, या संबंध — को सबसे अच्छी तरह से प्रकट करता है?
- ग्राफिकल धारणा के सिद्धांत कैसे प्रभावित करते हैं कि कौन से एन्कोडिंग सटीक रूप से पढ़े जाते हैं?
- एक चार्ट कैसे गुमराह कर सकता है, और इससे कैसे बचा जा सकता है?
Key concepts
- हिस्टोग्राम
- बॉक्स प्लॉट
- स्कैटर प्लॉट
- बार चार्ट और आवृत्ति डिस्प्ले
- ग्राफिकल धारणा और एन्कोडिंग सटीकता
- एक्सप्लोरेटरी डेटा एनालिसिस
- भ्रामक ग्राफिक्स
Key theories
- ग्राफिकल धारणा
- क्लीवलैंड और मैकगिल का ग्राफिकल धारणा का सिद्धांत दृश्य एन्कोडिंग (स्थिति, लंबाई, कोण, क्षेत्र, रंग) को रैंक करता है कि लोग उन्हें कितनी सटीकता से डिकोड करते हैं, जो डॉट और स्कैटर प्लॉट जैसे स्थिति-आधारित डिस्प्ले को पाई चार्ट जैसे क्षेत्र- या कोण-आधारित डिस्प्ले पर पसंद करने के लिए एक अनुभवजन्य आधार प्रदान करता है।
Mechanisms
विभिन्न डिस्प्ले विभिन्न विशेषताओं को उजागर करते हैं। एक हिस्टोग्राम एक एकल वितरण का आकार दिखाता है — इसका केंद्र, फैलाव, तिरछापन और बहुविधता (modality)। एक बॉक्स प्लॉट माध्यिका, चतुर्थक और आउटलायर्स को संक्षिप्त रूप से सारांशित करता है, जिससे यह समूहों में एक चर के वितरण की तुलना करने के लिए कुशल हो जाता है। एक स्कैटर प्लॉट दो निरंतर चरों के बीच संबंध को प्रकट करता है। किसी भी डिस्प्ले की प्रभावशीलता ग्राफिकल धारणा पर निर्भर करती है: अनुभवजन्य अध्ययन से पता चलता है कि आंख कुछ एन्कोडिंग (एक सामान्य पैमाने के साथ स्थिति) को दूसरों (कोण, क्षेत्र, रंग संतृप्ति) की तुलना में कहीं अधिक सटीक रूप से डिकोड करती है, यही कारण है कि स्थिति-आधारित प्लॉट्स को आम तौर पर पसंद किया जाता है और यही कारण है कि पाई चार्ट और त्रि-आयामी प्रभावों जैसे डिस्प्ले को हतोत्साहित किया जाता है। ध्वनि डिज़ाइन विकृतियों — कटे हुए या असंगत अक्ष, अत्यधिक अलंकरण — से भी बचाता है जो पाठक को गलत धारणा दे सकते हैं।
Clinical relevance
नैदानिक पत्रों और प्रस्तुतियों में आंकड़े अधिकांश संदेश को वहन करते हैं, और उन्हें गंभीर रूप से पढ़ने की क्षमता — और भ्रामक लोगों को पहचानने की क्षमता — साक्ष्य का मूल्यांकन करने का एक हिस्सा है। यह प्रविष्टि उस उद्देश्य के लिए ग्राफिकल डिस्प्ले के सिद्धांतों का वर्णन करती है और व्यक्तिगत निदान या उपचार निर्णयों का आधार नहीं है।
Epidemiology
स्वास्थ्य अनुसंधान के हर चरण में ग्राफिकल डिस्प्ले का उपयोग किया जाता है, कच्चे डेटा की खोज और वितरण संबंधी मान्यताओं की जांच से लेकर नैदानिक और सार्वजनिक दर्शकों तक निष्कर्षों को संप्रेषित करने तक। डिस्प्ले का चुनाव और ईमानदारी सीधे तौर पर प्रभावित करती है कि अध्ययन के परिणाम कितनी स्पष्टता और सटीकता से समझे जाते हैं।
History
सांख्यिकीय ग्राफिक्स विलियम प्लेफेयर के काम में अठारहवीं और उन्नीसवीं शताब्दी के अंत तक जाते हैं, जिन्होंने लाइन, बार और पाई चार्ट पेश किए, और फ्लोरेंस नाइटिंगेल, जिन्होंने स्वच्छता सुधार के लिए तर्क देने के लिए ग्राफिक्स का इस्तेमाल किया। आधुनिक युग को जॉन टुकी के एक्सप्लोरेटरी डेटा एनालिसिस (1977) द्वारा आकार दिया गया था, जिसने बॉक्स प्लॉट जैसे डिस्प्ले को पेश और लोकप्रिय बनाया, क्लीवलैंड और मैकगिल के ग्राफिकल धारणा के अनुभवजन्य अध्ययन द्वारा, और एडवर्ड टफटे के मात्रात्मक जानकारी के ईमानदार और कुशल प्रदर्शन के सिद्धांतों द्वारा।
Debates
- सटीक पढ़ने के लिए किन डिस्प्ले को प्राथमिकता दी जानी चाहिए?
- ग्राफिकल धारणा पर शोध से पता चलता है कि एक पैमाने के साथ स्थिति द्वारा एन्कोड की गई मात्राओं को कोण या क्षेत्र द्वारा एन्कोड की गई मात्राओं की तुलना में अधिक सटीक रूप से आंका जाता है, जो डॉट, बार और स्कैटर प्लॉट का पक्ष लेने और पाई चार्ट और त्रि-आयामी सजावट से बचने की लंबे समय से चली आ रही सलाह को रेखांकित करता है।
Key figures
- John W. Tukey
- William S. Cleveland
- Edward R. Tufte
Related topics
Seminal works
- tukey-1977
- cleveland-1984
- tufte-2001
- mcgill-1978
Frequently asked questions
- सारांश आंकड़े पहले से ही रिपोर्ट किए जाने पर ग्राफ का उपयोग क्यों करें?
- ग्राफ ऐसी विशेषताओं — तिरछापन, कई चोटियाँ, आउटलायर्स और चरों के बीच संबंध — को प्रकट करते हैं जिन्हें माध्य और मानक विचलन जैसे एकल संख्याएँ छिपा सकती हैं, इसलिए वे संख्यात्मक सारांशों को प्रतिस्थापित करने के बजाय उनका पूरक करते हैं।
- एक चार्ट को दूसरे की तुलना में अधिक सटीक रूप से पढ़ना क्या आसान बनाता है?
- लोग एक सामान्य पैमाने के साथ स्थिति को कोण, क्षेत्र या रंग की तुलना में अधिक सटीक रूप से डिकोड करते हैं। इसलिए, स्थिति पर निर्भर करने वाले डिस्प्ले, जैसे कि डॉट और स्कैटर प्लॉट, को आम तौर पर पाई चार्ट या त्रि-आयामी ग्राफिक्स की तुलना में अधिक विश्वसनीय रूप से पढ़ा जाता है।