وصف البيانات والإحصاءات الموجزة
يُعد وصف البيانات والإحصاءات الموجزة جزءًا من الإحصاء الحيوي المعني بتنظيم وتكثيف وعرض مجموعة من الملاحظات بحيث يمكن فهم سماتها الأساسية بلمحة. قبل محاولة أي استدلال، يصف الباحثون كيفية توزيع البيانات، ومكان تمركزها، ومدى انتشارها، والشكل الذي تتخذه، باستخدام الملخصات الرقمية والعروض البيانية.
Definition
يشمل وصف البيانات والإحصاءات الموجزة الأساليب العددية والبيانية المستخدمة لتوصيف الموقع المركزي لمجموعة البيانات، وتشتتها، وشكل توزيعها، وهيكلها، قبل وبعد التعميم الاستدلالي على مجتمع إحصائي.
Scope
يوجه هذا المجال القارئ إلى الجانب الوصفي من الإحصاء الحيوي: الإحصاء الوصفي ككل، وتوزيع البيانات وطبيعيتها، ومقاييس النزعة المركزية، ومقاييس التباين، وتصور البيانات. إنه نظرة عامة مرجعية حول كيفية تلخيص البيانات الصحية، وليس وصفة للتحليل أو الإجراء السريري.
Sub-topics
Core questions
- أين يقع مركز البيانات، وأي مقياس للموقع يمثله بشكل أفضل؟
- ما مدى تباين الملاحظات، وكيف يتم تحديد هذا الانتشار كميًا؟
- ما هو شكل التوزيع، وهل هو طبيعي تقريبًا؟
- كيف يمكن عرض البيانات بحيث يكون نمطها، وانحرافها، وقيمها الشاذة مرئية؟
Key concepts
- الإحصاء الوصفي مقابل الإحصاء الاستدلالي
- مقاييس النزعة المركزية (المتوسط، الوسيط، المنوال)
- مقاييس التباين (المدى، التباين، الانحراف المعياري، المدى الربيعي)
- شكل التوزيع، الالتواء، والتفرطح
- الاعتدالية وتقييمها
- الملخصات البيانية (المدرجات التكرارية، مخططات الصندوق، مخططات التشتت)
- تحليل البيانات الاستكشافي
Mechanisms
يتم الوصف عن طريق اختزال العديد من الملاحظات إلى عدد قليل من الكميات والصور المفيدة. يلخص مقياس الموقع (المتوسط، الوسيط، أو المنوال) مكان وجود البيانات؛ ويلخص مقياس التشتت (الانحراف المعياري، المدى الربيعي، المدى) مدى تشتتها حول هذا الموقع؛ ويتم اختيار اقتران الموقع مع التشتت ليتناسب مع شكل التوزيع، مع تفضيل الوسيط والمدى الربيعي للبيانات الملتوية والمتوسط والانحراف المعياري للبيانات المتماثلة تقريبًا. تكشف العروض البيانية مثل المدرجات التكرارية ومخططات الصندوق عن الشكل والانحراف والقيم الشاذة التي يمكن أن تخفيها الأرقام الفردية، وتشكل هذه الأدوات معًا المرحلة الاستكشافية التي تسبق الاستدلال الرسمي.
Clinical relevance
تفتتح كل دراسة سريرية تقريبًا، ومراجعة، وتقرير مراقبة بملخصات وصفية للمشاركين والقياسات، لذا فإن فهم هذه الملخصات أساسي لقراءة أدبيات العلوم الصحية. يصف هذا المجال كيفية توصيف البيانات ويهدف إلى أن يكون خلفية لتقييم الأدلة، وليس أساسًا لقرارات التشخيص أو العلاج الفردية.
Epidemiology
الملخص الوصفي هو الخطوة التحليلية الأولى في البحث الوبائي والسريري، ويستخدم لتوصيف مجموعات الدراسة، وجداول الأساس، وتوزيع التعرضات والنتائج قبل تقدير الارتباطات. يؤثر اختيار مقاييس الملخص والعروض بشكل مباشر على مدى شفافية توصيل بيانات الدراسة.
History
تتجذر الملخصات العددية للبيانات بعمق في علم الفلك والإحصاءات الحيوية في القرنين الثامن عشر والتاسع عشر، ولكن مجموعة الأدوات الوصفية الحديثة تم توحيدها في القرن العشرين. أعاد كتاب جون توكي "تحليل البيانات الاستكشافي" (1977) صياغة الوصف كنشاط بحثي بحد ذاته وشاع عروضًا مثل مخطط الصندوق، بينما قام المربون الإحصائيون في العلوم الصحية لاحقًا بتقنين الملخصات القياسية التي يتم الإبلاغ عنها الآن في المجلات الطبية.
Debates
- متى يجب أن يفسح المتوسط والانحراف المعياري المجال للوسيط والمدى الربيعي؟
- نظرًا لأن المتوسط والانحراف المعياري يتأثران بالالتواء والقيم الشاذة، هناك توصية قديمة بتلخيص البيانات غير الطبيعية باستخدام الوسيط والمدى الربيعي؛ تعتمد العتبة العملية للتبديل على شكل التوزيع وحجم العينة.
Key figures
- John W. Tukey
- William S. Cleveland
- Douglas G. Altman
- J. Martin Bland
Related topics
Seminal works
- tukey-1977
- gupta-2019
Frequently asked questions
- ما الفرق بين الإحصاء الوصفي والإحصاء الاستدلالي؟
- يلخص الإحصاء الوصفي ويعرض البيانات التي تم جمعها فعليًا، بينما يستخدم الإحصاء الاستدلالي تلك البيانات لاستخلاص تعميمات حول مجتمع أوسع. يأتي الوصف أولاً ولا يقدم أي ادعاء احتمالي يتجاوز العينة المتاحة.
- لماذا يتم وصف البيانات قبل إجراء الاختبارات؟
- تكشف الملخصات والرسوم البيانية عن شكل التوزيع، وانتشاره، وأي قيم شاذة أو أخطاء، مما يحدد ما إذا كانت التحليلات اللاحقة مناسبة وكيف ينبغي تفسير نتائجها.