توصیف دادهها و آمار توصیفی
توصیف دادهها و آمار توصیفی بخشی از آمار زیستی است که به سازماندهی، فشردهسازی و ارائه مجموعهای از مشاهدات میپردازد تا ویژگیهای اساسی آن در یک نگاه قابل درک باشد. پیش از هرگونه استنتاج، محققان با استفاده از خلاصههای عددی و نمایشهای گرافیکی، نحوه توزیع دادهها، محل تمرکز آنها، میزان پراکندگی و شکل آنها را توصیف میکنند.
Definition
توصیف دادهها و آمار توصیفی شامل روشهای عددی و گرافیکی است که برای توصیف مکان مرکزی، پراکندگی، شکل توزیع و ساختار یک مجموعه داده، پیش از و مستقل از تعمیم استنباطی به یک جمعیت، استفاده میشود.
Scope
این حوزه خواننده را با جنبه توصیفی آمار زیستی آشنا میکند: آمار توصیفی به طور کلی، توزیع و نرمال بودن دادهها، معیارهای گرایش مرکزی، معیارهای پراکندگی و بصریسازی دادهها. این یک مرور کلی مرجع از نحوه خلاصهسازی دادههای سلامت است، نه یک دستورالعمل برای تحلیل یا اقدام بالینی.
Sub-topics
Core questions
- مرکز دادهها کجاست و کدام معیار مکان بهترین نماینده آن است؟
- مشاهدات چقدر تغییر میکنند و این پراکندگی چگونه کمیسازی میشود؟
- شکل توزیع چگونه است و آیا تقریباً نرمال است؟
- چگونه میتوان دادهها را نمایش داد تا الگو، چولگی و نقاط پرت آن قابل مشاهده باشد؟
Key concepts
- آمار توصیفی در مقابل آمار استنباطی
- معیارهای گرایش مرکزی (میانگین، میانه، نما)
- معیارهای پراکندگی (دامنه، واریانس، انحراف معیار، دامنه بین چارکی)
- شکل توزیع، چولگی و کشیدگی
- نرمال بودن و ارزیابی آن
- خلاصههای گرافیکی (هیستوگرامها، نمودارهای جعبهای، نمودارهای پراکندگی)
- تحلیل اکتشافی دادهها
Mechanisms
توصیف با کاهش مشاهدات زیاد به چند کمیت و تصویر آموزنده پیش میرود. یک معیار مکان (میانگین، میانه یا نما) نشان میدهد که دادهها در کجا قرار دارند؛ یک معیار پراکندگی (انحراف معیار، دامنه بین چارکی، دامنه) نشان میدهد که دادهها چقدر از آن مکان پراکنده شدهاند؛ و جفت شدن مکان با پراکندگی برای مطابقت با شکل توزیع انتخاب میشود، به طوری که میانه و دامنه بین چارکی برای دادههای چولگیدار و میانگین و انحراف معیار برای دادههای تقریباً متقارن ترجیح داده میشوند. نمایشهای گرافیکی مانند هیستوگرامها و نمودارهای جعبهای، شکل، چولگی و نقاط پرت را که اعداد منفرد ممکن است پنهان کنند، آشکار میسازند و این ابزارها با هم مرحله اکتشافی را تشکیل میدهند که مقدم بر استنتاج رسمی است.
Clinical relevance
تقریباً هر مطالعه بالینی، ممیزی و گزارش نظارتی با خلاصههای توصیفی از شرکتکنندگان و اندازهگیریهای خود آغاز میشود، بنابراین درک این خلاصهها برای خواندن ادبیات علوم بهداشتی اساسی است. این حوزه نحوه توصیف دادهها را شرح میدهد و به عنوان پیشزمینهای برای ارزیابی شواهد در نظر گرفته شده است، نه مبنایی برای تصمیمگیریهای تشخیصی یا درمانی فردی.
Epidemiology
خلاصه توصیفی اولین گام تحلیلی در تحقیقات اپیدمیولوژیک و بالینی است که برای توصیف جمعیتهای مورد مطالعه، جداول پایه و توزیع مواجههها و پیامدها پیش از برآورد ارتباطات استفاده میشود. انتخاب معیارهای خلاصه و نمایشها مستقیماً بر شفافیت انتقال دادههای یک مطالعه تأثیر میگذارد.
History
خلاصهسازی عددی دادهها ریشههای عمیقی در نجوم و آمار حیاتی قرون هجدهم و نوزدهم دارد، اما مجموعه ابزارهای توصیفی مدرن در قرن بیستم تثبیت شد. کتاب «تحلیل دادههای اکتشافی» (1977) جان توکی، توصیف را به عنوان یک فعالیت تحقیقاتی مستقل بازتعریف کرد و نمایشهایی مانند نمودار جعبهای را رواج داد، در حالی که مربیان آمار در علوم بهداشتی متعاقباً خلاصههای استانداردی را که اکنون در مجلات پزشکی گزارش میشوند، تدوین کردند.
Debates
- چه زمانی میانگین و انحراف معیار باید جای خود را به میانه و دامنه بین چارکی بدهند؟
- از آنجا که میانگین و انحراف معیار تحت تأثیر چولگی و نقاط پرت قرار میگیرند، توصیه دیرینهای وجود دارد که دادههای غیرنرمال را با میانه و دامنه بین چارکی خلاصه کنیم؛ آستانه عملی برای تغییر به شکل توزیع و اندازه نمونه بستگی دارد.
Key figures
- John W. Tukey
- William S. Cleveland
- Douglas G. Altman
- J. Martin Bland
Related topics
Seminal works
- tukey-1977
- gupta-2019
Frequently asked questions
- تفاوت بین آمار توصیفی و استنباطی چیست؟
- آمار توصیفی دادههای جمعآوری شده را خلاصه و نمایش میدهد، در حالی که آمار استنباطی از آن دادهها برای تعمیم به یک جمعیت گستردهتر استفاده میکند. توصیف در ابتدا قرار دارد و هیچ ادعای احتمالی فراتر از نمونه موجود ندارد.
- چرا قبل از اجرای آزمونها، دادهها را توصیف کنیم؟
- خلاصهها و نمودارها شکل توزیع، پراکندگی و هرگونه نقاط پرت یا خطا را آشکار میکنند که تعیینکننده مناسب بودن تحلیلهای بعدی و نحوه تفسیر نتایج آنها است.