ScholarGate
دستیار

توصیف داده‌ها و آمار توصیفی

توصیف داده‌ها و آمار توصیفی بخشی از آمار زیستی است که به سازماندهی، فشرده‌سازی و ارائه مجموعه‌ای از مشاهدات می‌پردازد تا ویژگی‌های اساسی آن در یک نگاه قابل درک باشد. پیش از هرگونه استنتاج، محققان با استفاده از خلاصه‌های عددی و نمایش‌های گرافیکی، نحوه توزیع داده‌ها، محل تمرکز آن‌ها، میزان پراکندگی و شکل آن‌ها را توصیف می‌کنند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics
Tools & resources
دریافت اسلایدها
Learn & explore
ویدیوبه‌زودی

Definition

توصیف داده‌ها و آمار توصیفی شامل روش‌های عددی و گرافیکی است که برای توصیف مکان مرکزی، پراکندگی، شکل توزیع و ساختار یک مجموعه داده، پیش از و مستقل از تعمیم استنباطی به یک جمعیت، استفاده می‌شود.

Scope

این حوزه خواننده را با جنبه توصیفی آمار زیستی آشنا می‌کند: آمار توصیفی به طور کلی، توزیع و نرمال بودن داده‌ها، معیارهای گرایش مرکزی، معیارهای پراکندگی و بصری‌سازی داده‌ها. این یک مرور کلی مرجع از نحوه خلاصه‌سازی داده‌های سلامت است، نه یک دستورالعمل برای تحلیل یا اقدام بالینی.

Sub-topics

Core questions

  • مرکز داده‌ها کجاست و کدام معیار مکان بهترین نماینده آن است؟
  • مشاهدات چقدر تغییر می‌کنند و این پراکندگی چگونه کمی‌سازی می‌شود؟
  • شکل توزیع چگونه است و آیا تقریباً نرمال است؟
  • چگونه می‌توان داده‌ها را نمایش داد تا الگو، چولگی و نقاط پرت آن قابل مشاهده باشد؟

Key concepts

  • آمار توصیفی در مقابل آمار استنباطی
  • معیارهای گرایش مرکزی (میانگین، میانه، نما)
  • معیارهای پراکندگی (دامنه، واریانس، انحراف معیار، دامنه بین چارکی)
  • شکل توزیع، چولگی و کشیدگی
  • نرمال بودن و ارزیابی آن
  • خلاصه‌های گرافیکی (هیستوگرام‌ها، نمودارهای جعبه‌ای، نمودارهای پراکندگی)
  • تحلیل اکتشافی داده‌ها

Mechanisms

توصیف با کاهش مشاهدات زیاد به چند کمیت و تصویر آموزنده پیش می‌رود. یک معیار مکان (میانگین، میانه یا نما) نشان می‌دهد که داده‌ها در کجا قرار دارند؛ یک معیار پراکندگی (انحراف معیار، دامنه بین چارکی، دامنه) نشان می‌دهد که داده‌ها چقدر از آن مکان پراکنده شده‌اند؛ و جفت شدن مکان با پراکندگی برای مطابقت با شکل توزیع انتخاب می‌شود، به طوری که میانه و دامنه بین چارکی برای داده‌های چولگی‌دار و میانگین و انحراف معیار برای داده‌های تقریباً متقارن ترجیح داده می‌شوند. نمایش‌های گرافیکی مانند هیستوگرام‌ها و نمودارهای جعبه‌ای، شکل، چولگی و نقاط پرت را که اعداد منفرد ممکن است پنهان کنند، آشکار می‌سازند و این ابزارها با هم مرحله اکتشافی را تشکیل می‌دهند که مقدم بر استنتاج رسمی است.

Clinical relevance

تقریباً هر مطالعه بالینی، ممیزی و گزارش نظارتی با خلاصه‌های توصیفی از شرکت‌کنندگان و اندازه‌گیری‌های خود آغاز می‌شود، بنابراین درک این خلاصه‌ها برای خواندن ادبیات علوم بهداشتی اساسی است. این حوزه نحوه توصیف داده‌ها را شرح می‌دهد و به عنوان پیش‌زمینه‌ای برای ارزیابی شواهد در نظر گرفته شده است، نه مبنایی برای تصمیم‌گیری‌های تشخیصی یا درمانی فردی.

Epidemiology

خلاصه توصیفی اولین گام تحلیلی در تحقیقات اپیدمیولوژیک و بالینی است که برای توصیف جمعیت‌های مورد مطالعه، جداول پایه و توزیع مواجهه‌ها و پیامدها پیش از برآورد ارتباطات استفاده می‌شود. انتخاب معیارهای خلاصه و نمایش‌ها مستقیماً بر شفافیت انتقال داده‌های یک مطالعه تأثیر می‌گذارد.

History

خلاصه‌سازی عددی داده‌ها ریشه‌های عمیقی در نجوم و آمار حیاتی قرون هجدهم و نوزدهم دارد، اما مجموعه ابزارهای توصیفی مدرن در قرن بیستم تثبیت شد. کتاب «تحلیل داده‌های اکتشافی» (1977) جان توکی، توصیف را به عنوان یک فعالیت تحقیقاتی مستقل بازتعریف کرد و نمایش‌هایی مانند نمودار جعبه‌ای را رواج داد، در حالی که مربیان آمار در علوم بهداشتی متعاقباً خلاصه‌های استانداردی را که اکنون در مجلات پزشکی گزارش می‌شوند، تدوین کردند.

Debates

چه زمانی میانگین و انحراف معیار باید جای خود را به میانه و دامنه بین چارکی بدهند؟
از آنجا که میانگین و انحراف معیار تحت تأثیر چولگی و نقاط پرت قرار می‌گیرند، توصیه دیرینه‌ای وجود دارد که داده‌های غیرنرمال را با میانه و دامنه بین چارکی خلاصه کنیم؛ آستانه عملی برای تغییر به شکل توزیع و اندازه نمونه بستگی دارد.

Key figures

  • John W. Tukey
  • William S. Cleveland
  • Douglas G. Altman
  • J. Martin Bland

Related topics

Seminal works

  • tukey-1977
  • gupta-2019

Frequently asked questions

تفاوت بین آمار توصیفی و استنباطی چیست؟
آمار توصیفی داده‌های جمع‌آوری شده را خلاصه و نمایش می‌دهد، در حالی که آمار استنباطی از آن داده‌ها برای تعمیم به یک جمعیت گسترده‌تر استفاده می‌کند. توصیف در ابتدا قرار دارد و هیچ ادعای احتمالی فراتر از نمونه موجود ندارد.
چرا قبل از اجرای آزمون‌ها، داده‌ها را توصیف کنیم؟
خلاصه‌ها و نمودارها شکل توزیع، پراکندگی و هرگونه نقاط پرت یا خطا را آشکار می‌کنند که تعیین‌کننده مناسب بودن تحلیل‌های بعدی و نحوه تفسیر نتایج آن‌ها است.

Methods for this concept

Related concepts