معیارهای پراکندگی
معیارهای پراکندگی، یا واریانس، میزان پراکندگی مجموعهای از مشاهدات را حول مرکز آن کمیسازی میکنند. دو مجموعه داده میتوانند میانگین یکسانی داشته باشند، اما در میزان تجمع مقادیرشان تفاوت زیادی نشان دهند، و معیارهایی مانند دامنه، واریانس، انحراف معیار و دامنه بین چارکی این تفاوت را نشان میدهند.
Definition
یک معیار پراکندگی، پراکندگی مشاهدات را حول یک مقدار مرکزی کمیسازی میکند: دامنه تفاوت بین بزرگترین و کوچکترین مقادیر است، واریانس میانگین مجذور انحراف از میانگین است، انحراف معیار ریشه دوم آن در واحدهای اصلی است، و دامنه بین چارکی پراکندگی نیمه میانی دادههای مرتب شده است.
Scope
این مدخل به معیارهای اصلی پراکندگی — دامنه، واریانس، انحراف معیار و دامنه بین چارکی — و نحوه محاسبه و تفسیر هر یک میپردازد. این مدخل انحراف معیار را از خطای معیار متمایز میکند و یک مرجع روششناختی است، نه راهنمای بالینی.
Core questions
- مشاهدات چقدر حول مرکز خود پراکنده میشوند؟
- کدام معیار پراکندگی به طور مناسب با معیار مکان انتخاب شده جفت میشود؟
- انحراف معیار چه تفاوتی با خطای معیار دارد؟
Key concepts
- دامنه
- واریانس
- انحراف معیار
- دامنه بین چارکی
- ضریب تغییرات
- انحراف معیار در مقابل خطای معیار
- جفت کردن پراکندگی با گرایش مرکزی
Mechanisms
دامنه، یعنی فاصله بین مقادیر حدی، ساده اما ناپایدار است زیرا تنها به دو مقدار بستگی دارد و با افزایش حجم نمونه رشد میکند. واریانس میانگین مجذور انحرافات مشاهدات از میانگین را محاسبه میکند، و انحراف معیار آن کمیت را به واحدهای اندازهگیری اصلی بازمیگرداند، که آن را به همراه طبیعی میانگین برای دادههای تقریباً متقارن تبدیل میکند. دامنه بین چارکی، که از صدک ۲۵ تا ۷۵ را در بر میگیرد، نیمه میانی دادهها را توصیف میکند و در برابر دادههای پرت مقاوم است، که آن را به همراه میانه برای توزیعهای چولگیدار تبدیل میکند. یک منبع مکرر سردرگمی، تفاوت بین انحراف معیار است که پراکندگی مشاهدات فردی را توصیف میکند، و خطای معیار است که دقت یک برآورد مانند میانگین را توصیف میکند و با افزایش حجم نمونه کاهش مییابد.
Clinical relevance
معیارهای پراکندگی به خوانندگان میگویند که یک اندازهگیری یا پیامد چقدر متغیر است، که برای قضاوت در مورد سازگاری، دامنههای مرجع و دقت برآوردهای گزارششده اهمیت دارد. این مدخل نحوه خلاصهسازی تغییرپذیری را برای ارزیابی توصیف میکند و مبنایی برای تصمیمگیریهای تشخیصی یا درمانی فردی نیست.
Epidemiology
گزارش تغییرپذیری در کنار گرایش مرکزی یک انتظار اساسی در تحقیقات سلامت است، و تمایز انحراف معیار در مقابل خطای معیار یک خطای رایج در گزارشدهی است: اشتباه گرفتن آنها میتواند برآوردها را دقیقتر یا کمتر دقیق از آنچه هستند نشان دهد. دامنه بین چارکی زمانی که دادهها چولگیدار هستند ترجیح داده میشود.
History
واریانس و انحراف معیار در اواخر قرن نوزدهم و اوایل قرن بیستم رسمی شدند، با اصطلاح انحراف معیار که توسط کارل پیرسون معرفی شد و چارچوب تحلیلی واریانس که توسط رونالد فیشر توسعه یافت. دامنه بین چارکی مبتنی بر چارک، با ظهور تحلیل دادههای اکتشافی و نمودار جعبهای در قرن بیستم اهمیت یافت.
Debates
- انحراف معیار یا خطای معیار در گزارشدهی؟
- نویسندگان اغلب خطای معیار را به جای انحراف معیار گزارش میکنند زیرا از نظر عددی کوچکتر است، که میتواند خوانندگان را در مورد تغییرپذیری مشاهدات زیربنایی گمراه کند؛ راهنماییهای روششناختی بر گزارش انحراف معیار برای توصیف پراکندگی و اختصاص خطای معیار برای دقت برآوردها تأکید دارند.
Key figures
- Douglas G. Altman
- J. Martin Bland
- S. Manikandan
Related topics
Seminal works
- manikandan-2011-dispersion
- altman-bland-2005
Frequently asked questions
- تفاوت بین انحراف معیار و خطای معیار چیست؟
- انحراف معیار میزان تغییر مشاهدات فردی را حول میانگین توصیف میکند، در حالی که خطای معیار دقت برآورد خود میانگین را توصیف میکند. خطای معیار با افزایش حجم نمونه کاهش مییابد؛ انحراف معیار اینگونه نیست.
- چه زمانی باید از دامنه بین چارکی به جای انحراف معیار استفاده کرد؟
- هنگامی که دادهها چولگیدار هستند یا شامل دادههای پرت هستند، دامنه بین چارکی پراکندگی را با دقت بیشتری توصیف میکند زیرا، مانند میانه، تحت تأثیر مقادیر حدی قرار نمیگیرد.