توزیعهای نمونهبرداری و قضیه حد مرکزی
توزیع نمونهبرداری، توزیع احتمال یک آماره، مانند میانگین نمونه، در بین تمام نمونههای ممکن با اندازه معین است. قضیه حد مرکزی بیان میکند که برای نمونههای به اندازه کافی بزرگ، توزیع نمونهبرداری میانگین تقریباً نرمال است، صرفنظر از شکل دادههای زیربنایی. این دو مفهوم با هم توضیح میدهند که چرا فواصل اطمینان و آزمونهای مبتنی بر توزیع نرمال تا این حد کاربرد گستردهای دارند.
Definition
توزیع نمونهبرداری، توزیع مقادیری است که یک آماره در تمام نمونههای ممکن با اندازه ثابت از یک جامعه میگیرد؛ قضیه حد مرکزی بیان میکند که توزیع نمونهبرداری میانگین نمونه با افزایش اندازه نمونه، به یک توزیع نرمال نزدیک میشود، صرفنظر از شکل جامعه.
Scope
این مدخل به مفهوم توزیع نمونهبرداری، خطای استاندارد به عنوان پراکندگی آن، قضیه حد مرکزی و نقش اندازه نمونه، و تمایز بین انحراف معیار افراد و خطای استاندارد یک آماره میپردازد. این ایدهها را به فواصل اطمینان و آزمون فرضیه مرتبط میکند. این یک مرجع روششناختی است و نه راهنمای بالینی.
Core questions
- توزیع نمونهبرداری یک آماره چیست و چرا اهمیت دارد؟
- خطای استاندارد چگونه با انحراف معیار تفاوت دارد؟
- قضیه حد مرکزی چه چیزی را تضمین میکند و تحت چه شرایطی؟
- اندازه نمونه چگونه بر دقت یک برآورد تأثیر میگذارد؟
Key concepts
- آماره در مقابل پارامتر
- توزیع نمونهبرداری
- خطای استاندارد
- خطای استاندارد در مقابل انحراف معیار
- اندازه نمونه و دقت
- نرمال بودن تقریبی میانگین
- مبنای فواصل اطمینان و آزمونها
Key theories
- قضیه حد مرکزی
- برای مشاهدات مستقل از یک جامعه با واریانس محدود، توزیع میانگین نمونه با افزایش اندازه نمونه، به سمت یک توزیع نرمال میل میکند، صرفنظر از شکل جامعه؛ این امر استنباط مبتنی بر توزیع نرمال برای میانگینها را حتی زمانی که اندازهگیریهای فردی غیرنرمال هستند، توجیه میکند.
Mechanisms
اگر نمونههای مکرر با اندازه یکسان از یک جامعه گرفته شوند، یک آماره مانند میانگین از نمونهای به نمونه دیگر متفاوت خواهد بود؛ توزیع این مقادیر، توزیع نمونهبرداری است و انحراف معیار آن، خطای استاندارد است. برای میانگین نمونه، خطای استاندارد برابر است با انحراف معیار جامعه تقسیم بر ریشه دوم اندازه نمونه، بنابراین دقت با افزایش نمونهها بهبود مییابد، اما تنها با ریشه دوم n. قضیه حد مرکزی اضافه میکند که برای نمونههای به اندازه کافی بزرگ، این توزیع نمونهبرداری تقریباً نرمال است، حتی زمانی که خود دادهها چولگی دارند، مشروط بر اینکه مشاهدات مستقل باشند و واریانس محدود باشد. این موتور استنباط کلاسیک است: یک فاصله اطمینان برای میانگین با گام برداشتن تعدادی خطای استاندارد از برآورد تحت نرمال بودن تقریبی ساخته میشود، و بسیاری از آزمونهای فرضیه یک برآورد را با توزیع نمونهبرداری آن مقایسه میکنند. خطای استاندارد، که با اندازه نمونه کاهش مییابد، باید از انحراف معیار مشاهدات فردی، که پراکندگی جامعه را برآورد میکند و کاهش نمییابد، متمایز شود.
Clinical relevance
فواصل اطمینان و مقادیر p گزارش شده در مطالعات بالینی و بهداشت عمومی بر اساس توزیع نمونهبرداری برآورد و قضیه حد مرکزی استوار هستند، بنابراین درک آنها به قضاوت در مورد دقت اثرات گزارش شده کمک میکند. این مدخل پیشزمینه روششناختی است و مبنایی برای تصمیمگیریهای بالینی فردی نیست.
History
اشکال اولیه قضیه حد مرکزی در تقریب نرمال دو جملهای توسط دو موآور و در کار لاپلاس در حدود سال ۱۸۱۰ ظاهر شد، و شرایط کلی دقیق توسط لیاپانوف و دیگران در حدود سال ۱۹۰۰ برقرار شد. دیدگاه توزیع نمونهبرداری در اوایل قرن بیستم به محور استنباط تبدیل شد و همچنان توجیه استاندارد برای فواصل اطمینان و آزمونهای مبتنی بر توزیع نرمال در آمار زیستی است.
Debates
- اندازه نمونه برای اعمال قضیه حد مرکزی چقدر باید بزرگ باشد؟
- تقریب با اندازه نمونه بهبود مییابد، اما اینکه چقدر بزرگ کافی است بستگی به میزان چولگی دادهها دارد؛ برای توزیعهای به وضوح چولگیدار، نمونههای بسیار بزرگتری لازم است تا توزیع میانگین به طور قابل قبولی نرمال شود، بنابراین هیچ قانون سرانگشتی واحدی برای همه موارد مناسب نیست.
Key figures
- Pierre-Simon Laplace
- Abraham de Moivre
- Aleksandr Lyapunov
Related topics
Seminal works
- altman-bland-2005-se
- rosner-2015
Frequently asked questions
- تفاوت بین انحراف معیار و خطای استاندارد چیست؟
- انحراف معیار پراکندگی مشاهدات فردی را اندازهگیری میکند، در حالی که خطای استاندارد پراکندگی یک آماره، مانند میانگین نمونه، را در بین نمونهها اندازهگیری میکند؛ خطای استاندارد با افزایش اندازه نمونه کاهش مییابد، در حالی که انحراف معیار یک مقدار ثابت جامعه را برآورد میکند.
- چرا میتوانیم از توزیع نرمال برای میانگین استفاده کنیم حتی زمانی که دادهها چولگی دارند؟
- قضیه حد مرکزی بیان میکند که توزیع نمونهبرداری میانگین با افزایش اندازه نمونه، صرفنظر از شکل دادهها، تقریباً نرمال میشود، بنابراین روشهای مبتنی بر توزیع نرمال برای میانگین اغلب با نمونههای به اندازه کافی بزرگ معتبر هستند، حتی زمانی که مقادیر فردی به طور نرمال توزیع نشدهاند.