ScholarGate
دستیار

توزیع‌های نمونه‌برداری و قضیه حد مرکزی

توزیع نمونه‌برداری، توزیع احتمال یک آماره، مانند میانگین نمونه، در بین تمام نمونه‌های ممکن با اندازه معین است. قضیه حد مرکزی بیان می‌کند که برای نمونه‌های به اندازه کافی بزرگ، توزیع نمونه‌برداری میانگین تقریباً نرمال است، صرف‌نظر از شکل داده‌های زیربنایی. این دو مفهوم با هم توضیح می‌دهند که چرا فواصل اطمینان و آزمون‌های مبتنی بر توزیع نرمال تا این حد کاربرد گسترده‌ای دارند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics
Tools & resources
دریافت اسلایدها
Learn & explore
ویدیوبه‌زودی

Definition

توزیع نمونه‌برداری، توزیع مقادیری است که یک آماره در تمام نمونه‌های ممکن با اندازه ثابت از یک جامعه می‌گیرد؛ قضیه حد مرکزی بیان می‌کند که توزیع نمونه‌برداری میانگین نمونه با افزایش اندازه نمونه، به یک توزیع نرمال نزدیک می‌شود، صرف‌نظر از شکل جامعه.

Scope

این مدخل به مفهوم توزیع نمونه‌برداری، خطای استاندارد به عنوان پراکندگی آن، قضیه حد مرکزی و نقش اندازه نمونه، و تمایز بین انحراف معیار افراد و خطای استاندارد یک آماره می‌پردازد. این ایده‌ها را به فواصل اطمینان و آزمون فرضیه مرتبط می‌کند. این یک مرجع روش‌شناختی است و نه راهنمای بالینی.

Core questions

  • توزیع نمونه‌برداری یک آماره چیست و چرا اهمیت دارد؟
  • خطای استاندارد چگونه با انحراف معیار تفاوت دارد؟
  • قضیه حد مرکزی چه چیزی را تضمین می‌کند و تحت چه شرایطی؟
  • اندازه نمونه چگونه بر دقت یک برآورد تأثیر می‌گذارد؟

Key concepts

  • آماره در مقابل پارامتر
  • توزیع نمونه‌برداری
  • خطای استاندارد
  • خطای استاندارد در مقابل انحراف معیار
  • اندازه نمونه و دقت
  • نرمال بودن تقریبی میانگین
  • مبنای فواصل اطمینان و آزمون‌ها

Key theories

قضیه حد مرکزی
برای مشاهدات مستقل از یک جامعه با واریانس محدود، توزیع میانگین نمونه با افزایش اندازه نمونه، به سمت یک توزیع نرمال میل می‌کند، صرف‌نظر از شکل جامعه؛ این امر استنباط مبتنی بر توزیع نرمال برای میانگین‌ها را حتی زمانی که اندازه‌گیری‌های فردی غیرنرمال هستند، توجیه می‌کند.

Mechanisms

اگر نمونه‌های مکرر با اندازه یکسان از یک جامعه گرفته شوند، یک آماره مانند میانگین از نمونه‌ای به نمونه دیگر متفاوت خواهد بود؛ توزیع این مقادیر، توزیع نمونه‌برداری است و انحراف معیار آن، خطای استاندارد است. برای میانگین نمونه، خطای استاندارد برابر است با انحراف معیار جامعه تقسیم بر ریشه دوم اندازه نمونه، بنابراین دقت با افزایش نمونه‌ها بهبود می‌یابد، اما تنها با ریشه دوم n. قضیه حد مرکزی اضافه می‌کند که برای نمونه‌های به اندازه کافی بزرگ، این توزیع نمونه‌برداری تقریباً نرمال است، حتی زمانی که خود داده‌ها چولگی دارند، مشروط بر اینکه مشاهدات مستقل باشند و واریانس محدود باشد. این موتور استنباط کلاسیک است: یک فاصله اطمینان برای میانگین با گام برداشتن تعدادی خطای استاندارد از برآورد تحت نرمال بودن تقریبی ساخته می‌شود، و بسیاری از آزمون‌های فرضیه یک برآورد را با توزیع نمونه‌برداری آن مقایسه می‌کنند. خطای استاندارد، که با اندازه نمونه کاهش می‌یابد، باید از انحراف معیار مشاهدات فردی، که پراکندگی جامعه را برآورد می‌کند و کاهش نمی‌یابد، متمایز شود.

Clinical relevance

فواصل اطمینان و مقادیر p گزارش شده در مطالعات بالینی و بهداشت عمومی بر اساس توزیع نمونه‌برداری برآورد و قضیه حد مرکزی استوار هستند، بنابراین درک آنها به قضاوت در مورد دقت اثرات گزارش شده کمک می‌کند. این مدخل پیش‌زمینه روش‌شناختی است و مبنایی برای تصمیم‌گیری‌های بالینی فردی نیست.

History

اشکال اولیه قضیه حد مرکزی در تقریب نرمال دو جمله‌ای توسط دو موآور و در کار لاپلاس در حدود سال ۱۸۱۰ ظاهر شد، و شرایط کلی دقیق توسط لیاپانوف و دیگران در حدود سال ۱۹۰۰ برقرار شد. دیدگاه توزیع نمونه‌برداری در اوایل قرن بیستم به محور استنباط تبدیل شد و همچنان توجیه استاندارد برای فواصل اطمینان و آزمون‌های مبتنی بر توزیع نرمال در آمار زیستی است.

Debates

اندازه نمونه برای اعمال قضیه حد مرکزی چقدر باید بزرگ باشد؟
تقریب با اندازه نمونه بهبود می‌یابد، اما اینکه چقدر بزرگ کافی است بستگی به میزان چولگی داده‌ها دارد؛ برای توزیع‌های به وضوح چولگی‌دار، نمونه‌های بسیار بزرگ‌تری لازم است تا توزیع میانگین به طور قابل قبولی نرمال شود، بنابراین هیچ قانون سرانگشتی واحدی برای همه موارد مناسب نیست.

Key figures

  • Pierre-Simon Laplace
  • Abraham de Moivre
  • Aleksandr Lyapunov

Related topics

Seminal works

  • altman-bland-2005-se
  • rosner-2015

Frequently asked questions

تفاوت بین انحراف معیار و خطای استاندارد چیست؟
انحراف معیار پراکندگی مشاهدات فردی را اندازه‌گیری می‌کند، در حالی که خطای استاندارد پراکندگی یک آماره، مانند میانگین نمونه، را در بین نمونه‌ها اندازه‌گیری می‌کند؛ خطای استاندارد با افزایش اندازه نمونه کاهش می‌یابد، در حالی که انحراف معیار یک مقدار ثابت جامعه را برآورد می‌کند.
چرا می‌توانیم از توزیع نرمال برای میانگین استفاده کنیم حتی زمانی که داده‌ها چولگی دارند؟
قضیه حد مرکزی بیان می‌کند که توزیع نمونه‌برداری میانگین با افزایش اندازه نمونه، صرف‌نظر از شکل داده‌ها، تقریباً نرمال می‌شود، بنابراین روش‌های مبتنی بر توزیع نرمال برای میانگین اغلب با نمونه‌های به اندازه کافی بزرگ معتبر هستند، حتی زمانی که مقادیر فردی به طور نرمال توزیع نشده‌اند.

Methods for this concept

Related concepts