توزیع نرمال
توزیع نرمال که توزیع گاوسی یا منحنی زنگولهای نیز نامیده میشود، یک توزیع پیوسته است که نسبت به میانگین خود متقارن بوده و به طور کامل توسط میانگین و انحراف معیار آن توصیف میشود. این توزیع مهمترین توزیع در آمار زیستی است، زیرا بسیاری از اندازهگیریها به آن نزدیک میشوند و میانگینهای نمونهای به سمت آن گرایش دارند، که آن را اساس بیشتر استنباطهای استاندارد قرار میدهد.
Definition
توزیع نرمال یک توزیع احتمال پیوسته با چگالی متقارن و زنگولهای شکل است که به طور کامل توسط دو پارامتر، میانگین (مرکز) و انحراف معیار (پراکندگی) آن تعیین میشود.
Scope
این مدخل به شکل و پارامترهای توزیع نرمال، قانون تجربی مربوط به انحرافات معیار و پوشش، توزیع نرمال استاندارد و نمرات z، محدودههای مرجع، و تمایز بین توزیع نرمال افراد و توزیع نرمال میانگینهای نمونه میپردازد. این یک مرجع روششناختی است و آستانههای بالینی برای بیماران منفرد ارائه نمیدهد.
Core questions
- توزیع نرمال چه شکلی دارد و چه چیزی آن را تعیین میکند؟
- چه مقدار از توزیع در تعداد معینی از انحرافات معیار قرار میگیرد؟
- نمره z چیست و استانداردسازی چگونه کار میکند؟
- چه زمانی فرض نرمال بودن مناسب است؟
Key concepts
- میانگین و انحراف معیار
- تقارن و شکل زنگولهای
- قانون تجربی (۶۸-۹۵-۹۹.۷)
- توزیع نرمال استاندارد
- نمره z و استانداردسازی
- محدوده مرجع
- کجی و انحراف از نرمال بودن
Mechanisms
یک توزیع نرمال توسط دو عدد ثابت میشود: میانگین، که مرکز آن را مشخص میکند، و انحراف معیار، که عرض آن را تعیین میکند. تقریباً ۶۸٪ از مقادیر در یک انحراف معیار از میانگین قرار میگیرند، حدود ۹۵٪ در دو انحراف معیار، و حدود ۹۹.۷٪ در سه انحراف معیار — این قانون تجربی است که کاربرد عملی توزیع را فراهم میکند. هر متغیر نرمال را میتوان با کم کردن میانگین و تقسیم بر انحراف معیار استانداردسازی کرد تا یک نمره z به دست آید که از توزیع نرمال استاندارد (میانگین ۰، انحراف معیار ۱) پیروی میکند، که به یک مجموعه واحد از جداول یا فرمولها اجازه میدهد تا برای همه توزیعهای نرمال استفاده شود. در تحقیقات پزشکی، محدودههای مرجع برای اندازهگیریهایی مانند مقادیر خونی اغلب از ۹۵٪ مرکزی یک توزیع نرمال مفروض ساخته میشوند، و بسیاری از آزمونهای آماری فرض میکنند که دادهها یا توزیع نمونهگیری یک آماره تقریباً نرمال است.
Clinical relevance
بسیاری از اندازهگیریهای بیولوژیکی تحت فرض نرمال بودن تقریبی خلاصه و مقایسه میشوند، و محدودههای مرجع اغلب از آن ساخته میشوند، بنابراین درک این توزیع به تفسیر نتایج آزمایشگاهی و مطالعات کمک میکند. این مدخل توزیع را به عنوان یک روششناسی توصیف میکند و نقاط برش تشخیصی برای افراد تعیین نمیکند.
History
منحنی زنگولهای در قرن هجدهم از تقریب دو موآور به توزیع دوجملهای پدید آمد و توسط لاپلاس و گاوس توسعه یافت، که دومی از آن در تحلیل خطای اندازهگیری استفاده کرد، به همین دلیل اغلب توزیع گاوسی نامیده میشود. در طول قرنهای نوزدهم و بیستم، این مدل به مدل پیشفرض برای مقادیر بیولوژیکی اندازهگیری شده و سنگ بنای استنباط آماری کلاسیک تبدیل شد.
Debates
- چه زمانی فرض نرمال بودن گمراهکننده است؟
- بسیاری از متغیرهای بیولوژیکی به جای متقارن بودن، کج هستند، و در نظر گرفتن آنها به عنوان نرمال میتواند محدودههای مرجع و آزمونها را تحریف کند؛ اینکه آیا دادهها را تبدیل کنیم، از روشهای بدون توزیع استفاده کنیم، یا برای میانگینها به قضیه حد مرکزی تکیه کنیم، یک قضاوت روششناختی مکرر است.
Key figures
- Carl Friedrich Gauss
- Pierre-Simon Laplace
- Abraham de Moivre
Related topics
Seminal works
- altman-bland-1995-normal
- rosner-2015
Frequently asked questions
- قانون ۶۸-۹۵-۹۹.۷ چیست؟
- برای یک توزیع نرمال، حدود ۶۸٪ از مقادیر در یک انحراف معیار از میانگین، حدود ۹۵٪ در دو انحراف معیار، و حدود ۹۹.۷٪ در سه انحراف معیار قرار میگیرند؛ این قانون تجربی انحراف معیار را مستقیماً به نسبت مقادیر پوشش داده شده مرتبط میکند.
- آیا دادهها برای استفاده از توزیع نرمال در استنباط باید به طور نرمال توزیع شده باشند؟
- همیشه نه؛ بسیاری از روشها به توزیع نمونهگیری میانگین که طبق قضیه حد مرکزی تقریباً نرمال است، متکی هستند، که حتی زمانی که اندازهگیریهای فردی به طور نرمال توزیع نشدهاند، میتواند برقرار باشد، مشروط بر اینکه نمونه به اندازه کافی بزرگ باشد.