توان آماری و حجم نمونه
توان آماری، احتمال اینکه یک مطالعه اثری با اندازه معین را در صورت وجود واقعی آن اثر تشخیص دهد، است – به طور رسمی، یک منهای نرخ خطای نوع دوم. تعیین حجم نمونه، گام برنامهریزی است که مشخص میکند برای دستیابی به توان هدف، با توجه به اندازه اثر مورد انتظار، سطح معنیداری انتخاب شده و تغییرپذیری دادهها، به چند شرکتکننده نیاز است. این دو با هم تصمیم میگیرند که آیا یک مطالعه به اندازه کافی بزرگ است تا شانس عادلانهای برای پاسخ به سؤال خود داشته باشد یا خیر.
Definition
توان آماری، احتمال اینکه یک آزمون به درستی یک فرضیه صفر نادرست را رد کند (یک اثر واقعی با اندازه مشخص را تشخیص دهد) است؛ تعیین حجم نمونه، محاسبه تعداد مشاهدات مورد نیاز برای دستیابی به توان هدف در یک سطح معنیداری معین برای اندازه اثر و تغییرپذیری مفروض است.
Scope
این موضوع توضیح میدهد که توان به چه معناست، چهار کمیت در هم تنیده یک محاسبه توان (اندازه اثر، سطح معنیداری، توان و حجم نمونه)، و پیامدهای تحقیقات کمتوان. این مطلب به عنوان یک روش مرجع برای برنامهریزی و ارزیابی مطالعات ارائه شده است، نه به عنوان یک قاعده تصمیمگیری بالینی.
Core questions
- مطالعه چقدر احتمال دارد اثری را که به دنبال آن است، تشخیص دهد؟
- برای رسیدن به توان هدف، به چند شرکتکننده نیاز است؟
- اندازه اثر، تغییرپذیری و سطح معنیداری چگونه حجم نمونه را تعیین میکنند؟
- چه اتفاقی میافتد وقتی یک مطالعه کمتوان است؟
Key concepts
- توان آماری (1 منهای بتا)
- اندازه اثر
- سطح معنیداری (آلفا)
- تغییرپذیری و انحراف معیار
- محاسبه حجم نمونه پیشینی
- مطالعه کمتوان
- حداقل تفاوت بالینی مهم
Mechanisms
توان، سطح معنیداری، اندازه اثر و حجم نمونه به گونهای به هم مرتبط هستند که با ثابت کردن هر سه، چهارمی تعیین میشود. برای یک سطح معنیداری معین، توان با افزایش اندازه اثر واقعی، کاهش تغییرپذیری و افزایش حجم نمونه، بالا میرود. محاسبه حجم نمونه این رابطه را معکوس میکند: با شروع از یک اندازه اثر مفروض (اغلب حداقل ارزشی که ارزش تشخیص دارد)، یک سطح معنیداری انتخاب شده، و یک توان هدف – معمولاً 80% یا 90% – تعداد مشاهدات مورد نیاز را حل میکند. کمتوانی نه تنها شانس از دست دادن اثرات واقعی را افزایش میدهد (خطای نوع دوم)، بلکه احتمال اغراقآمیز یا نادرست بودن یافتههای معنیدار را نیز بیشتر میکند، زیرا تنها برآوردهای بزرگ و احتمالاً متورم در یک مطالعه کوچک از آستانه عبور میکنند.
Clinical relevance
اینکه یک کارآزمایی یا مطالعه به اندازه کافی توانمند بوده است یا خیر، نحوه خوانش نتایج آن را شکل میدهد: یک نتیجه غیرمعنیدار از یک مطالعه کمتوان، عمدتاً غیر آموزنده است تا اطمینانبخش، و توجیه پیشینی حجم نمونه یک عنصر مورد انتظار در گزارشدهی مطالعات است. این مدخل، استدلال توان و حجم نمونه را برای اهداف ارزیابی و طراحی توصیف میکند و مبنایی برای تصمیمات تشخیصی یا درمانی فردی نیست.
Evidence & guidelines
استانداردهای گزارشدهی برای کارآزماییهای بالینی و مطالعات مشاهدهای، توجیه حجم نمونه پیشینی را انتظار دارند، و بررسیهای روششناختی آسیبهای گسترده توان پایین را مستند کردهاند. باتن و همکاران نشان دادند که حوزههایی که به طور مزمن کمتوان هستند، ادبیات غیرقابل اعتمادی را تولید میکنند، در حالی که آلتمن و بلاند و راهنمای سوءتفسیر گرینلند و همکاران تأکید میکنند که توان پایین بسیاری از نتایج پوچ غیر آموزنده را توضیح میدهد.
History
توان، نتیجه مستقیم چارچوب آزمون نیمن-پیرسون است که نرخ خطای نوع دوم را تعریف کرد که توان مکمل آن است. کار جیکوب کوهن از دهه 1960 به بعد، که در تکنگاری او در سال 1988 تثبیت شد، تحلیل توان سیستماتیک و قراردادهای اندازه اثر را در علوم بهداشتی و رفتاری رواج داد. نگرانی در مورد تحقیقات کمتوان در بحثهای تکرارپذیری دهه 2010 تشدید شد.
Debates
- پیامدهای کمتوانی مزمن
- توان پایین مداوم نه تنها منفیهای کاذب را افزایش میدهد، بلکه احتمال اینکه یک یافته آماری معنیدار منعکسکننده یک اثر واقعی باشد را کاهش میدهد و اندازه آنهایی را که گزارش میشوند، اغراق میکند و قابلیت اطمینان کل ادبیات را تضعیف مینماید.
Key figures
- Jacob Cohen
- Jerzy Neyman
- Egon Pearson
- Douglas G. Altman
- John P. A. Ioannidis
Related topics
Seminal works
- cohen-1988
- button-2013
Frequently asked questions
- توان آماری به زبان ساده چیست؟
- این احتمال است که یک مطالعه، اثر واقعی با اندازه معین را در صورت وجود واقعی آن اثر، تشخیص دهد. توان بالاتر به معنای شانس بهتر برای از دست ندادن یک اثر واقعی است؛ 80% توان یک هدف رایج است.
- چرا حجم نمونه اینقدر اهمیت دارد؟
- نمونههای بزرگتر توان را افزایش میدهند و دقت برآوردها را محدود میکنند، بنابراین یک مطالعه میتواند اثری را که به دنبال آن است، به طور قابل اعتمادی تشخیص دهد. نمونه بسیار کوچک خطر از دست دادن اثرات واقعی و تولید یافتههای معنیدار اغراقآمیز را به همراه دارد.