محاسبه حجم نمونه
محاسبه حجم نمونه روشی است برای تعیین اینکه یک مطالعه برای پاسخ به سؤال خود با قابلیت اطمینان قابل قبول به چند شرکتکننده نیاز دارد. با ترکیب اندازه اثر هدف، نرخ مثبت کاذب پذیرفتهشده، توان مطلوب و واریانس مورد انتظار پیامد، تعداد افراد مورد نیاز را به دست میدهد تا یک اثر واقعی به احتمال زیاد شناسایی شود و یک یافته تصادفی به احتمال زیاد با یک اثر واقعی اشتباه گرفته نشود. این یک گام برنامهریزی است که یک سؤال پژوهشی را به یک هدف جذب مشخص تبدیل میکند.
Definition
محاسبه حجم نمونه، تعداد شرکتکنندگان مورد نیاز برای تشخیص یک اندازه اثر از پیش تعیینشده با توان آماری انتخابی (معمولاً 80% یا 90%) در یک سطح معنیداری انتخابی (معمولاً دوطرفه 0.05) را، با توجه به واریانس مورد انتظار پیامد، تعیین میکند.
Scope
این مدخل منطق و اجزای محاسبه حجم نمونه، نقشهای سطح معنیداری و توان آماری، تأثیر اندازه اثر و واریانس پیامد، و تنظیمات برای افت پیشبینیشده را پوشش میدهد. این موضوع حجم نمونه را به عنوان یک موضوع برنامهریزی روششناختی در طراحی مطالعه، از جمله استفاده از آن در کارآزماییها و مطالعات مشاهدهای، بررسی میکند و فرمولهای عددی را به عنوان دستورالعملهای بالینی ارائه نمیدهد.
Key concepts
- سطح معنیداری (آلفا) و خطای نوع I
- توان آماری و خطای نوع II (بتا)
- اندازه اثر و حداقل تفاوت بالینی مهم
- واریانس پیامد (واریانس یا نرخ رویداد)
- نسبت تخصیص بین گروهها
- افزایش برای ریزش مورد انتظار
- حجم نمونه مطالعات پایلوت و امکانسنجی
Mechanisms
یک محاسبه چهار کمیت را به هم مرتبط میکند به طوری که تعیین هر سه، چهارمی را مشخص میکند: سطح معنیداری، توان آماری، اندازه اثر قابل تشخیص، و واریانس پیامد. اثرات هدف کوچکتر، واریانس پیامد بیشتر، توان بالاتر، و سطوح معنیداری سختگیرانهتر، همگی تعداد افراد مورد نیاز را افزایش میدهند. برای پیامدهای پیوسته، واریانس مربوطه انحراف معیار است؛ برای پیامدهای دودویی، نرخ رویداد در هر گروه است. سپس تعداد برنامهریزیشده برای جبران تلفات مورد انتظار در پیگیری افزایش مییابد تا نمونه تحلیلشده توان کافی را حفظ کند. مطالعات پایلوت به جای اندازه اثر، امکانسنجی و واریانس را تخمین میزنند و از قوانین اندازهگیری جداگانه استفاده میکنند.
Clinical relevance
یک مطالعه با حجم نمونه کافی به احتمال زیاد پاسخ قابل اعتمادی ارائه میدهد، در حالی که یک مطالعه با توان ناکافی خطر از دست دادن اثرات واقعی را دارد و یک مطالعه بیجهت بزرگ، شرکتکنندگان اضافی را بدون فایده در معرض قرار میدهد؛ بنابراین، ارزیابی اینکه آیا یک مطالعه به طور مناسب اندازهگیری شده است، بخشی از قضاوت در مورد شواهد آن است. این مدخل یک روش برنامهریزی پژوهشی را توصیف میکند و مبنایی برای تصمیمات بالینی فردی نیست.
Evidence & guidelines
استانداردهای گزارشدهی ایجاب میکنند که حجم نمونه و مفروضات پشت آن بیان شود: CONSORT 2010 از کارآزماییها میخواهد که نحوه تعیین حجم نمونه، از جمله اثر هدف، توان و سطح معنیداری را گزارش کنند. بررسیهای روششناختی نشان میدهند که محاسبات گزارششده اغلب به طور ناقص توجیه میشوند، و کارهای اختصاصی در مورد مطالعات پایلوت و امکانسنجی (به عنوان مثال رویکردهای سرانگشتی و فاصله اطمینان) به چگونگی اندازهگیری مطالعات فاز اولیه که هدفشان تخمین است نه آزمون فرضیه، میپردازند.
History
استدلال حجم نمونه با پذیرش چارچوب نیمن-پیرسون، با نرخهای خطای نوع I و نوع II صریح آن، در اواسط قرن بیستم، به یک روال تبدیل شد و نقش رسمی به توان در برنامهریزی داد. متون استاندارد آمار پزشکی در اواخر قرن بیستم محاسبات را برای محققان بالینی قابل دسترس ساختند، و دستورالعملهای گزارشدهی مانند CONSORT بعداً ایجاب کردند که محاسبه و مفروضات آن افشا شود. کارهای اخیرتر نحوه اندازهگیری مطالعات پایلوت و امکانسنجی را اصلاح کردهاند و آنها را از کارآزماییهای قطعی متمایز ساختهاند.
Debates
- اندازه اثر هدف چگونه باید انتخاب شود؟
- محاسبات به اثر مفروض حساس هستند، و انتخاب یک اثر بزرگ خوشبینانه برای توجیه یک نمونه کوچک (که گاهی اوقات رقص سامبای حجم نمونه نامیده میشود) میتواند یک مطالعه را برای یک تفاوت بالینی معنیدار با توان ناکافی مواجه کند؛ اثر باید کوچکترین تفاوتی را که ارزش تشخیص دارد منعکس کند نه آنچه که جذب را راحت میکند.
- یک مطالعه پایلوت یا امکانسنجی چقدر باید بزرگ باشد؟
- از آنجا که مطالعات پایلوت با هدف ارزیابی امکانسنجی و تخمین واریانس انجام میشوند نه آزمون فرضیه، آنها با قوانین سرانگشتی یا استدلال مبتنی بر دقت اندازهگیری میشوند تا استدلال مبتنی بر توان، و اندازه مناسب همچنان یک حوزه فعال کار روششناختی است.
Key figures
- Kenneth Schulz
- David Grimes
- Douglas Altman
- Steven Julious
- Michael Campbell
Related topics
Seminal works
- schulz-grimes-2005-sampsize
- moher-2010-consort-ss
- altman-1991-textbook
Frequently asked questions
- قبل از اینکه بتوانم حجم نمونه را محاسبه کنم به چه اطلاعاتی نیاز دارم؟
- حداقل سطح معنیداری (اغلب 0.05)، توان مطلوب (اغلب 80% یا 90%)، کوچکترین اثری که ارزش تشخیص دارد، و تخمینی از واریانس پیامد یا نرخ رویداد پایه؛ برای برنامهریزی همچنین باید سهمی برای ریزش مورد انتظار اضافه کنید.
- چرا یک مطالعه میتواند هم خیلی بزرگ و هم خیلی کوچک باشد؟
- یک مطالعه با توان ناکافی ممکن است یک اثر واقعی را از دست بدهد، اما یک مطالعه بیجهت بزرگ، شرکتکنندگان اضافی را در معرض رویههای مطالعه قرار میدهد و منابع را بدون بهبود پاسخ مصرف میکند، بنابراین هدف یک اندازه مناسب است، نه صرفاً یک اندازه بزرگ.