قبل از اینکه بتوانم حجم نمونه را محاسبه کنم به چه اطلاعاتی نیاز دارم؟

حداقل سطح معنیداری (اغلب 0.05)، توان مطلوب (اغلب 80% یا 90%)، کوچکترین اثری که ارزش تشخیص دارد، و تخمینی از واریانس پیامد یا نرخ رویداد پایه؛ برای برنامهریزی همچنین باید سهمی برای ریزش مورد انتظار اضافه کنید.

چرا یک مطالعه میتواند هم خیلی بزرگ و هم خیلی کوچک باشد؟

یک مطالعه با توان ناکافی ممکن است یک اثر واقعی را از دست بدهد، اما یک مطالعه بیجهت بزرگ، شرکتکنندگان اضافی را در معرض رویههای مطالعه قرار میدهد و منابع را بدون بهبود پاسخ مصرف میکند، بنابراین هدف یک اندازه مناسب است، نه صرفاً یک اندازه بزرگ.

محاسبه حجم نمونه

محاسبه حجم نمونه روشی است برای تعیین اینکه یک مطالعه برای پاسخ به سؤال خود با قابلیت اطمینان قابل قبول به چند شرکت‌کننده نیاز دارد. با ترکیب اندازه اثر هدف، نرخ مثبت کاذب پذیرفته‌شده، توان مطلوب و واریانس مورد انتظار پیامد، تعداد افراد مورد نیاز را به دست می‌دهد تا یک اثر واقعی به احتمال زیاد شناسایی شود و یک یافته تصادفی به احتمال زیاد با یک اثر واقعی اشتباه گرفته نشود. این یک گام برنامه‌ریزی است که یک سؤال پژوهشی را به یک هدف جذب مشخص تبدیل می‌کند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics

Tools & resources

دریافت اسلایدها

Learn & explore

ویدیوبه‌زودی

Definition

محاسبه حجم نمونه، تعداد شرکت‌کنندگان مورد نیاز برای تشخیص یک اندازه اثر از پیش تعیین‌شده با توان آماری انتخابی (معمولاً 80% یا 90%) در یک سطح معنی‌داری انتخابی (معمولاً دوطرفه 0.05) را، با توجه به واریانس مورد انتظار پیامد، تعیین می‌کند.

Scope

این مدخل منطق و اجزای محاسبه حجم نمونه، نقش‌های سطح معنی‌داری و توان آماری، تأثیر اندازه اثر و واریانس پیامد، و تنظیمات برای افت پیش‌بینی‌شده را پوشش می‌دهد. این موضوع حجم نمونه را به عنوان یک موضوع برنامه‌ریزی روش‌شناختی در طراحی مطالعه، از جمله استفاده از آن در کارآزمایی‌ها و مطالعات مشاهده‌ای، بررسی می‌کند و فرمول‌های عددی را به عنوان دستورالعمل‌های بالینی ارائه نمی‌دهد.

Key concepts

سطح معنی‌داری (آلفا) و خطای نوع I
توان آماری و خطای نوع II (بتا)
اندازه اثر و حداقل تفاوت بالینی مهم
واریانس پیامد (واریانس یا نرخ رویداد)
نسبت تخصیص بین گروه‌ها
افزایش برای ریزش مورد انتظار
حجم نمونه مطالعات پایلوت و امکان‌سنجی

Mechanisms

یک محاسبه چهار کمیت را به هم مرتبط می‌کند به طوری که تعیین هر سه، چهارمی را مشخص می‌کند: سطح معنی‌داری، توان آماری، اندازه اثر قابل تشخیص، و واریانس پیامد. اثرات هدف کوچک‌تر، واریانس پیامد بیشتر، توان بالاتر، و سطوح معنی‌داری سخت‌گیرانه‌تر، همگی تعداد افراد مورد نیاز را افزایش می‌دهند. برای پیامدهای پیوسته، واریانس مربوطه انحراف معیار است؛ برای پیامدهای دودویی، نرخ رویداد در هر گروه است. سپس تعداد برنامه‌ریزی‌شده برای جبران تلفات مورد انتظار در پیگیری افزایش می‌یابد تا نمونه تحلیل‌شده توان کافی را حفظ کند. مطالعات پایلوت به جای اندازه اثر، امکان‌سنجی و واریانس را تخمین می‌زنند و از قوانین اندازه‌گیری جداگانه استفاده می‌کنند.

Clinical relevance

یک مطالعه با حجم نمونه کافی به احتمال زیاد پاسخ قابل اعتمادی ارائه می‌دهد، در حالی که یک مطالعه با توان ناکافی خطر از دست دادن اثرات واقعی را دارد و یک مطالعه بی‌جهت بزرگ، شرکت‌کنندگان اضافی را بدون فایده در معرض قرار می‌دهد؛ بنابراین، ارزیابی اینکه آیا یک مطالعه به طور مناسب اندازه‌گیری شده است، بخشی از قضاوت در مورد شواهد آن است. این مدخل یک روش برنامه‌ریزی پژوهشی را توصیف می‌کند و مبنایی برای تصمیمات بالینی فردی نیست.

Evidence & guidelines

استانداردهای گزارش‌دهی ایجاب می‌کنند که حجم نمونه و مفروضات پشت آن بیان شود: CONSORT 2010 از کارآزمایی‌ها می‌خواهد که نحوه تعیین حجم نمونه، از جمله اثر هدف، توان و سطح معنی‌داری را گزارش کنند. بررسی‌های روش‌شناختی نشان می‌دهند که محاسبات گزارش‌شده اغلب به طور ناقص توجیه می‌شوند، و کارهای اختصاصی در مورد مطالعات پایلوت و امکان‌سنجی (به عنوان مثال رویکردهای سرانگشتی و فاصله اطمینان) به چگونگی اندازه‌گیری مطالعات فاز اولیه که هدفشان تخمین است نه آزمون فرضیه، می‌پردازند.

History

استدلال حجم نمونه با پذیرش چارچوب نیمن-پیرسون، با نرخ‌های خطای نوع I و نوع II صریح آن، در اواسط قرن بیستم، به یک روال تبدیل شد و نقش رسمی به توان در برنامه‌ریزی داد. متون استاندارد آمار پزشکی در اواخر قرن بیستم محاسبات را برای محققان بالینی قابل دسترس ساختند، و دستورالعمل‌های گزارش‌دهی مانند CONSORT بعداً ایجاب کردند که محاسبه و مفروضات آن افشا شود. کارهای اخیرتر نحوه اندازه‌گیری مطالعات پایلوت و امکان‌سنجی را اصلاح کرده‌اند و آنها را از کارآزمایی‌های قطعی متمایز ساخته‌اند.

Debates

اندازه اثر هدف چگونه باید انتخاب شود؟: محاسبات به اثر مفروض حساس هستند، و انتخاب یک اثر بزرگ خوش‌بینانه برای توجیه یک نمونه کوچک (که گاهی اوقات رقص سامبای حجم نمونه نامیده می‌شود) می‌تواند یک مطالعه را برای یک تفاوت بالینی معنی‌دار با توان ناکافی مواجه کند؛ اثر باید کوچک‌ترین تفاوتی را که ارزش تشخیص دارد منعکس کند نه آنچه که جذب را راحت می‌کند.
یک مطالعه پایلوت یا امکان‌سنجی چقدر باید بزرگ باشد؟: از آنجا که مطالعات پایلوت با هدف ارزیابی امکان‌سنجی و تخمین واریانس انجام می‌شوند نه آزمون فرضیه، آنها با قوانین سرانگشتی یا استدلال مبتنی بر دقت اندازه‌گیری می‌شوند تا استدلال مبتنی بر توان، و اندازه مناسب همچنان یک حوزه فعال کار روش‌شناختی است.

Key figures

Kenneth Schulz
David Grimes
Douglas Altman
Steven Julious
Michael Campbell

Seminal works

schulz-grimes-2005-sampsize
moher-2010-consort-ss
altman-1991-textbook

Frequently asked questions

قبل از اینکه بتوانم حجم نمونه را محاسبه کنم به چه اطلاعاتی نیاز دارم؟: حداقل سطح معنی‌داری (اغلب 0.05)، توان مطلوب (اغلب 80% یا 90%)، کوچک‌ترین اثری که ارزش تشخیص دارد، و تخمینی از واریانس پیامد یا نرخ رویداد پایه؛ برای برنامه‌ریزی همچنین باید سهمی برای ریزش مورد انتظار اضافه کنید.
چرا یک مطالعه می‌تواند هم خیلی بزرگ و هم خیلی کوچک باشد؟: یک مطالعه با توان ناکافی ممکن است یک اثر واقعی را از دست بدهد، اما یک مطالعه بی‌جهت بزرگ، شرکت‌کنندگان اضافی را در معرض رویه‌های مطالعه قرار می‌دهد و منابع را بدون بهبود پاسخ مصرف می‌کند، بنابراین هدف یک اندازه مناسب است، نه صرفاً یک اندازه بزرگ.