فواصل اطمینان
فاصله اطمینان، دامنهای از مقادیر محتمل برای یک کمیت نامعلوم جامعه است که از دادههای نمونه محاسبه میشود، به طوری که روش مورد استفاده برای ساخت آن، مقدار واقعی را در نسبت مشخصی از زمان – معمولاً ۹۵٪ – در نمونههای تکراری در بر میگیرد. این فاصله هم بزرگی یک تخمین و هم عدم قطعیت پیرامون آن را در یک خلاصه واحد و پرکاربرد بیان میکند و به روش ترجیحی برای ارائه تخمینهای اثر در علوم بهداشتی تبدیل شده است.
Definition
فاصله اطمینان، یک بازه است که از دادههای نمونه با یک روش تعریفشده در یک سطح اطمینان مشخص محاسبه میشود، به طوری که این روش پارامتر واقعی جامعه را در آن نسبت مشخص از نمونههای تکراری فرضی در بر میگیرد.
Scope
این موضوع توضیح میدهد که فاصله اطمینان چیست، سطح اطمینان آن چگونه باید تفسیر شود، چگونه عرض فاصله نشاندهنده دقت و اندازه نمونه است، و برداشتهای نادرست رایج از این مفهوم کدامند. این مطلب به عنوان یک روش مرجع برای ارزیابی و گزارشدهی تحقیقات ارائه شده است، نه به عنوان یک قاعده تصمیمگیری بالینی.
Core questions
- چه دامنهای از مقادیر برای پارامتر به طور معقولی با دادهها سازگار است؟
- سطح اطمینان واقعاً چه چیزی را تضمین میکند؟
- چگونه اندازه نمونه و تغییرپذیری، عرض فاصله را تعیین میکنند؟
- فاصله اطمینان چه ارتباطی با آزمون فرضیه یا p-value دارد؟
Key concepts
- سطح اطمینان
- احتمال پوشش
- عرض و دقت فاصله
- حدود پایین و بالای اطمینان
- تفسیر فراوانیگرایانه
- ارتباط با مقدار صفر
- فواصل دقیق در مقابل فواصل تقریبی
Mechanisms
فاصله اطمینان معمولاً با گرفتن یک تخمین نقطهای و گسترش آن با ضریبی از خطای استاندارد آن تشکیل میشود، که این ضریب توسط سطح اطمینان مطلوب و توزیع نمونهگیری مربوطه تعیین میگردد. ویژگی تعریفکننده فراوانیگرایانه (frequentist) پوشش است: اگر مطالعه بارها تکرار شود، فواصل ساخته شده به این روش، پارامتر واقعی را در نسبت مشخصی از تکرارها در بر خواهند داشت. این فاصله با افزایش اندازه نمونه یا کاهش تغییرپذیری، باریکتر میشود، بنابراین عرض آن نشانگر مستقیمی از دقت است. یک میانبر رایج، فواصل را به آزمونها مرتبط میکند – اگر یک فاصله ۹۵٪ برای یک تفاوت، مقدار صفر را شامل نشود، آزمون دوطرفه مربوطه در سطح ۵٪ معنیدار است – اما فاصله با نشان دادن کل دامنه مقادیر سازگار، اطلاعات بیشتری را منتقل میکند. یک خطای رایج این است که سطح اطمینان را به عنوان احتمال اینکه مقدار واقعی درون یک فاصله خاص قرار دارد، تفسیر کنیم، که تعریف فراوانیگرایانه از آن پشتیبانی نمیکند.
Clinical relevance
فواصل اطمینان، اکثر تخمینهای اثر را در گزارشهای بالینی و اپیدمیولوژیک همراهی میکنند و به خوانندگان اجازه میدهند تا نه تنها وجود یک اثر، بلکه بزرگی و دقت تخمین آن را نیز قضاوت کنند. یک فاصله وسیع، حتی زمانی که یک تخمین نقطهای چشمگیر به نظر میرسد، نشاندهنده یک مطالعه غیرقطعی است. این مدخل نحوه ساخت و تفسیر فواصل را توضیح میدهد و مبنایی برای تصمیمات تشخیصی یا درمانی فردی نیست.
Evidence & guidelines
دستورالعملهای گزارشدهی و قراردادهای تحریریه در پزشکی اکنون به طور معمول انتظار دارند که تخمینهای اثر با فواصل اطمینان ارائه شوند. بیانیه انجمن آمار آمریکا در مورد p-valueها و راهنمای سوءتفسیر توسط گرینلند و همکاران، هر دو بر تفسیر صحیح فواصل در کنار p-valueها تأکید دارند، که بر اساس حمایت قبلی گاردنر و آلتمن برای گزارشدهی مبتنی بر فاصله بنا شده است.
History
فاصله اطمینان توسط یرزی نیمن در دهه ۱۹۳۰ به عنوان یک رویکرد فراوانیگرایانه برای تخمین بازهای معرفی شد، با ساختارهای دقیق اولیه مانند حدود کلوپر-پیرسون برای نسبت دوجملهای که در سال ۱۹۳۴ ظاهر شدند. استفاده معمول از آن در پزشکی بعدها در قرن بیستم، به ویژه با استدلال گاردنر و آلتمن در سال ۱۹۸۶ برای گزارشدهی فواصل به جای p-valueهای صرف، که قراردادهای مجلات را تغییر داد، رواج یافت.
Debates
- سوءتفسیر سطح اطمینان
- سطح اطمینان عملکرد بلندمدت روش ساخت فاصله را توصیف میکند، نه احتمال اینکه یک فاصله محاسبهشده خاص حاوی مقدار واقعی باشد؛ این تمایز به طور گستردهای اشتباه فهمیده میشود و منبع مکرر خطا است.
Key figures
- Jerzy Neyman
- Egon Pearson
- Martin J. Gardner
- Douglas G. Altman
- Sander Greenland
Related topics
Seminal works
- clopper-pearson-1934
- gardner-altman-1986
Frequently asked questions
- آیا فاصله اطمینان ۹۵٪ به این معنی است که ۹۵٪ احتمال دارد مقدار واقعی درون آن باشد؟
- خیر. طبق تعریف فراوانیگرایانه، مقدار واقعی ثابت است و ۹۵٪ به نسبت بلندمدت چنین فواصلی اشاره دارد که به همین روش در نمونههای تکراری ساخته شدهاند و مقدار واقعی را در بر میگیرند – نه احتمال برای یک فاصله خاص.
- چه چیزی باعث باریک یا وسیع شدن فاصله اطمینان میشود؟
- عمدتاً اندازه نمونه و تغییرپذیری: نمونههای بزرگتر و دادههای کمتر متغیر، فواصل باریکتر و دقیقتری را ارائه میدهند، در حالی که مطالعات کوچک یا پرنویز، فواصل وسیعی تولید میکنند که نشاندهنده عدم قطعیت است.