برآورد و استنباط آماری
برآورد و استنباط آماری شاخهای از آمار زیستی است که به نتیجهگیری درباره یک جامعه از یک نمونه متغیر و محدود میپردازد. این حوزه سازوکارهای رسمی را برای دو وظیفه مکمل فراهم میکند: برآورد مقادیر نامعلوم (مانند میانگین، نسبت، یا اثر درمان) همراه با حاشیه عدم قطعیت، و آزمون اینکه آیا دادههای مشاهدهشده با یک فرضیه بیانشده سازگار هستند یا خیر. این ابزارها در کنار هم، دادههای خام مطالعه را به اظهارات کمی و آگاه از عدم قطعیت درباره جهان تبدیل میکنند.
Definition
استنباط آماری فرآیند استفاده از نمونهای از مشاهدات، همراه با یک مدل احتمالی برای چگونگی بروز آن مشاهدات، برای برآورد پارامترهای جامعه و کمیسازی عدم قطعیت یا آزمون فرضیهها درباره آن پارامترها است.
Scope
این حوزه خواننده را با ایدههای اصلی که در تحقیقات سلامت تکرار میشوند آشنا میکند: برآورد نقطهای و فاصلهای، فواصل اطمینان، چارچوب آزمون فرضیه، دو نوع خطای تصمیمگیری که میتواند تولید کند، و توان آماری و اندازه نمونه مورد نیاز برای تشخیص قابل اعتماد اثرات. این موارد به عنوان موضوعات مرجع روششناختی برای ارزیابی و طراحی مطالعات در نظر گرفته میشوند، نه به عنوان قوانین تصمیمگیری بالینی.
Sub-topics
Core questions
- بهترین برآورد منفرد ما از یک کمیت نامعلوم جامعه چیست و چقدر نامطمئن است؟
- چه دامنهای از مقادیر به طور معقولی با دادههای مشاهدهشده سازگار است؟
- آیا دادهها با یک فرضیه صفر مشخص سازگار هستند، یا شواهدی علیه آن ارائه میدهند؟
- برای تشخیص یک اثر با اندازه معین و با نرخ خطای قابل قبول، به چه اندازه نمونهای نیاز است؟
Key concepts
- پارامتر جامعه در مقابل آماره نمونه
- توزیع نمونهگیری و خطای استاندارد
- برآورد نقطهای
- برآورد فاصلهای و فاصله اطمینان
- فرضیههای صفر و جایگزین
- مقدار پی (P value)
- خطای نوع اول و نوع دوم
- توان آماری
- تعیین اندازه نمونه
Key theories
- نظریه تصمیم نیمن-پیرسون
- آزمون فرضیه را به عنوان تصمیمی بین دو فرضیه که توسط نرخهای خطای بلندمدت کنترلشده اداره میشوند، چارچوببندی کرد و مفاهیم رسمی خطای نوع اول و نوع دوم و قویترین آزمون برای یک سطح معناداری ثابت را معرفی نمود.
- پارادایم برآورد همراه با عدم قطعیت
- استدلال میکند که گزارش برآوردهای اثر با فواصل اطمینان، اطلاعات بیشتری نسبت به یک حکم معناداری صرف منتقل میکند و تأکید را از اینکه آیا یک اثر وجود دارد به اینکه چقدر میتواند بزرگ باشد، تغییر میدهد.
Mechanisms
استنباط بر یک مدل احتمالی که دادهها را به پارامترهای نامعلوم پیوند میدهد و بر ایده توزیع نمونهگیری (sampling distribution) استوار است: پراکندگی برآوردها که در نمونههای تکراری ایجاد میشود. برآورد، آن توزیع نمونهگیری را به عنوان یک برآورد نقطهای به علاوه معیاری از دقت (خطای استاندارد) خلاصه میکند که سپس به یک فاصله تبدیل میشود. آزمون فرضیه، همین توزیع را به عنوان یک مسئله تصمیمگیری بازسازی میکند، دادههای مشاهدهشده را با آنچه فرضیه صفر پیشبینی میکند مقایسه میکند و احتمال نتایج مثبت کاذب و منفی کاذب را کنترل میکند. مقادیر پی (P values) و فواصل اطمینان دو روی یک محاسبه اساسی هستند و هر دو اغلب به اشتباه تفسیر میشوند، بنابراین تعریف دقیق اهمیت دارد.
Clinical relevance
تقریباً هر یافته کمی در ادبیات سلامت – نسبت خطر، تفاوت میانگین، رقم دقت تشخیصی – یک گزاره استنباطی است که عدم قطعیت را به همراه دارد. بنابراین، درک برآورد و استنباط برای خواندن و ارزیابی شواهد، و برای قضاوت در مورد اینکه آیا یک اثر گزارششده دقیق، معقول و به اندازه کافی قدرتمند است، حیاتی است. این حوزه نحوه تولید و تفسیر چنین شواهدی را توصیف میکند؛ مبنایی برای تصمیمات تشخیصی یا درمانی فردی نیست.
Evidence & guidelines
نهادهای حرفهای راهنماییهای صریحی را برای مهار سوءاستفادههای رایج از آمار استنباطی صادر کردهاند. بیانیه انجمن آمار آمریکا در سال ۲۰۱۶ در مورد مقادیر پی، اصول تفسیر صحیح آنها را بیان کرد، و یک راهنمای همراه توسط گرینلند و همکاران، بیست و پنج سوءتفسیر رایج از مقادیر پی، فواصل اطمینان و توان را فهرست میکند. درخواست قبلی گاردنر و آلتمن برای ترجیح فواصل اطمینان بر مقادیر پی صرف، کنوانسیونهای گزارشدهی در مجلات پزشکی را شکل داد.
History
استنباط مدرن از دو سنت تا حدی رقیب در اوایل قرن بیستم رشد کرد: آزمون معناداری و مقادیر پی فیشر، و چارچوب آزمون نظریه تصمیم که نیمن و پیرسون در سال ۱۹۳۳ آن را رسمی کردند. فاصله اطمینان، که عمدتاً به نیمن نیز مربوط میشود، دیدگاهی مکمل و برآورد محور را ارائه داد. در طول اواخر قرن بیستم، آمارشناسان و اپیدمیولوژیستها به طور فزایندهای از اتکای مکانیکی به آستانههای معناداری انتقاد کردند، که در نهایت منجر به بیانیههای احتیاطی رسمی از سوی جامعه آماری در دهه ۲۰۱۰ شد.
Debates
- آزمون معناداری در مقابل برآورد
- یک بحث طولانیمدت این سوال را مطرح میکند که آیا احکام معناداری دوگانه گمراهکننده هستند یا خیر، و بسیاری از روششناسان استدلال میکنند که برآوردهای اثر و فواصل اطمینان باید بر آستانههای مقدار پی اولویت داشته باشند.
Key figures
- Jerzy Neyman
- Egon Pearson
- Ronald A. Fisher
- Douglas G. Altman
- Sander Greenland
Related topics
Seminal works
- neyman-pearson-1933
- gardner-altman-1986
- wasserstein-lazar-2016
Frequently asked questions
- تفاوت بین برآورد و آزمون فرضیه چیست؟
- برآورد میپرسد که یک کمیت نامعلوم چقدر بزرگ است و چقدر دقیق آن را میدانیم، و یک برآورد نقطهای و یک فاصله تولید میکند؛ آزمون فرضیه میپرسد که آیا دادهها با یک ادعای مشخص سازگار هستند یا خیر و یک تصمیم یا مقدار پی را به دست میدهد. آنها دیدگاههای مکملی از یک آمار اساسی واحد هستند.
- چرا استنباط آماری اصلاً ضروری است؟
- زیرا ما تقریباً هرگز یک جامعه کامل را مشاهده نمیکنیم؛ ما با نمونهای کار میکنیم که به طور تصادفی متغیر است، بنابراین به روشهای رسمی برای جداسازی سیگنال از تغییرپذیری نمونهگیری و برای افزودن عدم قطعیت صادقانه به نتایج خود نیاز داریم.