تفاوت بین برآورد و آزمون فرضیه چیست؟

برآورد میپرسد که یک کمیت نامعلوم چقدر بزرگ است و چقدر دقیق آن را میدانیم، و یک برآورد نقطهای و یک فاصله تولید میکند؛ آزمون فرضیه میپرسد که آیا دادهها با یک ادعای مشخص سازگار هستند یا خیر و یک تصمیم یا مقدار پی را به دست میدهد. آنها دیدگاههای مکملی از یک آمار اساسی واحد هستند.

چرا استنباط آماری اصلاً ضروری است؟

زیرا ما تقریباً هرگز یک جامعه کامل را مشاهده نمیکنیم؛ ما با نمونهای کار میکنیم که به طور تصادفی متغیر است، بنابراین به روشهای رسمی برای جداسازی سیگنال از تغییرپذیری نمونهگیری و برای افزودن عدم قطعیت صادقانه به نتایج خود نیاز داریم.

برآورد و استنباط آماری

برآورد و استنباط آماری شاخه‌ای از آمار زیستی است که به نتیجه‌گیری درباره یک جامعه از یک نمونه متغیر و محدود می‌پردازد. این حوزه سازوکارهای رسمی را برای دو وظیفه مکمل فراهم می‌کند: برآورد مقادیر نامعلوم (مانند میانگین، نسبت، یا اثر درمان) همراه با حاشیه عدم قطعیت، و آزمون اینکه آیا داده‌های مشاهده‌شده با یک فرضیه بیان‌شده سازگار هستند یا خیر. این ابزارها در کنار هم، داده‌های خام مطالعه را به اظهارات کمی و آگاه از عدم قطعیت درباره جهان تبدیل می‌کنند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics

Tools & resources

دریافت اسلایدها

Learn & explore

ویدیوبه‌زودی

Definition

استنباط آماری فرآیند استفاده از نمونه‌ای از مشاهدات، همراه با یک مدل احتمالی برای چگونگی بروز آن مشاهدات، برای برآورد پارامترهای جامعه و کمی‌سازی عدم قطعیت یا آزمون فرضیه‌ها درباره آن پارامترها است.

Scope

این حوزه خواننده را با ایده‌های اصلی که در تحقیقات سلامت تکرار می‌شوند آشنا می‌کند: برآورد نقطه‌ای و فاصله‌ای، فواصل اطمینان، چارچوب آزمون فرضیه، دو نوع خطای تصمیم‌گیری که می‌تواند تولید کند، و توان آماری و اندازه نمونه مورد نیاز برای تشخیص قابل اعتماد اثرات. این موارد به عنوان موضوعات مرجع روش‌شناختی برای ارزیابی و طراحی مطالعات در نظر گرفته می‌شوند، نه به عنوان قوانین تصمیم‌گیری بالینی.

Sub-topics

Core questions

بهترین برآورد منفرد ما از یک کمیت نامعلوم جامعه چیست و چقدر نامطمئن است؟
چه دامنه‌ای از مقادیر به طور معقولی با داده‌های مشاهده‌شده سازگار است؟
آیا داده‌ها با یک فرضیه صفر مشخص سازگار هستند، یا شواهدی علیه آن ارائه می‌دهند؟
برای تشخیص یک اثر با اندازه معین و با نرخ خطای قابل قبول، به چه اندازه نمونه‌ای نیاز است؟

Key concepts

پارامتر جامعه در مقابل آماره نمونه
توزیع نمونه‌گیری و خطای استاندارد
برآورد نقطه‌ای
برآورد فاصله‌ای و فاصله اطمینان
فرضیه‌های صفر و جایگزین
مقدار پی (P value)
خطای نوع اول و نوع دوم
توان آماری
تعیین اندازه نمونه

Key theories

نظریه تصمیم نیمن-پیرسون: آزمون فرضیه را به عنوان تصمیمی بین دو فرضیه که توسط نرخ‌های خطای بلندمدت کنترل‌شده اداره می‌شوند، چارچوب‌بندی کرد و مفاهیم رسمی خطای نوع اول و نوع دوم و قوی‌ترین آزمون برای یک سطح معناداری ثابت را معرفی نمود.
پارادایم برآورد همراه با عدم قطعیت: استدلال می‌کند که گزارش برآوردهای اثر با فواصل اطمینان، اطلاعات بیشتری نسبت به یک حکم معناداری صرف منتقل می‌کند و تأکید را از اینکه آیا یک اثر وجود دارد به اینکه چقدر می‌تواند بزرگ باشد، تغییر می‌دهد.

Mechanisms

استنباط بر یک مدل احتمالی که داده‌ها را به پارامترهای نامعلوم پیوند می‌دهد و بر ایده توزیع نمونه‌گیری (sampling distribution) استوار است: پراکندگی برآوردها که در نمونه‌های تکراری ایجاد می‌شود. برآورد، آن توزیع نمونه‌گیری را به عنوان یک برآورد نقطه‌ای به علاوه معیاری از دقت (خطای استاندارد) خلاصه می‌کند که سپس به یک فاصله تبدیل می‌شود. آزمون فرضیه، همین توزیع را به عنوان یک مسئله تصمیم‌گیری بازسازی می‌کند، داده‌های مشاهده‌شده را با آنچه فرضیه صفر پیش‌بینی می‌کند مقایسه می‌کند و احتمال نتایج مثبت کاذب و منفی کاذب را کنترل می‌کند. مقادیر پی (P values) و فواصل اطمینان دو روی یک محاسبه اساسی هستند و هر دو اغلب به اشتباه تفسیر می‌شوند، بنابراین تعریف دقیق اهمیت دارد.

Clinical relevance

تقریباً هر یافته کمی در ادبیات سلامت – نسبت خطر، تفاوت میانگین، رقم دقت تشخیصی – یک گزاره استنباطی است که عدم قطعیت را به همراه دارد. بنابراین، درک برآورد و استنباط برای خواندن و ارزیابی شواهد، و برای قضاوت در مورد اینکه آیا یک اثر گزارش‌شده دقیق، معقول و به اندازه کافی قدرتمند است، حیاتی است. این حوزه نحوه تولید و تفسیر چنین شواهدی را توصیف می‌کند؛ مبنایی برای تصمیمات تشخیصی یا درمانی فردی نیست.

Evidence & guidelines

نهادهای حرفه‌ای راهنمایی‌های صریحی را برای مهار سوءاستفاده‌های رایج از آمار استنباطی صادر کرده‌اند. بیانیه انجمن آمار آمریکا در سال ۲۰۱۶ در مورد مقادیر پی، اصول تفسیر صحیح آنها را بیان کرد، و یک راهنمای همراه توسط گرینلند و همکاران، بیست و پنج سوءتفسیر رایج از مقادیر پی، فواصل اطمینان و توان را فهرست می‌کند. درخواست قبلی گاردنر و آلتمن برای ترجیح فواصل اطمینان بر مقادیر پی صرف، کنوانسیون‌های گزارش‌دهی در مجلات پزشکی را شکل داد.

History

استنباط مدرن از دو سنت تا حدی رقیب در اوایل قرن بیستم رشد کرد: آزمون معناداری و مقادیر پی فیشر، و چارچوب آزمون نظریه تصمیم که نیمن و پیرسون در سال ۱۹۳۳ آن را رسمی کردند. فاصله اطمینان، که عمدتاً به نیمن نیز مربوط می‌شود، دیدگاهی مکمل و برآورد محور را ارائه داد. در طول اواخر قرن بیستم، آمارشناسان و اپیدمیولوژیست‌ها به طور فزاینده‌ای از اتکای مکانیکی به آستانه‌های معناداری انتقاد کردند، که در نهایت منجر به بیانیه‌های احتیاطی رسمی از سوی جامعه آماری در دهه ۲۰۱۰ شد.

Debates

آزمون معناداری در مقابل برآورد: یک بحث طولانی‌مدت این سوال را مطرح می‌کند که آیا احکام معناداری دوگانه گمراه‌کننده هستند یا خیر، و بسیاری از روش‌شناسان استدلال می‌کنند که برآوردهای اثر و فواصل اطمینان باید بر آستانه‌های مقدار پی اولویت داشته باشند.

Key figures

Jerzy Neyman
Egon Pearson
Ronald A. Fisher
Douglas G. Altman
Sander Greenland

Seminal works

neyman-pearson-1933
gardner-altman-1986
wasserstein-lazar-2016

Frequently asked questions

تفاوت بین برآورد و آزمون فرضیه چیست؟: برآورد می‌پرسد که یک کمیت نامعلوم چقدر بزرگ است و چقدر دقیق آن را می‌دانیم، و یک برآورد نقطه‌ای و یک فاصله تولید می‌کند؛ آزمون فرضیه می‌پرسد که آیا داده‌ها با یک ادعای مشخص سازگار هستند یا خیر و یک تصمیم یا مقدار پی را به دست می‌دهد. آنها دیدگاه‌های مکملی از یک آمار اساسی واحد هستند.
چرا استنباط آماری اصلاً ضروری است؟: زیرا ما تقریباً هرگز یک جامعه کامل را مشاهده نمی‌کنیم؛ ما با نمونه‌ای کار می‌کنیم که به طور تصادفی متغیر است، بنابراین به روش‌های رسمی برای جداسازی سیگنال از تغییرپذیری نمونه‌گیری و برای افزودن عدم قطعیت صادقانه به نتایج خود نیاز داریم.