خطاهای نوع اول و نوع دوم
خطاهای نوع اول و نوع دوم دو روشی هستند که یک آزمون فرضیه میتواند به نتیجه اشتباه برسد. خطای نوع اول یک مثبت کاذب است – رد کردن یک فرضیه صفر صحیح و ادعای وجود اثری که وجود ندارد – در حالی که خطای نوع دوم یک منفی کاذب است – عدم شناسایی یک اثر واقعی. سطح معنیداری نرخ خطاهای نوع اول را کنترل میکند و مکمل نرخ خطای نوع دوم، توان آماری است، بنابراین این دو نوع خطا چارچوبی را برای چگونگی تعادل طراحی مطالعه بین خطرات ادعاهای بیش از حد و کمتر از حد فراهم میکنند.
Definition
خطای نوع اول رد یک فرضیه صفر است که در واقع صحیح است (یک مثبت کاذب)، که با احتمال آلفا رخ میدهد؛ خطای نوع دوم عدم رد یک فرضیه صفر است که در واقع غلط است (یک منفی کاذب)، که با احتمال بتا رخ میدهد.
Scope
این موضوع دو نوع خطا را تعریف میکند، آنها را به سطح معنیداری (آلفا) و نرخ خطای نوع دوم (بتا) مرتبط میسازد و مبادله بین آنها را در طراحی مطالعه توضیح میدهد. این یک روش مرجع برای ارزیابی و برنامهریزی مطالعات است، نه یک قاعده تصمیمگیری بالینی.
Core questions
- معنای نتیجهگیری مثبت کاذب در مقابل منفی کاذب چیست؟
- سطح معنیداری و نرخ خطای نوع دوم چگونه با این خطاها مرتبط هستند؟
- چرا کاهش یک نرخ خطا میتواند دیگری را افزایش دهد؟
- اندازه نمونه چگونه بر احتمال هر خطا تأثیر میگذارد؟
Key concepts
- خطای نوع اول (مثبت کاذب)
- خطای نوع دوم (منفی کاذب)
- سطح معنیداری (آلفا)
- نرخ خطای نوع دوم (بتا)
- توان به عنوان ۱ منهای بتا
- مبادله خطا
- آزمونهای متعدد و افزایش مثبتهای کاذب
Mechanisms
در طرح نیمن-پیرسون، یک آزمون با تعیین نرخ خطای نوع اول قابل تحمل (آلفا، سطح معنیداری) از پیش طراحی میشود، که تعیین میکند هر چند وقت یک بار یک فرضیه صفر صحیح به اشتباه رد خواهد شد. نرخ خطای نوع دوم (بتا) احتمال از دست دادن یک اثر واقعی با اندازه مشخص است، و یک منهای بتا توان آزمون است. برای یک اندازه نمونه ثابت، دو نرخ خطا با هم مبادله میشوند: سختگیرانهتر کردن آزمون برای کاهش مثبتهای کاذب، احتمال منفیهای کاذب را افزایش میدهد و بالعکس. افزایش اندازه نمونه راه اصلی برای کاهش همزمان هر دو است. آزمون فرضیههای متعدد بدون تنظیم، نرخ خطای نوع اول کلی را افزایش میدهد، به همین دلیل چندگانگی یک نگرانی مکرر در طراحی است.
Clinical relevance
این انواع خطا نشان میدهند که چگونه نتایج کارآزماییها و مطالعات مشاهدهای میتوانند گمراهکننده باشند: یک یافته مثبت کاذب ممکن است یک مداخله بیاثر را ترویج کند، در حالی که یک یافته منفی کاذب ممکن است یک مداخله مفید را نادیده بگیرد. بررسی اینکه آیا یک مطالعه نرخ خطاهای خود را کنترل کرده است – و اینکه آیا یک نتیجه صفر صرفاً نشاندهنده توان پایین است – برای ارزیابی شواهد اساسی است. این مدخل خطاهای استنباطی را توضیح میدهد و مبنایی برای تصمیمات بالینی فردی نیست.
Evidence & guidelines
تفاسیر روششناختی تأکید میکنند که یک نتیجه غیرمعنیدار اثبات عدم وجود اثر نیست، زیرا مطالعات با توان پایین خطاهای نوع دوم را محتمل میسازند؛ یادداشت آلتمن و بلاند مبنی بر اینکه عدم وجود شواهد، شواهد عدم وجود نیست، این نکته را به طور مستقیم بیان میکند. بررسیهای تحقیقات با توان پایین، مانند تحلیل باتن و همکارانش در علوم اعصاب، نشان میدهد که چگونه توان پایین هم منفیهای کاذب را افزایش میدهد و هم قابلیت اطمینان یافتههای معنیدار را کاهش میدهد.
History
تمایز بین خطاهای نوع اول و دوم توسط نیمن و پیرسون در فرمولبندی آنها در سال ۱۹۳۳ از آزمون فرضیه معرفی شد، که طراحی آزمون را به عنوان کنترل این دو احتمال خطا تعریف کرد. پیامدهای عملی – به ویژه خطرات خطای نوع دوم در مطالعات کوچک – به یک موضوع مکرر در انتقادات روششناختی قرن بیستم و بیست و یکم از تحقیقات سلامت و رفتاری تبدیل شد.
Debates
- تفسیر نتایج غیرمعنیدار
- از آنجا که مطالعات با توان پایین اغلب مرتکب خطاهای نوع دوم میشوند، یک یافته غیرمعنیدار اغلب به اشتباه به عنوان عدم وجود اثر تفسیر میشود؛ روششناسان تأکید میکنند که عدم وجود شواهد، شواهد عدم وجود نیست.
Key figures
- Jerzy Neyman
- Egon Pearson
- Douglas G. Altman
- J. Martin Bland
- John P. A. Ioannidis
Related topics
Seminal works
- neyman-pearson-1933
- altman-bland-1995
Frequently asked questions
- تفاوت بین خطای نوع اول و خطای نوع دوم چیست؟
- خطای نوع اول یک مثبت کاذب است – نتیجهگیری مبنی بر وجود اثر در حالی که اثری وجود ندارد – و خطای نوع دوم یک منفی کاذب است – از دست دادن یک اثر واقعی. احتمالات آنها به ترتیب آلفا و بتا نامیده میشوند.
- چرا نمیتوانم هر دو نرخ خطا را تا حد امکان کوچک کنم؟
- برای یک اندازه نمونه ثابت، این دو با هم مبادله میشوند: سختگیرانهتر کردن آزمون برای کاهش مثبتهای کاذب، منفیهای کاذب را افزایش میدهد. راه اصلی برای کاهش همزمان هر دو، افزایش اندازه نمونه است.