ScholarGate
دستیار

خطاهای نوع اول و نوع دوم

خطاهای نوع اول و نوع دوم دو روشی هستند که یک آزمون فرضیه می‌تواند به نتیجه اشتباه برسد. خطای نوع اول یک مثبت کاذب است – رد کردن یک فرضیه صفر صحیح و ادعای وجود اثری که وجود ندارد – در حالی که خطای نوع دوم یک منفی کاذب است – عدم شناسایی یک اثر واقعی. سطح معنی‌داری نرخ خطاهای نوع اول را کنترل می‌کند و مکمل نرخ خطای نوع دوم، توان آماری است، بنابراین این دو نوع خطا چارچوبی را برای چگونگی تعادل طراحی مطالعه بین خطرات ادعاهای بیش از حد و کمتر از حد فراهم می‌کنند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics
Tools & resources
دریافت اسلایدها
Learn & explore
ویدیوبه‌زودی

Definition

خطای نوع اول رد یک فرضیه صفر است که در واقع صحیح است (یک مثبت کاذب)، که با احتمال آلفا رخ می‌دهد؛ خطای نوع دوم عدم رد یک فرضیه صفر است که در واقع غلط است (یک منفی کاذب)، که با احتمال بتا رخ می‌دهد.

Scope

این موضوع دو نوع خطا را تعریف می‌کند، آنها را به سطح معنی‌داری (آلفا) و نرخ خطای نوع دوم (بتا) مرتبط می‌سازد و مبادله بین آنها را در طراحی مطالعه توضیح می‌دهد. این یک روش مرجع برای ارزیابی و برنامه‌ریزی مطالعات است، نه یک قاعده تصمیم‌گیری بالینی.

Core questions

  • معنای نتیجه‌گیری مثبت کاذب در مقابل منفی کاذب چیست؟
  • سطح معنی‌داری و نرخ خطای نوع دوم چگونه با این خطاها مرتبط هستند؟
  • چرا کاهش یک نرخ خطا می‌تواند دیگری را افزایش دهد؟
  • اندازه نمونه چگونه بر احتمال هر خطا تأثیر می‌گذارد؟

Key concepts

  • خطای نوع اول (مثبت کاذب)
  • خطای نوع دوم (منفی کاذب)
  • سطح معنی‌داری (آلفا)
  • نرخ خطای نوع دوم (بتا)
  • توان به عنوان ۱ منهای بتا
  • مبادله خطا
  • آزمون‌های متعدد و افزایش مثبت‌های کاذب

Mechanisms

در طرح نیمن-پیرسون، یک آزمون با تعیین نرخ خطای نوع اول قابل تحمل (آلفا، سطح معنی‌داری) از پیش طراحی می‌شود، که تعیین می‌کند هر چند وقت یک بار یک فرضیه صفر صحیح به اشتباه رد خواهد شد. نرخ خطای نوع دوم (بتا) احتمال از دست دادن یک اثر واقعی با اندازه مشخص است، و یک منهای بتا توان آزمون است. برای یک اندازه نمونه ثابت، دو نرخ خطا با هم مبادله می‌شوند: سخت‌گیرانه‌تر کردن آزمون برای کاهش مثبت‌های کاذب، احتمال منفی‌های کاذب را افزایش می‌دهد و بالعکس. افزایش اندازه نمونه راه اصلی برای کاهش همزمان هر دو است. آزمون فرضیه‌های متعدد بدون تنظیم، نرخ خطای نوع اول کلی را افزایش می‌دهد، به همین دلیل چندگانگی یک نگرانی مکرر در طراحی است.

Clinical relevance

این انواع خطا نشان می‌دهند که چگونه نتایج کارآزمایی‌ها و مطالعات مشاهده‌ای می‌توانند گمراه‌کننده باشند: یک یافته مثبت کاذب ممکن است یک مداخله بی‌اثر را ترویج کند، در حالی که یک یافته منفی کاذب ممکن است یک مداخله مفید را نادیده بگیرد. بررسی اینکه آیا یک مطالعه نرخ خطاهای خود را کنترل کرده است – و اینکه آیا یک نتیجه صفر صرفاً نشان‌دهنده توان پایین است – برای ارزیابی شواهد اساسی است. این مدخل خطاهای استنباطی را توضیح می‌دهد و مبنایی برای تصمیمات بالینی فردی نیست.

Evidence & guidelines

تفاسیر روش‌شناختی تأکید می‌کنند که یک نتیجه غیرمعنی‌دار اثبات عدم وجود اثر نیست، زیرا مطالعات با توان پایین خطاهای نوع دوم را محتمل می‌سازند؛ یادداشت آلتمن و بلاند مبنی بر اینکه عدم وجود شواهد، شواهد عدم وجود نیست، این نکته را به طور مستقیم بیان می‌کند. بررسی‌های تحقیقات با توان پایین، مانند تحلیل باتن و همکارانش در علوم اعصاب، نشان می‌دهد که چگونه توان پایین هم منفی‌های کاذب را افزایش می‌دهد و هم قابلیت اطمینان یافته‌های معنی‌دار را کاهش می‌دهد.

History

تمایز بین خطاهای نوع اول و دوم توسط نیمن و پیرسون در فرمول‌بندی آنها در سال ۱۹۳۳ از آزمون فرضیه معرفی شد، که طراحی آزمون را به عنوان کنترل این دو احتمال خطا تعریف کرد. پیامدهای عملی – به ویژه خطرات خطای نوع دوم در مطالعات کوچک – به یک موضوع مکرر در انتقادات روش‌شناختی قرن بیستم و بیست و یکم از تحقیقات سلامت و رفتاری تبدیل شد.

Debates

تفسیر نتایج غیرمعنی‌دار
از آنجا که مطالعات با توان پایین اغلب مرتکب خطاهای نوع دوم می‌شوند، یک یافته غیرمعنی‌دار اغلب به اشتباه به عنوان عدم وجود اثر تفسیر می‌شود؛ روش‌شناسان تأکید می‌کنند که عدم وجود شواهد، شواهد عدم وجود نیست.

Key figures

  • Jerzy Neyman
  • Egon Pearson
  • Douglas G. Altman
  • J. Martin Bland
  • John P. A. Ioannidis

Related topics

Seminal works

  • neyman-pearson-1933
  • altman-bland-1995

Frequently asked questions

تفاوت بین خطای نوع اول و خطای نوع دوم چیست؟
خطای نوع اول یک مثبت کاذب است – نتیجه‌گیری مبنی بر وجود اثر در حالی که اثری وجود ندارد – و خطای نوع دوم یک منفی کاذب است – از دست دادن یک اثر واقعی. احتمالات آنها به ترتیب آلفا و بتا نامیده می‌شوند.
چرا نمی‌توانم هر دو نرخ خطا را تا حد امکان کوچک کنم؟
برای یک اندازه نمونه ثابت، این دو با هم مبادله می‌شوند: سخت‌گیرانه‌تر کردن آزمون برای کاهش مثبت‌های کاذب، منفی‌های کاذب را افزایش می‌دهد. راه اصلی برای کاهش همزمان هر دو، افزایش اندازه نمونه است.

Methods for this concept

Related concepts