تقييم خطر التحيز
تقييم خطر التحيز هو التقييم المنظم لمدى احتمالية أن يكون تصميم الدراسة وإجراؤها والإبلاغ عنها قد شوّه نتائجها بعيدًا عن الحقيقة. على عكس التسلسل الهرمي للأدلة، الذي يصنف التصميمات بشكل عام، فإنه يحكم على دراسة فردية، متسائلاً عما إذا كانت ميزات مثل كيفية تخصيص المشاركين، وإخفائهم، والاحتفاظ بهم، وتحليلهم قد تكون قد أدت إلى تحيز التأثير المقدر.
Definition
تقييم خطر التحيز هو تقييم قائم على المجالات للصلاحية الداخلية لدراسة فردية، يحكم لكل مجال ذي صلة عما إذا كانت العيوب في التصميم أو الإجراء أو الإبلاغ من المرجح أن تكون قد أنتجت خطأً منهجيًا في التأثير المقدر.
Scope
يتناول هذا المدخل مفهوم التحيز كخطأ منهجي، والمجالات القياسية التي يتم تقييمها في الدراسات العشوائية وغير العشوائية، والأدوات الرئيسية التي تستخدمها كوكرين لإصدار هذه الأحكام. وهو مرجع منهجي لتقييم مستوى الدراسة، وليس إرشادات سريرية.
Key concepts
- التحيز كخطأ منهجي (وليس عشوائي)
- الصلاحية الداخلية
- تحيز الاختيار / العشوائية وإخفاء التخصيص
- تحيز الأداء والكشف / التعمية
- تحيز الاستنزاف / بيانات النتائج غير المكتملة
- تحيز الإبلاغ / الإبلاغ الانتقائي عن النتائج
- الحكم القائم على المجالات (خطر منخفض / بعض المخاوف أو غير واضح / مرتفع)
- الارتباك في الدراسات غير العشوائية
Mechanisms
يتم التقييم حسب المجالات، حيث يمثل كل مجال مسارًا يمكن أن يدخل من خلاله الخطأ المنهجي. في التجارب العشوائية، تشمل هذه المجالات عملية العشوائية، والانحرافات عن التدخلات المقصودة، والبيانات المفقودة للنتائج، وقياس النتائج، واختيار النتائج المبلغ عنها؛ ولكل منها، يحكم المراجع على الخطر بأنه منخفض، أو يثير بعض القلق (أو غير واضح)، أو مرتفع، وغالبًا ما يسترشد بأسئلة إرشادية ويصل إلى حكم عام. تضيف الدراسات غير العشوائية للتدخلات الارتباك واختيار المشاركين كمجالات مركزية، حيث إن هذه هي التهديدات السائدة بدون العشوائية. والناتج هو تقييم شفاف وقابل للتكرار يغذي تجميع الأدلة وتقييم اليقين بدلاً من درجة ملخص واحدة.
Clinical relevance
توضح أحكام خطر التحيز سبب اختلاف ترجيح دراستين لنفس السؤال وسبب إمكانية تخفيض مستوى مجموعة من الأدلة بسبب قيود الدراسة. وتساعد القراء على معرفة ما إذا كانت النتيجة من المرجح أن تعكس تأثيرًا حقيقيًا أو نتاجًا لكيفية إجراء الدراسة؛ ويصف المدخل منهجية التقييم وليس أساسًا للقرارات السريرية الفردية.
Evidence & guidelines
أداة كوكرين لتقييم خطر التحيز (هيغينز وآخرون، 2011) قامت بتوحيد التقييم القائم على المجالات للتجارب العشوائية وتم استبدالها بأداة RoB 2 (ستيرن وآخرون، 2019)، التي أعادت هيكلة المجالات وأضافت أسئلة إرشادية. وقد وسعت أداة ROBINS-I (ستيرن وآخرون، 2016) هذا النهج ليشمل الدراسات غير العشوائية للتدخلات، مع التركيز على الارتباك والاختيار. في نظام GRADE، يعتبر خطر التحيز على مستوى الدراسة هو العامل الأول الذي يمكن أن يخفض يقين مجموعة من الأدلة (غايات وآخرون، 2008).
History
اعتمدت درجات جودة التجارب في الثمانينيات والتسعينيات على مقاييس رقمية تباينت مكوناتها وأوزانها بشكل كبير. حولت مؤسسة كوكرين التقييم نحو حكم صريح قائم على المجالات باستخدام أداة خطر التحيز لعام 2011، مع إعطاء الأولوية للشفافية على الدرجات الملخصة. قامت أداة RoB 2 (2019) بتحسين مجالات التجارب العشوائية وقدمت أسئلة إرشادية، بينما قدمت أداة ROBINS-I (2016) إطارًا موازيًا يركز على الارتباك للدراسات غير العشوائية.
Debates
- الحكم القائم على المجالات مقابل درجات الجودة الرقمية
- يمكن أن تحجب درجات الجودة المركبة العيوب المحددة التي تهم ومدى أهميتها، لذا تفضل الأدوات الحديثة الأحكام الشفافة لكل مجال؛ ويلاحظ النقاد أن أحكام المجالات لا تزال تتطلب قرارات ذاتية ويمكن أن تختلف بين المقيمين.
Key figures
- Julian Higgins
- Jonathan Sterne
- Douglas Altman
- Miguel Hernan
Related topics
Seminal works
- higgins-2011-robtool
- sterne-2019-rob2
- sterne-2016-robinsi
Frequently asked questions
- كيف يختلف خطر التحيز عن التسلسل الهرمي للأدلة؟
- يصنف التسلسل الهرمي التصميمات بشكل عام حسب قابليتها النموذجية للتحيز، في حين أن تقييم خطر التحيز يقيم مدى جودة إجراء دراسة معينة بالفعل، لذلك يمكن لتصميم عالي التصنيف أن يحمل خطر تحيز مرتفع.
- لماذا تراجعت درجات الجودة الرقمية؟
- تجمع الدرجات المركبة ميزات غير مرتبطة في رقم واحد وتخفي العيوب التي تدفع النتيجة؛ بدلاً من ذلك، تصدر الأدوات القائمة على المجالات حكمًا منفصلاً وشفافًا لكل مصدر محتمل للتحيز.