الانحدار اللوجستي
يُنمذج الانحدار اللوجستي احتمالية حدوث نتيجة ثنائية (نعم/لا) كدالة لواحد أو أكثر من المتنبئات. نظرًا لأن الاحتمالات محصورة بين 0 و 1، يعمل النموذج على مقياس لوغاريتم الأرجحية، بحيث يتوافق كل معامل مع تغيير في لوغاريتم الأرجحية ويتضاعف إلى نسبة أرجحية. إنها طريقة الانحدار القياسية للنتائج الثنائية في العلوم الصحية.
Definition
يُنمذج الانحدار اللوجستي لوغاريتم الأرجحية (اللوجيت) لنتيجة ثنائية كدالة خطية للمتنبئات، logit(P) = b0 + b1X1 + ... + bkXk، مع تقدير المعاملات بالاحتمالية القصوى بحيث يكون المعامل الأسي exp(bj) هو نسبة الأرجحية المعدلة للمتنبئ Xj.
Scope
يغطي هذا المدخل النموذج اللوجستي الثنائي: رابط اللوجيت وسبب استخدامه، وتفسير المعاملات كنسب أرجحية، وتقدير الاحتمالية القصوى، والتعديل للمتغيرات المربكة، والاعتبارات العملية لحجم العينة (الأحداث لكل متغير)، والفصل، وجودة الملاءمة. كما يشير إلى التمييز بين نسب الأرجحية ونسب المخاطر. إنه موضوع منهجي، وليس إرشادات سريرية.
Core questions
- لماذا يتم نمذجة النتيجة الثنائية على مقياس لوغاريتم الأرجحية بدلاً من نمذجتها مباشرة كاحتمالية؟
- كيف يتم تفسير معامل الانحدار اللوجستي كنسبة أرجحية؟
- كيف تُقدر المعاملات، وكيف يعدل النموذج للمتغيرات المربكة؟
- كم عدد أحداث النتيجة المطلوبة لكل متنبئ للحصول على تقديرات مستقرة؟
- متى تختلف نسبة الأرجحية بشكل مهم عن نسبة المخاطر؟
Key concepts
- دالة الربط اللوجيت (لوغاريتم الأرجحية)
- نسبة الأرجحية كـ exp(المعامل)
- تقدير الاحتمالية القصوى
- نسبة الأرجحية المعدلة مقابل الخام
- الأحداث لكل متغير
- الفصل والفصل شبه الكامل
- جودة الملاءمة والمعايرة
- نسبة الأرجحية مقابل نسبة المخاطر
Mechanisms
إن نمذجة الاحتمالية مباشرة باستخدام متنبئ خطي إشكالية لأن التنبؤات قد تقع خارج النطاق من 0 إلى 1؛ يحل رابط اللوجيت هذه المشكلة عن طريق تحويل الاحتمالية إلى لوغاريتم الأرجحية، وهو غير محدود ويتم نمذجته خطيًا. تُقدر المعاملات بالاحتمالية القصوى بدلاً من المربعات الصغرى، وكل معامل أسي هو نسبة الأرجحية التي تقارن أرجحية النتيجة لفرق وحدة واحدة في هذا المتنبئ مع ثبات المتغيرات الأخرى. يتطلب التقدير المستقر عددًا كافيًا من أحداث النتيجة بالنسبة لعدد المتنبئات؛ وقد تم فحص الإرشادات التقليدية التي تشير إلى حوالي عشرة أحداث لكل متغير وتم تخفيفها جزئيًا في أعمال لاحقة. عندما يفصل المتنبئ فئات النتائج بشكل مثالي، يفشل تقدير الاحتمالية القصوى العادي (الفصل)، وتعالج الأساليب العقابية ذلك. نظرًا لأن النموذج يقدر نسب الأرجحية، فإن هذه النسب يمكن أن تبالغ في تقدير نسبة المخاطر عندما تكون النتيجة شائعة، مما حفز على اتباع أساليب بديلة مثل انحدار بواسون المعدل لتقدير نسب المخاطر مباشرة.
Clinical relevance
يرتكز الانحدار اللوجستي على جزء كبير من نسب الأرجحية المعدلة ونماذج التشخيص والإنذار المبلغ عنها في الأبحاث السريرية والوبائية. إن فهم أن معاملاته هي نسب أرجحية، ومتى تختلف هذه النسب عن نسب المخاطر، أمر أساسي لتفسير هذه الدراسات. يصف هذا المدخل الطريقة وليس أساسًا لقرارات التشخيص أو العلاج الفردية.
Epidemiology
يُعد الانحدار اللوجستي التحليل الطبيعي لدراسات الحالات والشواهد، حيث تكون نسبة الأرجحية هي مقياس الارتباط القابل للتقدير، ويُستخدم على نطاق واسع في دراسات الأتراب والدراسات المقطعية للحصول على تقديرات تأثير معدلة للنتائج الثنائية. عندما تكون النتيجة شائعة في مجموعة، تختلف نسبة الأرجحية عن نسبة المخاطر، وقد يفضل المحللون طرقًا تقدر نسبة المخاطر مباشرة.
Evidence & guidelines
يُعد نص هوسمر، ليميشو، وستورديڤانت مرجعًا قياسيًا لملاءمة وتقييم النماذج اللوجستية. يغطي بيان TRIPOD الإبلاغ عن نماذج التنبؤ المبنية بالانحدار اللوجستي، وتُستخدم الدراسات المنهجية لتوجيه حجم العينة مثل الأحداث لكل متغير.
History
تعود جذور الدالة اللوجستية إلى القرن التاسع عشر في نمو السكان، وقد تطور استخدامها للانحدار الثنائي في منتصف القرن العشرين، مع عمل ديفيد كوكس الذي عزز هذه الطريقة لتحليل البيانات الثنائية. أصبحت أداة أساسية في علم الأوبئة، خاصة لتحليل الحالات والشواهد حيث تكون نسبة الأرجحية هي المقياس الطبيعي. تناولت الأدبيات المنهجية اللاحقة القضايا العملية بما في ذلك حجم العينة، والفصل، واختلاف نسب الأرجحية عن نسب المخاطر.
Debates
- كم عدد أحداث النتيجة المطلوبة لكل متنبئ؟
- تم دعم قاعدة قديمة تشير إلى حوالي عشرة أحداث لكل متغير من خلال أعمال المحاكاة، لكن الدراسات اللاحقة جادلت بأن القاعدة متحفظة وتعتمد على السياق، بحيث قد تكون أحداث أقل كافية في بعض الأحيان بينما قد تكون هناك حاجة إلى المزيد في حالات أخرى.
- هل يجب استخدام نسبة الأرجحية عندما تكون النتيجة شائعة؟
- عندما تكون النتيجة شائعة، تبالغ نسبة الأرجحية في تقدير نسبة المخاطر ويمكن أن يساء تفسيرها على أنها خطر نسبي؛ تقدر البدائل مثل انحدار بواسون المعدل نسبة المخاطر مباشرة وقد تم اقتراحها للدراسات الاستباقية ذات النتائج الثنائية.
Key figures
- David Cox
- David Hosmer
- Stanley Lemeshow
- Peter Peduzzi
- Eric Vittinghoff
Related topics
Seminal works
- hosmer-2013
- peduzzi-1996
Frequently asked questions
- لماذا يبلغ الانحدار اللوجستي عن نسب الأرجحية؟
- نظرًا لأن النموذج خطي على مقياس لوغاريتم الأرجحية، يمثل كل معامل تغييرًا في لوغاريتم الأرجحية، ويعطي الأس نسبة أرجحية. وبالتالي، فإن نسبة الأرجحية هي مقياس التأثير الطبيعي الذي ينتجه النموذج لنتيجة ثنائية.
- متى تكون نسبة الأرجحية تقريبًا ضعيفًا لنسبة المخاطر؟
- عندما تكون النتيجة شائعة، تختلف نسبة الأرجحية عن نسبة المخاطر وتبالغ في تقديرها. في هذه الحالة، يمكن أن تكون نسبة الأرجحية مضللة إذا قرئت على أنها خطر نسبي، وقد تكون الطرق التي تقدر نسبة المخاطر مباشرة مفضلة.