التعلم للترتيب
يطبق التعلم للترتيب تعلم الآلة لبناء دوال ترتيب تجمع العديد من الميزات، بالتدريب على بيانات ملاءمة معلمة أو ملاحظات المستخدم لترتيب المستندات بشكل أفضل من صيغة واحدة مضبوطة يدويًا.
Definition
التعلم للترتيب هو استخدام أساليب تعلم الآلة لاستنباط دالة ترتب مجموعة من المستندات لاستعلام ما حسب الملاءمة، يتم تدريبها من أمثلة تكون فيها الملاءمة النسبية أو المطلقة للمستندات معروفة، وتُصاغ كالانحدار النقطي أو التصنيف، أو تعلم التفضيل الزوجي، أو التحسين المباشر على مستوى القائمة.
Scope
يغطي هذا الموضوع المناهج الخاضعة للإشراف وتلك المدفوعة بالتغذية الراجعة لتعلم دوال الترتيب للاسترجاع. ويتناول الصياغات النقطية، الزوجية، والقائمة، واستخدام تسميات الملاءمة وبيانات النقر، والأساليب التمثيلية مثل RankNet وأشجار الترتيب المعززة بالانحدار، وتحسين المقاييس القائمة على الترتيب. كما يتناول كيفية تعلم وتقييم المرتب كنموذج، بينما يتم تغطية تجميع الميزات وخط أنابيب التقديم الأوسع ضمن ترتيب البحث على الويب.
Core questions
- كيف تُصاغ مشكلات الترتيب كتعلم نقطي أو زوجي أو قائم على القائمة؟
- ما هي إشارات التدريب، مثل تسميات الملاءمة أو بيانات النقر، التي تدفع عملية التعلم؟
- كيف يمكن تحسين مقاييس التقييم القائمة على الترتيب، والتي لا يمكن تفاضلها؟
- كيف يتم دمج العديد من الميزات غير المتجانسة في مرتب واحد متعلم؟
- كيف تُدخل بيانات النقر التحيز، وكيف يمكن معالجتها؟
Key concepts
- دالة الترتيب
- التعلم النقطي / الزوجي / القائم على القائمة
- تسميات الملاءمة والملاءمة المتدرجة
- النقر والتغذية الراجعة الضمنية
- RankNet والأشجار المعززة بالانحدار
- خسارة قائمة على الترتيب وتحسين المقاييس
- دمج الميزات
- تحيز الموضع
Key theories
- الصياغات النقطية والزوجية والقائمة
- يمكن تعلم الترتيب عن طريق التنبؤ بملاءمة كل مستند بشكل مستقل (نقطي)، أو عن طريق تعلم الترتيبات الصحيحة لأزواج المستندات (زوجي)، أو عن طريق تحسين الخسارة على قوائم النتائج بأكملها (قائمة)، مع توافق الأخير بشكل مباشر مع المقاييس القائمة على الترتيب.
- التعلم من بيانات النقر
- توفر نقرات المستخدم ملاحظات ملاءمة ضمنية وفيرة ولكنها متحيزة؛ يتيح التعامل مع النقرات كتفضيلات نسبية ضمن قائمة النتائج تدريب دوال الترتيب من سجلات التفاعل بدلاً من الاعتماد فقط على التسميات اليدوية المكلفة.
Clinical relevance
يُعد التعلم للترتيب الطريقة القياسية التي تجمع بها أنظمة البحث والتوصية الحديثة الإشارات، وتُعد المرتبات المُتعلمة آليًا والمستندة إلى الأشجار المعززة بالانحدار والنماذج العصبية هي المحرك لترتيب النتائج في محركات البحث الرئيسية على الويب، وبحث التجارة الإلكترونية، وترتيب الإعلانات.
History
مع تراكم العديد من إشارات الترتيب في بحث الويب، أصبح الضبط اليدوي غير عملي، مما حفز الترتيب المُتعلم آليًا. أظهر عمل يواكيمز عام 2002 أن بيانات النقر يمكن أن تدرب المرتبات؛ وقدم بورجيس وزملاؤه RankNet (2005) الترتيب الزوجي العصبي ونسله LambdaRank و LambdaMART؛ وعزز مسح ليو عام 2009 المجال حول النماذج النقطية والزوجية والقائمة.
Key figures
- Tie-Yan Liu
- Christopher Burges
- Thorsten Joachims
Related topics
Seminal works
- liu2009
- burges2005
- joachims2002
Frequently asked questions
- ما الفرق بين التعلم للترتيب النقطي والزوجي والقائم على القائمة؟
- تتنبأ الأساليب النقطية بدرجة ملاءمة لكل مستند بشكل مستقل؛ تتعلم الأساليب الزوجية أي من مستندين يجب أن يحتل مرتبة أعلى؛ بينما تعمل الأساليب القائمة على القائمة على تحسين خسارة محددة على قائمة مرتبة كاملة. تتوافق المناهج القائمة على القائمة بشكل أوثق مع المقاييس على مستوى القائمة التي يهتم بها المستخدمون فعليًا.
- لماذا نستخدم بيانات النقر رغم أنها متحيزة؟
- تُعد النقرات أرخص بكثير وأكثر وفرة من أحكام الملاءمة اليدوية، لذا فهي تتيح التدريب على نطاق واسع. تكمن المشكلة في تحيز الموضع والعرض، ولهذا السبب تتعامل الأساليب مع النقرات كتفضيلات نسبية وتطبق بشكل متزايد تصحيحات تعلم غير متحيزة أو افتراضية.