रैंक करना सीखना
रैंक करना सीखना मशीन लर्निंग को रैंकिंग फ़ंक्शन बनाने के लिए लागू करता है जो कई विशेषताओं को जोड़ते हैं, लेबल किए गए प्रासंगिकता डेटा या उपयोगकर्ता प्रतिक्रिया पर प्रशिक्षण देते हैं ताकि दस्तावेज़ों को एक एकल हस्त-ट्यून किए गए फ़ॉर्मूले से बेहतर ढंग से व्यवस्थित किया जा सके।
Definition
रैंक करना सीखना मशीन-लर्निंग विधियों का उपयोग है जो एक फ़ंक्शन को प्रेरित करता है जो एक क्वेरी के लिए दस्तावेज़ों के एक सेट को प्रासंगिकता के आधार पर व्यवस्थित करता है, ऐसे उदाहरणों से प्रशिक्षित होता है जिसमें दस्तावेज़ों की सापेक्ष या पूर्ण प्रासंगिकता ज्ञात होती है, जिसे बिंदुवार प्रतिगमन या वर्गीकरण, युग्मवार वरीयता सीखने, या प्रत्यक्ष सूचीवार अनुकूलन के रूप में तैयार किया जाता है।
Scope
यह विषय पुनर्प्राप्ति के लिए रैंकिंग फ़ंक्शन सीखने के लिए पर्यवेक्षित और प्रतिक्रिया-संचालित दृष्टिकोणों को शामिल करता है। यह बिंदुवार, युग्मवार और सूचीवार सूत्रों, प्रासंगिकता लेबल और क्लिकथ्रू डेटा के उपयोग, रैंकनेट और ग्रेडिएंट-बूस्टेड रैंकिंग ट्री जैसे प्रतिनिधि तरीकों और रैंक-आधारित मेट्रिक्स के अनुकूलन को संबोधित करता है। यह बताता है कि एक रैंकर को एक मॉडल के रूप में कैसे सीखा और मूल्यांकन किया जाता है, जबकि विशेषताओं का संयोजन और व्यापक सेवा पाइपलाइन वेब खोज रैंकिंग के तहत कवर की जाती है।
Core questions
- रैंकिंग समस्याओं को बिंदुवार, युग्मवार या सूचीवार सीखने के रूप में कैसे प्रस्तुत किया जाता है?
- कौन से प्रशिक्षण संकेत, जैसे प्रासंगिकता लेबल या क्लिकथ्रू डेटा, सीखने को प्रेरित करते हैं?
- रैंक-आधारित मूल्यांकन मेट्रिक्स, जो गैर-विभेदक हैं, को कैसे अनुकूलित किया जा सकता है?
- कई विषम विशेषताओं को एक एकल सीखे हुए रैंकर में कैसे जोड़ा जाता है?
- क्लिक डेटा पूर्वाग्रह कैसे पैदा करता है, और इसे कैसे संबोधित किया जा सकता है?
Key concepts
- रैंकिंग फ़ंक्शन
- बिंदुवार / युग्मवार / सूचीवार सीखना
- प्रासंगिकता लेबल और श्रेणीबद्ध प्रासंगिकता
- क्लिकथ्रू और निहित प्रतिक्रिया
- रैंकनेट और ग्रेडिएंट-बूस्टेड ट्री
- रैंक-आधारित हानि और मीट्रिक अनुकूलन
- विशेषता संयोजन
- स्थिति पूर्वाग्रह
Key theories
- बिंदुवार, युग्मवार और सूचीवार सूत्र
- रैंकिंग को प्रत्येक दस्तावेज़ की प्रासंगिकता का स्वतंत्र रूप से अनुमान लगाकर (बिंदुवार), दस्तावेज़ युग्मों के सही क्रम को सीखकर (युग्मवार), या संपूर्ण परिणाम सूचियों पर हानि को अनुकूलित करके (सूचीवार) सीखा जा सकता है, जिसमें बाद वाला रैंक-आधारित मेट्रिक्स के साथ सबसे सीधे संरेखित होता है।
- क्लिकथ्रू डेटा से सीखना
- उपयोगकर्ता क्लिक प्रचुर मात्रा में लेकिन पक्षपाती निहित प्रासंगिकता प्रतिक्रिया प्रदान करते हैं; क्लिक को परिणाम सूची के भीतर सापेक्ष वरीयताओं के रूप में मानने से रैंकिंग फ़ंक्शन को केवल महंगे मैन्युअल लेबल के बजाय इंटरैक्शन लॉग से प्रशिक्षित किया जा सकता है।
Clinical relevance
रैंक करना सीखना आधुनिक खोज और अनुशंसा प्रणालियों का मानक तरीका है जो संकेतों को जोड़ते हैं, और ग्रेडिएंट-बूस्टेड ट्री और न्यूरल मॉडल पर आधारित मशीन-लर्न किए गए रैंकर प्रमुख वेब खोज इंजनों, ई-कॉमर्स खोज और विज्ञापन रैंकिंग के परिणाम क्रम को संचालित करते हैं।
History
जैसे-जैसे वेब खोज में कई रैंकिंग संकेत जमा हुए, हस्त-ट्यूनिंग अव्यावहारिक हो गई, जिससे मशीन-लर्न की गई रैंकिंग को प्रोत्साहन मिला। जोआकिम्स के 2002 के काम ने दिखाया कि क्लिकथ्रू डेटा रैंकरों को प्रशिक्षित कर सकता है; बर्गेस और सहयोगियों के रैंकनेट (2005) ने न्यूरल युग्मवार रैंकिंग और इसके वंशज लैम्डा रैंक और लैम्डा मार्ट की शुरुआत की; और लियू के 2009 के सर्वेक्षण ने बिंदुवार, युग्मवार और सूचीवार प्रतिमानों के इर्द-गिर्द क्षेत्र को समेकित किया।
Key figures
- Tie-Yan Liu
- Christopher Burges
- Thorsten Joachims
Related topics
Seminal works
- liu2009
- burges2005
- joachims2002
Frequently asked questions
- बिंदुवार, युग्मवार और सूचीवार सीखने में क्या अंतर है?
- बिंदुवार विधियाँ प्रत्येक दस्तावेज़ के लिए स्वतंत्र रूप से एक प्रासंगिकता स्कोर का अनुमान लगाती हैं; युग्मवार विधियाँ सीखती हैं कि दो दस्तावेज़ों में से किसे उच्च रैंक देना चाहिए; सूचीवार विधियाँ एक संपूर्ण रैंक की गई सूची पर परिभाषित हानि को अनुकूलित करती हैं। सूचीवार दृष्टिकोण उन सूची-स्तरीय मेट्रिक्स के साथ सबसे निकटता से संरेखित होते हैं जिनकी उपयोगकर्ता वास्तव में परवाह करते हैं।
- क्लिक डेटा का उपयोग क्यों करें जब यह पक्षपाती हो?
- क्लिक मैन्युअल प्रासंगिकता निर्णयों की तुलना में बहुत सस्ते और अधिक प्रचुर मात्रा में होते हैं, इसलिए वे बड़े पैमाने पर प्रशिक्षण को सक्षम करते हैं। समस्या स्थिति और प्रस्तुति पूर्वाग्रह है, यही कारण है कि विधियाँ क्लिक को सापेक्ष वरीयताओं के रूप में मानती हैं और तेजी से निष्पक्ष या प्रति-तथ्यात्मक सीखने के सुधारों को लागू करती हैं।