बिंदुवार, युग्मवार और सूचीवार सीखने में क्या अंतर है?

बिंदुवार विधियाँ प्रत्येक दस्तावेज़ के लिए स्वतंत्र रूप से एक प्रासंगिकता स्कोर का अनुमान लगाती हैं; युग्मवार विधियाँ सीखती हैं कि दो दस्तावेज़ों में से किसे उच्च रैंक देना चाहिए; सूचीवार विधियाँ एक संपूर्ण रैंक की गई सूची पर परिभाषित हानि को अनुकूलित करती हैं। सूचीवार दृष्टिकोण उन सूची-स्तरीय मेट्रिक्स के साथ सबसे निकटता से संरेखित होते हैं जिनकी उपयोगकर्ता वास्तव में परवाह करते हैं।

क्लिक डेटा का उपयोग क्यों करें जब यह पक्षपाती हो?

क्लिक मैन्युअल प्रासंगिकता निर्णयों की तुलना में बहुत सस्ते और अधिक प्रचुर मात्रा में होते हैं, इसलिए वे बड़े पैमाने पर प्रशिक्षण को सक्षम करते हैं। समस्या स्थिति और प्रस्तुति पूर्वाग्रह है, यही कारण है कि विधियाँ क्लिक को सापेक्ष वरीयताओं के रूप में मानती हैं और तेजी से निष्पक्ष या प्रति-तथ्यात्मक सीखने के सुधारों को लागू करती हैं।

रैंक करना सीखना

रैंक करना सीखना मशीन लर्निंग को रैंकिंग फ़ंक्शन बनाने के लिए लागू करता है जो कई विशेषताओं को जोड़ते हैं, लेबल किए गए प्रासंगिकता डेटा या उपयोगकर्ता प्रतिक्रिया पर प्रशिक्षण देते हैं ताकि दस्तावेज़ों को एक एकल हस्त-ट्यून किए गए फ़ॉर्मूले से बेहतर ढंग से व्यवस्थित किया जा सके।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

रैंक करना सीखना मशीन-लर्निंग विधियों का उपयोग है जो एक फ़ंक्शन को प्रेरित करता है जो एक क्वेरी के लिए दस्तावेज़ों के एक सेट को प्रासंगिकता के आधार पर व्यवस्थित करता है, ऐसे उदाहरणों से प्रशिक्षित होता है जिसमें दस्तावेज़ों की सापेक्ष या पूर्ण प्रासंगिकता ज्ञात होती है, जिसे बिंदुवार प्रतिगमन या वर्गीकरण, युग्मवार वरीयता सीखने, या प्रत्यक्ष सूचीवार अनुकूलन के रूप में तैयार किया जाता है।

Scope

यह विषय पुनर्प्राप्ति के लिए रैंकिंग फ़ंक्शन सीखने के लिए पर्यवेक्षित और प्रतिक्रिया-संचालित दृष्टिकोणों को शामिल करता है। यह बिंदुवार, युग्मवार और सूचीवार सूत्रों, प्रासंगिकता लेबल और क्लिकथ्रू डेटा के उपयोग, रैंकनेट और ग्रेडिएंट-बूस्टेड रैंकिंग ट्री जैसे प्रतिनिधि तरीकों और रैंक-आधारित मेट्रिक्स के अनुकूलन को संबोधित करता है। यह बताता है कि एक रैंकर को एक मॉडल के रूप में कैसे सीखा और मूल्यांकन किया जाता है, जबकि विशेषताओं का संयोजन और व्यापक सेवा पाइपलाइन वेब खोज रैंकिंग के तहत कवर की जाती है।

Core questions

रैंकिंग समस्याओं को बिंदुवार, युग्मवार या सूचीवार सीखने के रूप में कैसे प्रस्तुत किया जाता है?
कौन से प्रशिक्षण संकेत, जैसे प्रासंगिकता लेबल या क्लिकथ्रू डेटा, सीखने को प्रेरित करते हैं?
रैंक-आधारित मूल्यांकन मेट्रिक्स, जो गैर-विभेदक हैं, को कैसे अनुकूलित किया जा सकता है?
कई विषम विशेषताओं को एक एकल सीखे हुए रैंकर में कैसे जोड़ा जाता है?
क्लिक डेटा पूर्वाग्रह कैसे पैदा करता है, और इसे कैसे संबोधित किया जा सकता है?

Key concepts

रैंकिंग फ़ंक्शन
बिंदुवार / युग्मवार / सूचीवार सीखना
प्रासंगिकता लेबल और श्रेणीबद्ध प्रासंगिकता
क्लिकथ्रू और निहित प्रतिक्रिया
रैंकनेट और ग्रेडिएंट-बूस्टेड ट्री
रैंक-आधारित हानि और मीट्रिक अनुकूलन
विशेषता संयोजन
स्थिति पूर्वाग्रह

Key theories

बिंदुवार, युग्मवार और सूचीवार सूत्र: रैंकिंग को प्रत्येक दस्तावेज़ की प्रासंगिकता का स्वतंत्र रूप से अनुमान लगाकर (बिंदुवार), दस्तावेज़ युग्मों के सही क्रम को सीखकर (युग्मवार), या संपूर्ण परिणाम सूचियों पर हानि को अनुकूलित करके (सूचीवार) सीखा जा सकता है, जिसमें बाद वाला रैंक-आधारित मेट्रिक्स के साथ सबसे सीधे संरेखित होता है।
क्लिकथ्रू डेटा से सीखना: उपयोगकर्ता क्लिक प्रचुर मात्रा में लेकिन पक्षपाती निहित प्रासंगिकता प्रतिक्रिया प्रदान करते हैं; क्लिक को परिणाम सूची के भीतर सापेक्ष वरीयताओं के रूप में मानने से रैंकिंग फ़ंक्शन को केवल महंगे मैन्युअल लेबल के बजाय इंटरैक्शन लॉग से प्रशिक्षित किया जा सकता है।

Clinical relevance

रैंक करना सीखना आधुनिक खोज और अनुशंसा प्रणालियों का मानक तरीका है जो संकेतों को जोड़ते हैं, और ग्रेडिएंट-बूस्टेड ट्री और न्यूरल मॉडल पर आधारित मशीन-लर्न किए गए रैंकर प्रमुख वेब खोज इंजनों, ई-कॉमर्स खोज और विज्ञापन रैंकिंग के परिणाम क्रम को संचालित करते हैं।

History

जैसे-जैसे वेब खोज में कई रैंकिंग संकेत जमा हुए, हस्त-ट्यूनिंग अव्यावहारिक हो गई, जिससे मशीन-लर्न की गई रैंकिंग को प्रोत्साहन मिला। जोआकिम्स के 2002 के काम ने दिखाया कि क्लिकथ्रू डेटा रैंकरों को प्रशिक्षित कर सकता है; बर्गेस और सहयोगियों के रैंकनेट (2005) ने न्यूरल युग्मवार रैंकिंग और इसके वंशज लैम्डा रैंक और लैम्डा मार्ट की शुरुआत की; और लियू के 2009 के सर्वेक्षण ने बिंदुवार, युग्मवार और सूचीवार प्रतिमानों के इर्द-गिर्द क्षेत्र को समेकित किया।

Key figures

Tie-Yan Liu
Christopher Burges
Thorsten Joachims

Seminal works

liu2009
burges2005
joachims2002

Frequently asked questions

बिंदुवार, युग्मवार और सूचीवार सीखने में क्या अंतर है?: बिंदुवार विधियाँ प्रत्येक दस्तावेज़ के लिए स्वतंत्र रूप से एक प्रासंगिकता स्कोर का अनुमान लगाती हैं; युग्मवार विधियाँ सीखती हैं कि दो दस्तावेज़ों में से किसे उच्च रैंक देना चाहिए; सूचीवार विधियाँ एक संपूर्ण रैंक की गई सूची पर परिभाषित हानि को अनुकूलित करती हैं। सूचीवार दृष्टिकोण उन सूची-स्तरीय मेट्रिक्स के साथ सबसे निकटता से संरेखित होते हैं जिनकी उपयोगकर्ता वास्तव में परवाह करते हैं।
क्लिक डेटा का उपयोग क्यों करें जब यह पक्षपाती हो?: क्लिक मैन्युअल प्रासंगिकता निर्णयों की तुलना में बहुत सस्ते और अधिक प्रचुर मात्रा में होते हैं, इसलिए वे बड़े पैमाने पर प्रशिक्षण को सक्षम करते हैं। समस्या स्थिति और प्रस्तुति पूर्वाग्रह है, यही कारण है कि विधियाँ क्लिक को सापेक्ष वरीयताओं के रूप में मानती हैं और तेजी से निष्पक्ष या प्रति-तथ्यात्मक सीखने के सुधारों को लागू करती हैं।