ScholarGate
सहायक

पेजरैंक और एचआईटीएस एल्गोरिदम

पेजरैंक (PageRank) और एचआईटीएस (HITS) लिंक-विश्लेषण एल्गोरिदम हैं जो केवल पृष्ठ सामग्री के बजाय हाइपरलिंक ग्राफ़ की संरचना से वेब पृष्ठों के महत्व या अधिकार का अनुमान लगाते हैं।

PaperMind से विषय खोजेंजल्द हीFind papers & topics
Tools & resources
स्लाइड डाउनलोड करें
Learn & explore
वीडियोजल्द ही

Definition

पेजरैंक प्रत्येक पृष्ठ को एक क्वेरी-स्वतंत्र महत्व स्कोर प्रदान करता है जो एक यादृच्छिक सर्फर के तहत इसकी स्थिर संभावना के बराबर होता है जो डैम्पिंग संभावना के साथ आउटगोइंग लिंक का अनुसरण करता है और अन्यथा टेलीपोर्ट करता है, जबकि एचआईटीएस, एक क्वेरी-निर्भर सबग्राफ के लिए, मूल्यवान सामग्री वाले पृष्ठों के लिए अथॉरिटी स्कोर और अच्छे अथॉरिटी वाले पृष्ठों से लिंक करने वाले पृष्ठों के लिए हब स्कोर की गणना करता है, प्रत्येक एक दूसरे को सुदृढ़ करता है।

Scope

यह विषय दो मूलभूत लिंक-विश्लेषण एल्गोरिदम को शामिल करता है: पेजरैंक, जो टेलीपोर्टेशन के साथ एक यादृच्छिक-सर्फर मॉडल पर आधारित पृष्ठ महत्व का एक क्वेरी-स्वतंत्र माप है, और एचआईटीएस, एक क्वेरी-निर्भर योजना जो पारस्परिक रूप से सुदृढ़ हब और अथॉरिटी स्कोर की गणना करती है। यह अंतर्निहित रैंडम-वॉक और आइगेनवैल्यू (eigenvector) फ़ार्मुलों, डैम्पिंग और टेलीपोर्टेशन की भूमिका, अभिसरण (convergence), और विषय-संवेदनशील वेरिएंट पर विचार करता है। इसमें यह शामिल नहीं है कि इन स्कोरों को पाठ्य विशेषताओं के साथ अंतिम रैंकिंग में कैसे जोड़ा जाता है, जो वेब खोज रैंकिंग से संबंधित है।

Core questions

  • रैंडम-सर्फर मॉडल पेजरैंक को एक स्थिर वितरण के रूप में कैसे परिभाषित करता है?
  • पेजरैंक को अच्छी तरह से परिभाषित होने के लिए डैम्पिंग या टेलीपोर्टेशन कारक की आवश्यकता क्यों है?
  • एचआईटीएस में हब और अथॉरिटी स्कोर एक दूसरे को कैसे सुदृढ़ करते हैं?
  • इन स्कोरों की पुनरावृत्ति (iteratively) कैसे गणना की जाती है, और वे कब अभिसरण करते हैं?
  • क्वेरी-स्वतंत्र बनाम क्वेरी-निर्भर स्कोरिंग में पेजरैंक और एचआईटीएस कैसे भिन्न हैं?

Key concepts

  • पेजरैंक
  • रैंडम-सर्फर मॉडल
  • डैम्पिंग फैक्टर और टेलीपोर्टेशन
  • स्थिर वितरण / प्रमुख आइगेनवैल्यू
  • एचआईटीएस
  • हब और अथॉरिटी
  • क्वेरी-स्वतंत्र बनाम क्वेरी-निर्भर स्कोरिंग
  • पावर इटिरेशन और अभिसरण

Key theories

पेजरैंक रैंडम-सर्फर मॉडल
एक सर्फर का मॉडलिंग जो डैम्पिंग फैक्टर के बराबर संभावना के साथ लिंक का अनुसरण करता है और अन्यथा एक यादृच्छिक पृष्ठ पर कूदता है, एक मार्कोव श्रृंखला उत्पन्न करता है जिसका अद्वितीय स्थिर वितरण लंबे समय तक दौरे से पृष्ठों को स्कोर करता है, जिससे एक स्थिर, क्वेरी-स्वतंत्र महत्व माप मिलता है।
एचआईटीएस हब और अथॉरिटी
एक क्वेरी-केंद्रित सबग्राफ के भीतर, एचआईटीएस प्रत्येक पृष्ठ को उससे लिंक करने वाले पृष्ठों के हब स्कोर के आनुपातिक अथॉरिटी स्कोर और उन पृष्ठों के अथॉरिटी स्कोर के आनुपातिक हब स्कोर प्रदान करता है जिनसे वह लिंक करता है, इन पारस्परिक रूप से सुदृढ़ संबंधों को अभिसरण तक दोहराकर गणना की जाती है।

Clinical relevance

पेजरैंक बड़े पैमाने पर वेब खोज के उदय के लिए केंद्रीय था और ग्राफ़ पर महत्व और अधिकार के लिए एक वैचारिक संदर्भ बिंदु बना हुआ है। लिंक-विश्लेषण के विचार वेब से परे उद्धरण नेटवर्क, सोशल-नेटवर्क प्रभाव, धोखाधड़ी का पता लगाने और सिफारिश तक सामान्यीकृत होते हैं, जहाँ भी समर्थन-जैसे लिंक जानकारी ले जाते हैं।

History

1998 और 1999 में, दो लगभग एक साथ प्रस्तावों ने दिखाया कि हाइपरलिंक अधिकार को एन्कोड करते हैं: क्लेनबर्ग का एचआईटीएस और पेज और ब्रिन का पेजरैंक। पेजरैंक के क्वेरी-स्वतंत्र, विश्व स्तर पर गणना किए गए स्कोर वेब-स्केल सर्विसिंग के लिए अच्छी तरह से अनुकूल साबित हुए और एक अग्रणी खोज इंजन को रेखांकित किया, जबकि एचआईटीएस ने विषय-निष्कर्ष और बाद में ग्राफ़-रैंकिंग अनुसंधान को प्रभावित किया।

Key figures

  • Larry Page
  • Sergey Brin
  • Jon Kleinberg
  • Rajeev Motwani

Related topics

Seminal works

  • page1999
  • kleinberg1999
  • brin1998

Frequently asked questions

पेजरैंक और एचआईटीएस में क्या अंतर है?
पेजरैंक पूरे वेब ग्राफ़ से प्रत्येक पृष्ठ के लिए एक एकल क्वेरी-स्वतंत्र महत्व स्कोर की अग्रिम रूप से गणना करता है, जबकि एचआईटीएस पुनर्प्राप्ति के समय क्वेरी के आसपास निर्मित एक छोटे सबग्राफ पर क्वेरी-निर्भर हब और अथॉरिटी स्कोर की गणना करता है। पेजरैंक वेब सर्विसिंग के लिए अधिक आसानी से स्केल करता है।
पेजरैंक को डैम्पिंग फैक्टर की आवश्यकता क्यों है?
इसके बिना, रैंडम सर्फर बिना आउटगोइंग लिंक वाले पृष्ठों में या चक्रों में फंस सकता है, और स्थिर वितरण अद्वितीय या अच्छी तरह से परिभाषित नहीं हो सकता है। डैम्पिंग (टेलीपोर्टेशन) संभावना सर्फर को कभी-कभी एक यादृच्छिक पृष्ठ पर कूदने देती है, जो एक अद्वितीय, अच्छी तरह से व्यवहार किए गए स्कोर की गारंटी देती है।

Methods for this concept

Related concepts