ScholarGate
المساعد

ترتيب نتائج البحث على الويب

ترتيب نتائج البحث على الويب هو عملية شاملة لترتيب صفحات الويب لاستعلام معين من خلال الجمع بين الإشارات النصية، والإشارات القائمة على الروابط، والإشارات السلوكية عبر مسار متعدد المراحل يجب أن يقاوم التلاعب أيضًا.

اعثر على موضوع باستخدام PaperMindقريبًاFind papers & topics
Tools & resources
تنزيل الشرائح
Learn & explore
فيديوقريبًا

Definition

ترتيب نتائج البحث على الويب هو مزيج من العديد من إشارات الملاءمة والجودة في ترتيب لصفحات الويب لاستعلام معين، ويتحقق عادةً كمسار متعدد المراحل يسترجع مجموعة مرشحة بنموذج فعال ثم يعيد ترتيبها بنماذج مُتعلمة أكثر تكلفة، تحت ضغط عدائي مستمر من المحتوى الذي يحاول الحصول على ترتيب أعلى.

Scope

يغطي هذا الموضوع كيفية إنتاج محرك بحث الويب لنتائجه النهائية المرتبة: الإشارات التي يعتمد عليها (الملاءمة النصية، نص الرابط، السلطة القائمة على الروابط، الحداثة، والبيانات السلوكية)، والبنية متعددة المراحل التي تسترجع المرشحين بتكلفة منخفضة وتعيد ترتيبهم بنماذج أكثر ثراءً، والبعد العدائي للبريد العشوائي على الويب والتلاعب بمحركات البحث. وهو يدمج نماذج الاسترجاع، وتحليل الروابط، والتعلم للترتيب في مسار عمل للترتيب، بدلاً من معالجة أي مكون واحد بمعزل عن الآخر.

Core questions

  • ما هي الإشارات التي تساهم في ترتيب الصفحة، وكيف يتم دمجها؟
  • لماذا يتم تنظيم الترتيب كمسار متعدد المراحل للاسترجاع ثم إعادة الترتيب؟
  • كيف يكمل نص الرابط والسلطة القائمة على الروابط النص الموجود في الصفحة؟
  • كيف تكتشف محركات البحث البريد العشوائي على الويب والتلاعب به وتخفض ترتيبه؟
  • كيف يتم دمج إشارات الحداثة وسلوك المستخدم؟

Key concepts

  • إشارات وميزات الترتيب
  • نص الرابط
  • السلطة القائمة على الروابط
  • الاسترجاع وإعادة الترتيب متعدد المراحل
  • إشارات الحداثة
  • الإشارات السلوكية / إشارات النقر
  • البريد العشوائي على الويب (مزارع الروابط، التخفي، حشو الكلمات المفتاحية)
  • استرجاع المعلومات العدائي

Key theories

مسار الاسترجاع ثم إعادة الترتيب متعدد المراحل
نظرًا لأن نماذج الترتيب الغنية مكلفة للغاية بحيث لا يمكن تطبيقها على كل مستند، فإن البحث على الويب يسترجع أولاً مجموعة مرشحة يمكن إدارتها بنموذج فعال مثل BM25 ثم يعيد ترتيب هؤلاء المرشحين بنماذج مُتعلمة أكثر تكلفة تدريجيًا.
استرجاع المعلومات العدائي والبريد العشوائي على الويب
نظرًا لأن الترتيب الأعلى له قيمة تجارية، يتم تصميم المحتوى بنشاط للتلاعب بالترتيب من خلال حشو الكلمات المفتاحية، ومزارع الروابط، والتخفي، لذلك يجب أن يتضمن الترتيب اكتشاف البريد العشوائي والمتانة كاهتمامات أساسية.

Clinical relevance

تحدد جودة الترتيب فائدة البحث التجاري على الويب لمليارات المستخدمين ورؤية المحتوى للناشرين، مما يؤدي إلى ظهور صناعة تحسين محركات البحث. يتم إعادة استخدام نمط الاسترجاع ثم إعادة الترتيب وتقنيات مقاومة البريد العشوائي المطورة هنا عبر التجارة الإلكترونية والتطبيقات وبحث المؤسسات.

History

مزج ترتيب البحث المبكر على الويب بين ملاءمة النص والإشارات الجديدة القائمة على الروابط التي ظهرت حوالي عام 1998. ومع تزايد التلاعب، ظهر استرجاع المعلومات العدائي في منتصف العقد الأول من القرن الحادي والعشرين مع أعمال مثل تصنيفات البريد العشوائي على الويب وانتشار الثقة. أضافت مسارات الترتيب بشكل مطرد نماذج مُتعلمة وإشارات سلوكية، وتطورت إلى البنى متعددة المراحل المستخدمة اليوم.

Key figures

  • Sergey Brin
  • Larry Page
  • Zoltán Gyöngyi
  • Hector García-Molina

Related topics

Seminal works

  • brin1998
  • gyongyi2005
  • croft2010

Frequently asked questions

لماذا تقوم محركات البحث بالترتيب في مراحل متعددة؟
سيكون تطبيق نماذج الترتيب الأكثر دقة على كل صفحة في الفهرس بطيئًا للغاية. تقوم المرحلة الأولى الرخيصة باسترجاع بضع مئات أو آلاف من المرشحين الواعدين، ثم تقوم النماذج الأكثر ثراءً على التوالي بإعادة ترتيب تلك المجموعة الأصغر، مما يوازن بين الجودة ووقت الاستجابة والتكلفة.
ما هو استرجاع المعلومات العدائي؟
هو دراسة الاسترجاع في البيئات التي يحاول فيها المحتوى بنشاط التلاعب بالترتيب لتحقيق مكاسب، مثل البريد العشوائي على الويب، ومزارع الروابط، والتخفي. تستجيب أنظمة الترتيب باكتشاف البريد العشوائي، وانتشار الثقة، وتدابير المتانة للحفاظ على موثوقية النتائج.

Methods for this concept

Related concepts