ترتيب نتائج البحث على الويب
ترتيب نتائج البحث على الويب هو عملية شاملة لترتيب صفحات الويب لاستعلام معين من خلال الجمع بين الإشارات النصية، والإشارات القائمة على الروابط، والإشارات السلوكية عبر مسار متعدد المراحل يجب أن يقاوم التلاعب أيضًا.
Definition
ترتيب نتائج البحث على الويب هو مزيج من العديد من إشارات الملاءمة والجودة في ترتيب لصفحات الويب لاستعلام معين، ويتحقق عادةً كمسار متعدد المراحل يسترجع مجموعة مرشحة بنموذج فعال ثم يعيد ترتيبها بنماذج مُتعلمة أكثر تكلفة، تحت ضغط عدائي مستمر من المحتوى الذي يحاول الحصول على ترتيب أعلى.
Scope
يغطي هذا الموضوع كيفية إنتاج محرك بحث الويب لنتائجه النهائية المرتبة: الإشارات التي يعتمد عليها (الملاءمة النصية، نص الرابط، السلطة القائمة على الروابط، الحداثة، والبيانات السلوكية)، والبنية متعددة المراحل التي تسترجع المرشحين بتكلفة منخفضة وتعيد ترتيبهم بنماذج أكثر ثراءً، والبعد العدائي للبريد العشوائي على الويب والتلاعب بمحركات البحث. وهو يدمج نماذج الاسترجاع، وتحليل الروابط، والتعلم للترتيب في مسار عمل للترتيب، بدلاً من معالجة أي مكون واحد بمعزل عن الآخر.
Core questions
- ما هي الإشارات التي تساهم في ترتيب الصفحة، وكيف يتم دمجها؟
- لماذا يتم تنظيم الترتيب كمسار متعدد المراحل للاسترجاع ثم إعادة الترتيب؟
- كيف يكمل نص الرابط والسلطة القائمة على الروابط النص الموجود في الصفحة؟
- كيف تكتشف محركات البحث البريد العشوائي على الويب والتلاعب به وتخفض ترتيبه؟
- كيف يتم دمج إشارات الحداثة وسلوك المستخدم؟
Key concepts
- إشارات وميزات الترتيب
- نص الرابط
- السلطة القائمة على الروابط
- الاسترجاع وإعادة الترتيب متعدد المراحل
- إشارات الحداثة
- الإشارات السلوكية / إشارات النقر
- البريد العشوائي على الويب (مزارع الروابط، التخفي، حشو الكلمات المفتاحية)
- استرجاع المعلومات العدائي
Key theories
- مسار الاسترجاع ثم إعادة الترتيب متعدد المراحل
- نظرًا لأن نماذج الترتيب الغنية مكلفة للغاية بحيث لا يمكن تطبيقها على كل مستند، فإن البحث على الويب يسترجع أولاً مجموعة مرشحة يمكن إدارتها بنموذج فعال مثل BM25 ثم يعيد ترتيب هؤلاء المرشحين بنماذج مُتعلمة أكثر تكلفة تدريجيًا.
- استرجاع المعلومات العدائي والبريد العشوائي على الويب
- نظرًا لأن الترتيب الأعلى له قيمة تجارية، يتم تصميم المحتوى بنشاط للتلاعب بالترتيب من خلال حشو الكلمات المفتاحية، ومزارع الروابط، والتخفي، لذلك يجب أن يتضمن الترتيب اكتشاف البريد العشوائي والمتانة كاهتمامات أساسية.
Clinical relevance
تحدد جودة الترتيب فائدة البحث التجاري على الويب لمليارات المستخدمين ورؤية المحتوى للناشرين، مما يؤدي إلى ظهور صناعة تحسين محركات البحث. يتم إعادة استخدام نمط الاسترجاع ثم إعادة الترتيب وتقنيات مقاومة البريد العشوائي المطورة هنا عبر التجارة الإلكترونية والتطبيقات وبحث المؤسسات.
History
مزج ترتيب البحث المبكر على الويب بين ملاءمة النص والإشارات الجديدة القائمة على الروابط التي ظهرت حوالي عام 1998. ومع تزايد التلاعب، ظهر استرجاع المعلومات العدائي في منتصف العقد الأول من القرن الحادي والعشرين مع أعمال مثل تصنيفات البريد العشوائي على الويب وانتشار الثقة. أضافت مسارات الترتيب بشكل مطرد نماذج مُتعلمة وإشارات سلوكية، وتطورت إلى البنى متعددة المراحل المستخدمة اليوم.
Key figures
- Sergey Brin
- Larry Page
- Zoltán Gyöngyi
- Hector García-Molina
Related topics
Seminal works
- brin1998
- gyongyi2005
- croft2010
Frequently asked questions
- لماذا تقوم محركات البحث بالترتيب في مراحل متعددة؟
- سيكون تطبيق نماذج الترتيب الأكثر دقة على كل صفحة في الفهرس بطيئًا للغاية. تقوم المرحلة الأولى الرخيصة باسترجاع بضع مئات أو آلاف من المرشحين الواعدين، ثم تقوم النماذج الأكثر ثراءً على التوالي بإعادة ترتيب تلك المجموعة الأصغر، مما يوازن بين الجودة ووقت الاستجابة والتكلفة.
- ما هو استرجاع المعلومات العدائي؟
- هو دراسة الاسترجاع في البيئات التي يحاول فيها المحتوى بنشاط التلاعب بالترتيب لتحقيق مكاسب، مثل البريد العشوائي على الويب، ومزارع الروابط، والتخفي. تستجيب أنظمة الترتيب باكتشاف البريد العشوائي، وانتشار الثقة، وتدابير المتانة للحفاظ على موثوقية النتائج.