تفاوت بین یادگیری رتبهبندی نقطهای، زوجی و لیستی چیست؟

روشهای نقطهای یک امتیاز ارتباط را برای هر سند به طور مستقل پیشبینی میکنند؛ روشهای زوجی یاد میگیرند که کدام یک از دو سند باید رتبه بالاتری داشته باشد؛ روشهای لیستی یک تابع زیان تعریف شده بر روی کل یک لیست رتبهبندی شده را بهینه میکنند. رویکردهای لیستی بیشترین همسویی را با معیارهای سطح لیست که کاربران واقعاً به آنها اهمیت میدهند، دارند.

چرا از دادههای کلیک استفاده کنیم در حالی که سوگیرانه هستند؟

کلیکها بسیار ارزانتر و فراوانتر از قضاوتهای دستی مرتبط هستند، بنابراین امکان آموزش در مقیاس بزرگ را فراهم میکنند. نکته اینجاست که سوگیری موقعیت و نمایش وجود دارد، به همین دلیل روشها کلیکها را به عنوان ترجیحات نسبی در نظر میگیرند و به طور فزایندهای اصلاحات یادگیری بدون سوگیری یا ضدواقعی را اعمال میکنند.

یادگیری رتبه‌بندی

یادگیری رتبه‌بندی از یادگیری ماشین برای ساخت توابع رتبه‌بندی استفاده می‌کند که ویژگی‌های بسیاری را ترکیب می‌کنند و با آموزش بر روی داده‌های مرتبط برچسب‌گذاری شده یا بازخورد کاربر، اسناد را بهتر از یک فرمول دستی تنظیم شده مرتب می‌کنند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics

Tools & resources

دریافت اسلایدها

Learn & explore

ویدیوبه‌زودی

Definition

یادگیری رتبه‌بندی استفاده از روش‌های یادگیری ماشین برای استخراج تابعی است که مجموعه‌ای از اسناد را برای یک پرس و جو بر اساس ارتباط مرتب می‌کند، که از مثال‌هایی آموزش دیده است که در آن‌ها ارتباط نسبی یا مطلق اسناد شناخته شده است، و به صورت رگرسیون یا طبقه‌بندی نقطه‌ای، یادگیری ترجیحات زوجی، یا بهینه‌سازی مستقیم لیستی فرموله می‌شود.

Scope

این موضوع رویکردهای نظارت شده و مبتنی بر بازخورد را برای یادگیری توابع رتبه‌بندی برای بازیابی پوشش می‌دهد. این به فرمول‌بندی‌های نقطه‌ای، زوجی و لیستی، استفاده از برچسب‌های مرتبط و داده‌های کلیک، روش‌های نماینده مانند RankNet و درختان رتبه‌بندی تقویت‌شده با گرادیان، و بهینه‌سازی معیارهای مبتنی بر رتبه می‌پردازد. این موضوع نحوه یادگیری و ارزیابی یک رتبه‌بندی‌کننده را به عنوان یک مدل بررسی می‌کند، در حالی که مونتاژ ویژگی‌ها و خط لوله گسترده‌تر ارائه خدمات تحت عنوان رتبه‌بندی جستجوی وب پوشش داده می‌شود.

Core questions

مسائل رتبه‌بندی چگونه به عنوان یادگیری نقطه‌ای، زوجی یا لیستی مطرح می‌شوند؟
چه سیگنال‌های آموزشی، مانند برچسب‌های مرتبط یا داده‌های کلیک، یادگیری را هدایت می‌کنند؟
چگونه می‌توان معیارهای ارزیابی مبتنی بر رتبه را که غیرقابل تفکیک هستند، بهینه کرد؟
چگونه می‌توان بسیاری از ویژگی‌های ناهمگن را در یک رتبه‌بندی‌کننده یادگرفته شده ترکیب کرد؟
داده‌های کلیک چگونه سوگیری ایجاد می‌کنند و چگونه می‌توان به آن پرداخت؟

Key concepts

تابع رتبه‌بندی
یادگیری نقطه‌ای / زوجی / لیستی
برچسب‌های مرتبط و ارتباط درجه‌بندی شده
کلیک و بازخورد ضمنی
RankNet و درختان تقویت‌شده با گرادیان
زیان مبتنی بر رتبه و بهینه‌سازی معیار
ترکیب ویژگی
سوگیری موقعیت

Key theories

فرمول‌بندی‌های نقطه‌ای، زوجی و لیستی: رتبه‌بندی را می‌توان با پیش‌بینی مستقل ارتباط هر سند (نقطه‌ای)، با یادگیری ترتیب‌های صحیح جفت اسناد (زوجی)، یا با بهینه‌سازی یک تابع زیان بر روی کل لیست‌های نتایج (لیستی) یاد گرفت، که مورد آخر بیشترین همسویی را با معیارهای مبتنی بر رتبه دارد.
یادگیری از داده‌های کلیک: کلیک‌های کاربر بازخورد ضمنی مرتبط فراوان اما سوگیرانه را فراهم می‌کنند؛ در نظر گرفتن کلیک‌ها به عنوان ترجیحات نسبی در یک لیست نتایج، امکان آموزش توابع رتبه‌بندی را از گزارش‌های تعامل به جای تنها برچسب‌های دستی پرهزینه فراهم می‌آورد.

Clinical relevance

یادگیری رتبه‌بندی روش استاندارد سیستم‌های جستجو و توصیه‌گر مدرن برای ترکیب سیگنال‌ها است، و رتبه‌بندی‌کننده‌های یادگیری ماشین مبتنی بر درختان تقویت‌شده با گرادیان و مدل‌های عصبی، ترتیب نتایج موتورهای جستجوی وب اصلی، جستجوی تجارت الکترونیک، و رتبه‌بندی تبلیغات را هدایت می‌کنند.

History

با انباشت سیگنال‌های رتبه‌بندی متعدد در جستجوی وب، تنظیم دستی غیرعملی شد و این امر انگیزه یادگیری رتبه‌بندی با استفاده از ماشین را فراهم آورد. کار یواخیمز در سال ۲۰۰۲ نشان داد که داده‌های کلیک می‌توانند رتبه‌بندی‌کننده‌ها را آموزش دهند؛ RankNet (۲۰۰۵) توسط بورگس و همکارانش رتبه‌بندی زوجی عصبی و نسل‌های بعدی آن LambdaRank و LambdaMART را معرفی کرد؛ و بررسی لیو در سال ۲۰۰۹ این حوزه را حول پارادایم‌های نقطه‌ای، زوجی و لیستی تثبیت کرد.

Key figures

Tie-Yan Liu
Christopher Burges
Thorsten Joachims

Seminal works

liu2009
burges2005
joachims2002

Frequently asked questions

تفاوت بین یادگیری رتبه‌بندی نقطه‌ای، زوجی و لیستی چیست؟: روش‌های نقطه‌ای یک امتیاز ارتباط را برای هر سند به طور مستقل پیش‌بینی می‌کنند؛ روش‌های زوجی یاد می‌گیرند که کدام یک از دو سند باید رتبه بالاتری داشته باشد؛ روش‌های لیستی یک تابع زیان تعریف شده بر روی کل یک لیست رتبه‌بندی شده را بهینه می‌کنند. رویکردهای لیستی بیشترین همسویی را با معیارهای سطح لیست که کاربران واقعاً به آن‌ها اهمیت می‌دهند، دارند.
چرا از داده‌های کلیک استفاده کنیم در حالی که سوگیرانه هستند؟: کلیک‌ها بسیار ارزان‌تر و فراوان‌تر از قضاوت‌های دستی مرتبط هستند، بنابراین امکان آموزش در مقیاس بزرگ را فراهم می‌کنند. نکته اینجاست که سوگیری موقعیت و نمایش وجود دارد، به همین دلیل روش‌ها کلیک‌ها را به عنوان ترجیحات نسبی در نظر می‌گیرند و به طور فزاینده‌ای اصلاحات یادگیری بدون سوگیری یا ضدواقعی را اعمال می‌کنند.