یادگیری رتبهبندی
یادگیری رتبهبندی از یادگیری ماشین برای ساخت توابع رتبهبندی استفاده میکند که ویژگیهای بسیاری را ترکیب میکنند و با آموزش بر روی دادههای مرتبط برچسبگذاری شده یا بازخورد کاربر، اسناد را بهتر از یک فرمول دستی تنظیم شده مرتب میکنند.
Definition
یادگیری رتبهبندی استفاده از روشهای یادگیری ماشین برای استخراج تابعی است که مجموعهای از اسناد را برای یک پرس و جو بر اساس ارتباط مرتب میکند، که از مثالهایی آموزش دیده است که در آنها ارتباط نسبی یا مطلق اسناد شناخته شده است، و به صورت رگرسیون یا طبقهبندی نقطهای، یادگیری ترجیحات زوجی، یا بهینهسازی مستقیم لیستی فرموله میشود.
Scope
این موضوع رویکردهای نظارت شده و مبتنی بر بازخورد را برای یادگیری توابع رتبهبندی برای بازیابی پوشش میدهد. این به فرمولبندیهای نقطهای، زوجی و لیستی، استفاده از برچسبهای مرتبط و دادههای کلیک، روشهای نماینده مانند RankNet و درختان رتبهبندی تقویتشده با گرادیان، و بهینهسازی معیارهای مبتنی بر رتبه میپردازد. این موضوع نحوه یادگیری و ارزیابی یک رتبهبندیکننده را به عنوان یک مدل بررسی میکند، در حالی که مونتاژ ویژگیها و خط لوله گستردهتر ارائه خدمات تحت عنوان رتبهبندی جستجوی وب پوشش داده میشود.
Core questions
- مسائل رتبهبندی چگونه به عنوان یادگیری نقطهای، زوجی یا لیستی مطرح میشوند؟
- چه سیگنالهای آموزشی، مانند برچسبهای مرتبط یا دادههای کلیک، یادگیری را هدایت میکنند؟
- چگونه میتوان معیارهای ارزیابی مبتنی بر رتبه را که غیرقابل تفکیک هستند، بهینه کرد؟
- چگونه میتوان بسیاری از ویژگیهای ناهمگن را در یک رتبهبندیکننده یادگرفته شده ترکیب کرد؟
- دادههای کلیک چگونه سوگیری ایجاد میکنند و چگونه میتوان به آن پرداخت؟
Key concepts
- تابع رتبهبندی
- یادگیری نقطهای / زوجی / لیستی
- برچسبهای مرتبط و ارتباط درجهبندی شده
- کلیک و بازخورد ضمنی
- RankNet و درختان تقویتشده با گرادیان
- زیان مبتنی بر رتبه و بهینهسازی معیار
- ترکیب ویژگی
- سوگیری موقعیت
Key theories
- فرمولبندیهای نقطهای، زوجی و لیستی
- رتبهبندی را میتوان با پیشبینی مستقل ارتباط هر سند (نقطهای)، با یادگیری ترتیبهای صحیح جفت اسناد (زوجی)، یا با بهینهسازی یک تابع زیان بر روی کل لیستهای نتایج (لیستی) یاد گرفت، که مورد آخر بیشترین همسویی را با معیارهای مبتنی بر رتبه دارد.
- یادگیری از دادههای کلیک
- کلیکهای کاربر بازخورد ضمنی مرتبط فراوان اما سوگیرانه را فراهم میکنند؛ در نظر گرفتن کلیکها به عنوان ترجیحات نسبی در یک لیست نتایج، امکان آموزش توابع رتبهبندی را از گزارشهای تعامل به جای تنها برچسبهای دستی پرهزینه فراهم میآورد.
Clinical relevance
یادگیری رتبهبندی روش استاندارد سیستمهای جستجو و توصیهگر مدرن برای ترکیب سیگنالها است، و رتبهبندیکنندههای یادگیری ماشین مبتنی بر درختان تقویتشده با گرادیان و مدلهای عصبی، ترتیب نتایج موتورهای جستجوی وب اصلی، جستجوی تجارت الکترونیک، و رتبهبندی تبلیغات را هدایت میکنند.
History
با انباشت سیگنالهای رتبهبندی متعدد در جستجوی وب، تنظیم دستی غیرعملی شد و این امر انگیزه یادگیری رتبهبندی با استفاده از ماشین را فراهم آورد. کار یواخیمز در سال ۲۰۰۲ نشان داد که دادههای کلیک میتوانند رتبهبندیکنندهها را آموزش دهند؛ RankNet (۲۰۰۵) توسط بورگس و همکارانش رتبهبندی زوجی عصبی و نسلهای بعدی آن LambdaRank و LambdaMART را معرفی کرد؛ و بررسی لیو در سال ۲۰۰۹ این حوزه را حول پارادایمهای نقطهای، زوجی و لیستی تثبیت کرد.
Key figures
- Tie-Yan Liu
- Christopher Burges
- Thorsten Joachims
Related topics
Seminal works
- liu2009
- burges2005
- joachims2002
Frequently asked questions
- تفاوت بین یادگیری رتبهبندی نقطهای، زوجی و لیستی چیست؟
- روشهای نقطهای یک امتیاز ارتباط را برای هر سند به طور مستقل پیشبینی میکنند؛ روشهای زوجی یاد میگیرند که کدام یک از دو سند باید رتبه بالاتری داشته باشد؛ روشهای لیستی یک تابع زیان تعریف شده بر روی کل یک لیست رتبهبندی شده را بهینه میکنند. رویکردهای لیستی بیشترین همسویی را با معیارهای سطح لیست که کاربران واقعاً به آنها اهمیت میدهند، دارند.
- چرا از دادههای کلیک استفاده کنیم در حالی که سوگیرانه هستند؟
- کلیکها بسیار ارزانتر و فراوانتر از قضاوتهای دستی مرتبط هستند، بنابراین امکان آموزش در مقیاس بزرگ را فراهم میکنند. نکته اینجاست که سوگیری موقعیت و نمایش وجود دارد، به همین دلیل روشها کلیکها را به عنوان ترجیحات نسبی در نظر میگیرند و به طور فزایندهای اصلاحات یادگیری بدون سوگیری یا ضدواقعی را اعمال میکنند.