چرا هر سند در مجموعه قضاوت نمیشود؟

مجموعههای بزرگ شامل میلیونها سند هستند، بنابراین قضاوت همه آنها برای هر موضوع غیرممکن است. ادغام تنها اسنادی را قضاوت میکند که سیستمهای مشارکتکننده رتبه بالایی به آنها میدهند، که بیشتر اسناد مرتبط را در بر میگیرد در حالی که تلاش ارزیابی را قابل مدیریت نگه میدارد.

خطر برخورد با اسناد قضاوتنشده به عنوان نامرتبط چیست؟

یک سیستم بعدی ممکن است اسناد مرتبطی را بازیابی کند که هرگز در مجموعه نبودهاند و بنابراین نامرتبط شمرده شدهاند، که به طور ناعادلانهای امتیاز اندازهگیری شده آن را کاهش میدهد. این سوگیری مجموعه دلیلی است که هنگام استفاده مجدد از مجموعهها، از مجموعههای عمیقتر و متنوعتر و معیارهای مقاوم در برابر قضاوت استفاده میشود.

ادغام و ارزیابی ارتباط

ادغام روشی است که ارزیابی در مقیاس بزرگ بازیابی اطلاعات (IR) را با قضاوت تنها اسنادی که سیستم‌های شرکت‌کننده رتبه بالایی به آن‌ها می‌دهند، به جای هر سند در مجموعه، امکان‌پذیر می‌سازد.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics

Tools & resources

دریافت اسلایدها

Learn & explore

ویدیوبه‌زودی

Definition

ادغام یک استراتژی نمونه‌برداری برای ارزیابی ارتباط است که در آن اسناد با بالاترین رتبه از مجموعه‌ای از اجراهای بازیابی مشارکت‌کننده، پس از حذف موارد تکراری، در یک مجموعه ادغام می‌شوند که ارزیابان انسانی آن را قضاوت می‌کنند، و اسناد خارج از مجموعه به طور معمول نامرتبط در نظر گرفته می‌شوند.

Scope

این موضوع به چگونگی جمع‌آوری کارآمد قضاوت‌های ارتباط برای مجموعه‌های بزرگ، عمدتاً روش ادغام مورد استفاده در TREC و کمپین‌های مشابه، می‌پردازد؛ جایی که اسناد با رتبه بالا از سیستم‌های متعدد در یک مجموعه ادغام می‌شوند که ارزیابان آن را قضاوت می‌کنند. این موضوع به عمق مجموعه، برخورد با اسناد قضاوت‌نشده به عنوان نامرتبط، قابلیت استفاده مجدد و سوگیری احتمالی مجموعه‌های ادغام‌شده، و تلاش و توافق ارزیاب می‌پردازد. این موضوع شامل معیارهای محاسبه‌شده پس از آن و تعریف خود مجموعه نمی‌شود.

Core questions

چگونه ادغام تعداد اسنادی را که باید قضاوت شوند کاهش می‌دهد؟
عمق مجموعه چگونه انتخاب می‌شود و چگونه بر پوشش اسناد مرتبط تأثیر می‌گذارد؟
چرا اسناد قضاوت‌نشده معمولاً نامرتبط در نظر گرفته می‌شوند و این چه سوگیری می‌تواند ایجاد کند؟
مجموعه‌های ادغام‌شده برای سیستم‌هایی که در ایجاد مجموعه مشارکت نداشته‌اند، چقدر قابل استفاده مجدد هستند؟
تلاش، توافق و کیفیت ارزیاب چگونه مدیریت می‌شود؟

Key concepts

روش ادغام
عمق مجموعه
اجراهای مشارکت‌کننده
فرض قضاوت‌نشده-به‌عنوان-نامرتبط
سوگیری و قابلیت استفاده مجدد مجموعه
توافق ارزیاب
اطلاعات ناقص ارتباط
ارزیابی ارتباط با کمک جمعی

Key theories

ادغام برای ارزیابی مقیاس‌پذیر: با قضاوت تنها اجتماع اسناد با رتبه بالا از سیستم‌های متنوع متعدد، ادغام ارزیابی مجموعه‌های بزرگ را عملی می‌سازد، در حالی که بیشتر اسناد مرتبطی را که هر سیستم معقولی ممکن است آشکار کند، پیدا می‌کند.
نگرانی‌های قابلیت اطمینان و استفاده مجدد: ادغام ممکن است اسناد مرتبطی را که فقط توسط سیستم‌های آینده یافت می‌شوند، کمتر نشان دهد، که سؤالاتی را در مورد سوگیری و قابلیت استفاده مجدد مطرح می‌کند که انگیزه‌ای برای مجموعه‌های عمیق‌تر، مشارکت‌کنندگان متنوع و معیارهای قوی برای قضاوت‌های ناقص است.

Clinical relevance

ادغام چیزی است که مجموعه‌های آزمایشی مشترک و قابل استفاده مجدد را مقرون به صرفه می‌سازد و مبنای قضاوت‌های پشت دهه‌ها نتایج معیار است. درک مفروضات آن هنگام استفاده مجدد از مجموعه‌های قدیمی برای ارزیابی روش‌های جدید، به ویژه سیستم‌های عصبی که ممکن است اسناد مرتبطی را که مجموعه‌های اصلی هرگز قضاوت نکرده‌اند، آشکار کنند، اهمیت دارد.

History

ادغام از ابتدای TREC در سال 1992 برای قابل مدیریت کردن قضاوت مجموعه‌های بزرگ به کار گرفته شد. تحلیل زوبل در سال 1998 قابلیت اطمینان و قابلیت استفاده مجدد مجموعه‌های ادغام‌شده را بررسی کرد و کارهای بعدی در مورد قضاوت‌های ناقص، معیارها و استراتژی‌های ادغام عمیق‌تر یا هوشمندانه‌تر را برای کاهش سوگیری با تکامل مجموعه‌ها و جمعیت سیستم‌ها ارائه داد.

Key figures

Ellen M. Voorhees
Justin Zobel
Chris Buckley

Seminal works

voorhees2005
zobel1998
buckley2004

Frequently asked questions

چرا هر سند در مجموعه قضاوت نمی‌شود؟: مجموعه‌های بزرگ شامل میلیون‌ها سند هستند، بنابراین قضاوت همه آن‌ها برای هر موضوع غیرممکن است. ادغام تنها اسنادی را قضاوت می‌کند که سیستم‌های مشارکت‌کننده رتبه بالایی به آن‌ها می‌دهند، که بیشتر اسناد مرتبط را در بر می‌گیرد در حالی که تلاش ارزیابی را قابل مدیریت نگه می‌دارد.
خطر برخورد با اسناد قضاوت‌نشده به عنوان نامرتبط چیست؟: یک سیستم بعدی ممکن است اسناد مرتبطی را بازیابی کند که هرگز در مجموعه نبوده‌اند و بنابراین نامرتبط شمرده شده‌اند، که به طور ناعادلانه‌ای امتیاز اندازه‌گیری شده آن را کاهش می‌دهد. این سوگیری مجموعه دلیلی است که هنگام استفاده مجدد از مجموعه‌ها، از مجموعه‌های عمیق‌تر و متنوع‌تر و معیارهای مقاوم در برابر قضاوت استفاده می‌شود.