ScholarGate
دستیار

بازیابی بولی و بولی توسعه‌یافته

بازیابی بولی اسناد را با پرس‌وجوهایی که از اصطلاحات ترکیب‌شده با عملگرهای منطقی AND، OR و NOT ساخته شده‌اند، مطابقت می‌دهد و مجموعه‌ای از اسنادی را بازمی‌گرداند که دقیقاً پرس‌وجو را برآورده می‌کنند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics
Tools & resources
دریافت اسلایدها
Learn & explore
ویدیوبه‌زودی

Definition

بازیابی بولی هر سند را به عنوان مجموعه‌ای از اصطلاحات و هر پرس‌وجو را به عنوان یک عبارت بولی نمایش می‌دهد و دقیقاً آن اسنادی را بازمی‌گرداند که مجموعه‌های اصطلاحات آن‌ها عبارت را درست می‌کنند؛ بازیابی بولی توسعه‌یافته این معناشناسی همه یا هیچ را با تخصیص درجات جزئی تطابق نرم می‌کند تا نتایج بتوانند رتبه‌بندی شوند.

Scope

این موضوع مدل کلاسیک بولی بازیابی را پوشش می‌دهد، که در آن یک پرس‌وجو یک عبارت منطقی بر روی اصطلاحات است و یک سند یا آن را برآورده می‌کند یا نه، و توسعه‌های آن که معناشناسی دقیق نظریه مجموعه‌ها را برای تولید یک رتبه‌بندی نرم می‌کنند، به ویژه مدل بولی توسعه‌یافته (p-نرم). این موضوع به نحو پرس‌وجو، عملیات مجموعه بر روی فهرست‌های پستی، نقاط قوت بازیابی تطابق دقیق، و محدودیت‌هایی که جایگزین‌های رتبه‌بندی شده را برانگیخت، می‌پردازد.

Core questions

  • چگونه یک پرس‌وجو به عنوان ترکیبی از اصطلاحات با استفاده از AND، OR و NOT بیان می‌شود؟
  • چگونه از عملیات مجموعه بر روی فهرست‌های پستی برای محاسبه مجموعه اسناد منطبق استفاده می‌شود؟
  • چرا تطابق دقیق بولی یک مجموعه نتیجه بدون رتبه تولید می‌کند و چرا این می‌تواند یک مشکل باشد؟
  • چگونه مدل‌های بولی توسعه‌یافته امتیازات تطابق جزئی را برای فعال کردن رتبه‌بندی اختصاص می‌دهند؟
  • در چه محیط‌هایی بازیابی بولی با تطابق دقیق همچنان بر بازیابی رتبه‌بندی شده ترجیح داده می‌شود؟

Key concepts

  • عملگرهای بولی (AND, OR, NOT)
  • بازیابی تطابق دقیق
  • عملیات مجموعه بر روی فهرست‌های پستی
  • مجموعه نتیجه بدون رتبه
  • مدل p-نرم
  • تطابق جزئی و عملگرهای بولی نرم
  • قابلیت بیان پرس‌وجو

Key theories

تطابق دقیق نظریه مجموعه‌ها
مدل بولی یک پرس‌وجو را به عنوان یک گزاره منطقی بر روی حضور اصطلاح تفسیر می‌کند و مجموعه دقیق اسناد برآورده‌کننده را بازمی‌گرداند، که کنترل دقیق و قابل پیش‌بینی را فراهم می‌کند اما هیچ مفهومی از درجه ارتباط ندارد.
مدل بولی توسعه‌یافته (p-نرم)
با جاسازی اسناد و پرس‌وجوها در یک فضای اصطلاح وزن‌دار و محاسبه درجات رضایت مبتنی بر فاصله برای AND و OR از طریق یک p-نرم قابل تنظیم، مدل بولی توسعه‌یافته یک رتبه‌بندی را بازیابی می‌کند در حالی که ساختار منطقی پرس‌وجوهای بولی را حفظ می‌کند.

Clinical relevance

بازیابی بولی در مواردی که انتخاب دقیق و قابل حسابرسی اهمیت دارد، مرکزی باقی می‌ماند: جستجوی حقوقی و ثبت اختراع، غربالگری ادبیات برای مرورهای سیستماتیک، و فیلترهای جستجوی پیشرفته سیستم‌های کتابخانه‌ای و پایگاه داده. ایده‌های بولی توسعه‌یافته زبان‌های پرس‌وجوی ساختاریافته‌ای را که عملگرهای منطقی را با امتیازدهی ترکیب می‌کنند، شکل می‌دهند.

History

بازیابی بولی پارادایم غالب سیستم‌های جستجوی تجاری و کتاب‌شناختی اولیه در دهه‌های ۱۹۶۰ و ۱۹۷۰ بود زیرا به طور واضح بر روی عملیات مجموعه کارآمد بر روی فهرست‌های معکوس نگاشت می‌شد. ناتوانی آن در رتبه‌بندی نتایج، مدل بولی توسعه‌یافته سالتون، فاکس و وو در سال ۱۹۸۳ را برانگیخت، که ساختار منطقی پرس‌وجوهای بولی را با وزن‌دهی مدل فضای برداری ترکیب کرد.

Key figures

  • Gerard Salton
  • Edward A. Fox

Related topics

Seminal works

  • manning2008
  • salton1983ext

Frequently asked questions

چرا سیستم‌های بولی خالص نتایج خود را رتبه‌بندی نمی‌کنند؟
یک پرس‌وجوی بولی یک گزاره درست/غلط است، بنابراین یک سند یا آن را برآورده می‌کند یا نمی‌کند؛ هیچ مفهوم داخلی از اینکه یک سند چقدر قوی مطابقت دارد وجود ندارد. بدون وزن‌ها، همه اسناد در مجموعه نتیجه به طور رسمی معادل هستند، به همین دلیل مدل‌های توسعه‌یافته و رتبه‌بندی شده توسعه یافتند.
آیا بازیابی بولی منسوخ شده است؟
خیر. هنوز هم به طور گسترده‌ای در مواردی که دقت و قابلیت توضیح ضروری است، مانند کشف حقوقی، جستجوی ثبت اختراع، و جستجوهای ادبیات تخصصی، استفاده می‌شود، و اکثر موتورهای جستجوی مدرن همچنان عملگرهای به سبک بولی را در کنار بازیابی رتبه‌بندی شده ارائه می‌دهند.

Methods for this concept

Related concepts