بازیابی بولی و بولی توسعهیافته
بازیابی بولی اسناد را با پرسوجوهایی که از اصطلاحات ترکیبشده با عملگرهای منطقی AND، OR و NOT ساخته شدهاند، مطابقت میدهد و مجموعهای از اسنادی را بازمیگرداند که دقیقاً پرسوجو را برآورده میکنند.
Definition
بازیابی بولی هر سند را به عنوان مجموعهای از اصطلاحات و هر پرسوجو را به عنوان یک عبارت بولی نمایش میدهد و دقیقاً آن اسنادی را بازمیگرداند که مجموعههای اصطلاحات آنها عبارت را درست میکنند؛ بازیابی بولی توسعهیافته این معناشناسی همه یا هیچ را با تخصیص درجات جزئی تطابق نرم میکند تا نتایج بتوانند رتبهبندی شوند.
Scope
این موضوع مدل کلاسیک بولی بازیابی را پوشش میدهد، که در آن یک پرسوجو یک عبارت منطقی بر روی اصطلاحات است و یک سند یا آن را برآورده میکند یا نه، و توسعههای آن که معناشناسی دقیق نظریه مجموعهها را برای تولید یک رتبهبندی نرم میکنند، به ویژه مدل بولی توسعهیافته (p-نرم). این موضوع به نحو پرسوجو، عملیات مجموعه بر روی فهرستهای پستی، نقاط قوت بازیابی تطابق دقیق، و محدودیتهایی که جایگزینهای رتبهبندی شده را برانگیخت، میپردازد.
Core questions
- چگونه یک پرسوجو به عنوان ترکیبی از اصطلاحات با استفاده از AND، OR و NOT بیان میشود؟
- چگونه از عملیات مجموعه بر روی فهرستهای پستی برای محاسبه مجموعه اسناد منطبق استفاده میشود؟
- چرا تطابق دقیق بولی یک مجموعه نتیجه بدون رتبه تولید میکند و چرا این میتواند یک مشکل باشد؟
- چگونه مدلهای بولی توسعهیافته امتیازات تطابق جزئی را برای فعال کردن رتبهبندی اختصاص میدهند؟
- در چه محیطهایی بازیابی بولی با تطابق دقیق همچنان بر بازیابی رتبهبندی شده ترجیح داده میشود؟
Key concepts
- عملگرهای بولی (AND, OR, NOT)
- بازیابی تطابق دقیق
- عملیات مجموعه بر روی فهرستهای پستی
- مجموعه نتیجه بدون رتبه
- مدل p-نرم
- تطابق جزئی و عملگرهای بولی نرم
- قابلیت بیان پرسوجو
Key theories
- تطابق دقیق نظریه مجموعهها
- مدل بولی یک پرسوجو را به عنوان یک گزاره منطقی بر روی حضور اصطلاح تفسیر میکند و مجموعه دقیق اسناد برآوردهکننده را بازمیگرداند، که کنترل دقیق و قابل پیشبینی را فراهم میکند اما هیچ مفهومی از درجه ارتباط ندارد.
- مدل بولی توسعهیافته (p-نرم)
- با جاسازی اسناد و پرسوجوها در یک فضای اصطلاح وزندار و محاسبه درجات رضایت مبتنی بر فاصله برای AND و OR از طریق یک p-نرم قابل تنظیم، مدل بولی توسعهیافته یک رتبهبندی را بازیابی میکند در حالی که ساختار منطقی پرسوجوهای بولی را حفظ میکند.
Clinical relevance
بازیابی بولی در مواردی که انتخاب دقیق و قابل حسابرسی اهمیت دارد، مرکزی باقی میماند: جستجوی حقوقی و ثبت اختراع، غربالگری ادبیات برای مرورهای سیستماتیک، و فیلترهای جستجوی پیشرفته سیستمهای کتابخانهای و پایگاه داده. ایدههای بولی توسعهیافته زبانهای پرسوجوی ساختاریافتهای را که عملگرهای منطقی را با امتیازدهی ترکیب میکنند، شکل میدهند.
History
بازیابی بولی پارادایم غالب سیستمهای جستجوی تجاری و کتابشناختی اولیه در دهههای ۱۹۶۰ و ۱۹۷۰ بود زیرا به طور واضح بر روی عملیات مجموعه کارآمد بر روی فهرستهای معکوس نگاشت میشد. ناتوانی آن در رتبهبندی نتایج، مدل بولی توسعهیافته سالتون، فاکس و وو در سال ۱۹۸۳ را برانگیخت، که ساختار منطقی پرسوجوهای بولی را با وزندهی مدل فضای برداری ترکیب کرد.
Key figures
- Gerard Salton
- Edward A. Fox
Related topics
Seminal works
- manning2008
- salton1983ext
Frequently asked questions
- چرا سیستمهای بولی خالص نتایج خود را رتبهبندی نمیکنند؟
- یک پرسوجوی بولی یک گزاره درست/غلط است، بنابراین یک سند یا آن را برآورده میکند یا نمیکند؛ هیچ مفهوم داخلی از اینکه یک سند چقدر قوی مطابقت دارد وجود ندارد. بدون وزنها، همه اسناد در مجموعه نتیجه به طور رسمی معادل هستند، به همین دلیل مدلهای توسعهیافته و رتبهبندی شده توسعه یافتند.
- آیا بازیابی بولی منسوخ شده است؟
- خیر. هنوز هم به طور گستردهای در مواردی که دقت و قابلیت توضیح ضروری است، مانند کشف حقوقی، جستجوی ثبت اختراع، و جستجوهای ادبیات تخصصی، استفاده میشود، و اکثر موتورهای جستجوی مدرن همچنان عملگرهای به سبک بولی را در کنار بازیابی رتبهبندی شده ارائه میدهند.