Boolean ve Genişletilmiş Boolean Erişim
Boolean erişim, terimlerin VE, VEYA ve DEĞİL mantıksal operatörleriyle birleştirilmesiyle oluşturulan sorgulara karşı belgeleri eşleştirerek, sorguyu tam olarak karşılayan belge kümesini döndürmektedir.
Tanım
Boolean erişim, her belgeyi bir terim kümesi olarak ve her sorguyu bir Boolean ifadesi olarak temsil etmekte, terim kümeleri ifadeyi doğru kılan belgeleri tam olarak döndürmektedir; genişletilmiş Boolean erişim ise, sonuçların sıralanabilmesi için kısmi eşleşme dereceleri atayarak bu 'ya hep ya hiç' semantiğini gevşetmektedir.
Kapsam
Bu konu, bir sorgunun terimler üzerinde mantıksal bir ifade olduğu ve bir belgenin bu ifadeyi ya karşıladığı ya da karşılamadığı klasik Boolean erişim modelini ve katı küme-teorik semantiği yumuşatarak bir sıralama üretmeyi amaçlayan uzantılarını, özellikle de genişletilmiş Boolean (p-norm) modelini kapsamaktadır. Sorgu sözdizimi, gönderiler (postings) üzerindeki küme işlemleri, tam eşleşmeli erişimin güçlü yönleri ve sıralı alternatifleri motive eden sınırlamalar ele alınmaktadır.
Temel sorular
- Bir sorgu, VE, VEYA ve DEĞİL kullanılarak terimlerin bir kombinasyonu olarak nasıl ifade edilmektedir?
- Gönderiler (postings) üzerindeki küme işlemleri, eşleşen belge kümesini hesaplamak için nasıl kullanılmaktadır?
- Katı Boolean eşleşmesi neden sıralanmamış bir sonuç kümesi üretmektedir ve bu neden bir sorun teşkil edebilmektedir?
- Genişletilmiş Boolean modelleri, sıralamayı sağlamak için kısmi eşleşme puanlarını nasıl atamaktadır?
- Hangi durumlarda tam eşleşmeli Boolean erişim, sıralı erişime tercih edilmeye devam etmektedir?
Anahtar kavramlar
- Boolean operatörleri (VE, VEYA, DEĞİL)
- tam eşleşmeli erişim
- gönderiler (postings) üzerindeki küme işlemleri
- sıralanmamış sonuç kümesi
- p-norm modeli
- kısmi eşleşme ve yumuşak Boolean operatörleri
- sorgu ifade gücü
Temel kuramlar
- Küme-teorik tam eşleşme
- Boolean modeli, bir sorguyu terim varlığı üzerinde mantıksal bir yüklem olarak yorumlamakta ve tam olarak karşılayan belge kümesini döndürmektedir; bu, hassas ve öngörülebilir kontrol sağlarken, alaka derecesi kavramını içermemektedir.
- Genişletilmiş Boolean (p-norm) modeli
- Belgeleri ve sorguları ağırlıklı bir terim uzayına yerleştirerek ve ayarlanabilir bir p-norm aracılığıyla VE ve VEYA için mesafeye dayalı tatmin dereceleri hesaplayarak, genişletilmiş Boolean modeli, Boolean sorgularının mantıksal yapısını korurken bir sıralama elde etmektedir.
Klinik önem
Boolean erişim, hassas ve denetlenebilir seçimin önemli olduğu alanlarda merkezi bir rol oynamaya devam etmektedir: hukuki ve patent aramaları, sistematik derleme literatür taraması ve kütüphane ile veritabanı sistemlerinin gelişmiş arama filtreleri. Genişletilmiş Boolean fikirleri, mantıksal operatörleri puanlama ile birleştiren yapılandırılmış sorgu dillerine temel oluşturmaktadır.
Tarihçe
Boolean erişim, 1960'lar ve 1970'ler boyunca erken ticari ve bibliyografik arama sistemlerinin baskın paradigması olmuştur, çünkü ters dizinler (inverted lists) üzerindeki verimli küme işlemlerine net bir şekilde eşleşmekteydi. Sonuçları sıralayamaması, Salton, Fox ve Wu'nun 1983 tarihli genişletilmiş Boolean modelini tetiklemiştir; bu model, Boolean sorgularının mantıksal yapısını vektör uzay modelinin ağırlıklandırmasıyla harmanlamıştır.
Öne çıkan isimler
- Gerard Salton
- Edward A. Fox
İlgili konular
Temel eserler
- manning2008
- salton1983ext
Sıkça sorulan sorular
- Saf Boolean sistemleri neden sonuçlarını sıralamamaktadır?
- Bir Boolean sorgusu doğru/yanlış bir yüklemdir, bu nedenle bir belge ya sorguyu karşılar ya da karşılamaz; bir belgenin ne kadar güçlü eşleştiğine dair yerleşik bir kavram bulunmamaktadır. Ağırlıklar olmadan, sonuç kümesindeki tüm belgeler biçimsel olarak eşdeğerdir, bu nedenle genişletilmiş ve sıralı modeller geliştirilmiştir.
- Boolean erişim modası geçmiş midir?
- Hayır. Hukuki keşif, patent araması ve uzman literatür taramaları gibi hassasiyet ve açıklanabilirliğin esas olduğu yerlerde hala yaygın olarak kullanılmaktadır ve çoğu modern arama motoru, sıralı erişimin yanı sıra Boolean tarzı operatörleri de sunmaktadır.