ScholarGate
Asisten

Pengambilan Boolean dan Boolean Diperluas

Pengambilan Boolean mencocokkan dokumen dengan kueri yang dibangun dari istilah-istilah yang digabungkan dengan operator logika AND, OR, dan NOT, mengembalikan kumpulan dokumen yang secara tepat memenuhi kueri tersebut.

Temukan Topik dengan PaperMindSegeraFind papers & topics
Tools & resources
Unduh salindia
Learn & explore
VideoSegera

Definition

Pengambilan Boolean merepresentasikan setiap dokumen sebagai sekumpulan istilah dan setiap kueri sebagai ekspresi Boolean, mengembalikan secara tepat dokumen-dokumen yang kumpulan istilahnya membuat ekspresi tersebut benar; pengambilan Boolean diperluas melonggarkan semantik semua-atau-tidak sama sekali ini dengan menetapkan derajat pencocokan parsial sehingga hasilnya dapat diberi peringkat.

Scope

Topik ini mencakup model Boolean klasik dalam pengambilan informasi, di mana kueri adalah ekspresi logis atas istilah-istilah dan sebuah dokumen memenuhinya atau tidak, serta perluasannya yang melunakkan semantik teori himpunan yang ketat untuk menghasilkan peringkat, terutama model Boolean diperluas (p-norm). Ini membahas sintaks kueri, operasi himpunan atas postingan, kekuatan pengambilan pencocokan-persis, dan keterbatasan yang memotivasi alternatif berperingkat.

Core questions

  • Bagaimana kueri diekspresikan sebagai kombinasi istilah menggunakan AND, OR, dan NOT?
  • Bagaimana operasi himpunan pada postingan digunakan untuk menghitung kumpulan dokumen yang cocok?
  • Mengapa pencocokan Boolean yang ketat menghasilkan kumpulan hasil yang tidak berperingkat, dan mengapa hal itu bisa menjadi masalah?
  • Bagaimana model Boolean yang diperluas menetapkan skor pencocokan parsial untuk memungkinkan pemeringkatan?
  • Dalam pengaturan apa pengambilan Boolean pencocokan-persis tetap lebih disukai daripada pengambilan berperingkat?

Key concepts

  • Operator Boolean (AND, OR, NOT)
  • pengambilan pencocokan-persis
  • operasi himpunan atas postingan
  • kumpulan hasil tidak berperingkat
  • model p-norm
  • pencocokan parsial dan operator Boolean lunak
  • ekspresivitas kueri

Key theories

Pencocokan persis teori himpunan
Model Boolean menafsirkan kueri sebagai predikat logis atas keberadaan istilah dan mengembalikan kumpulan dokumen yang memenuhi secara persis, memberikan kontrol yang tepat dan dapat diprediksi tetapi tanpa konsep tingkat relevansi.
Model Boolean diperluas (p-norm)
Dengan menanamkan dokumen dan kueri dalam ruang istilah berbobot dan menghitung derajat kepuasan berbasis jarak untuk AND dan OR melalui p-norm yang dapat disetel, model Boolean yang diperluas mendapatkan kembali peringkat sambil mempertahankan struktur logis kueri Boolean.

Clinical relevance

Pengambilan Boolean tetap menjadi pusat di mana seleksi yang tepat dan dapat diaudit menjadi penting: pencarian hukum dan paten, penyaringan literatur tinjauan sistematis, dan filter pencarian lanjutan pada sistem perpustakaan dan basis data. Ide-ide Boolean yang diperluas menginformasikan bahasa kueri terstruktur yang menggabungkan operator logika dengan penilaian.

History

Pengambilan Boolean adalah paradigma dominan sistem pencarian komersial dan bibliografi awal sepanjang tahun 1960-an dan 1970-an karena secara jelas memetakan operasi himpunan yang efisien atas daftar terbalik. Ketidakmampuannya untuk memberi peringkat hasil mendorong model Boolean diperluas Salton, Fox, dan Wu pada tahun 1983, yang memadukan struktur logis kueri Boolean dengan pembobotan model ruang vektor.

Key figures

  • Gerard Salton
  • Edward A. Fox

Related topics

Seminal works

  • manning2008
  • salton1983ext

Frequently asked questions

Mengapa sistem Boolean murni tidak memberi peringkat pada hasilnya?
Kueri Boolean adalah predikat benar/salah, sehingga sebuah dokumen memenuhinya atau tidak; tidak ada konsep bawaan tentang seberapa kuat sebuah dokumen cocok. Tanpa bobot, semua dokumen dalam kumpulan hasil secara formal setara, itulah sebabnya model yang diperluas dan berperingkat dikembangkan.
Apakah pengambilan Boolean sudah usang?
Tidak. Ini masih banyak digunakan di mana presisi dan kemampuan penjelasan sangat penting, seperti penemuan hukum, pencarian paten, dan pencarian literatur ahli, dan sebagian besar mesin pencari modern masih mengekspos operator gaya Boolean di samping pengambilan berperingkat.

Methods for this concept

Related concepts