ScholarGate
Assistant

Recherche booléenne et booléenne étendue

La recherche booléenne met en correspondance des documents avec des requêtes construites à partir de termes combinés avec les opérateurs logiques ET, OU et NON, renvoyant l'ensemble des documents qui satisfont exactement la requête.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

La recherche booléenne représente chaque document comme un ensemble de termes et chaque requête comme une expression booléenne, renvoyant exactement les documents dont les ensembles de termes rendent l'expression vraie ; la recherche booléenne étendue assouplit cette sémantique du tout ou rien en attribuant des degrés de correspondance partiels afin que les résultats puissent être classés.

Scope

Ce sujet couvre le modèle booléen classique de recherche d'information, dans lequel une requête est une expression logique sur des termes et un document la satisfait ou non, ainsi que ses extensions qui assouplissent la sémantique ensembliste stricte pour produire un classement, notamment le modèle booléen étendu (norme p). Il aborde la syntaxe des requêtes, les opérations ensemblistes sur les listes d'occurrences (postings), les atouts de la recherche par correspondance exacte et les limites qui ont motivé les alternatives classées.

Core questions

  • Comment une requête est-elle exprimée comme une combinaison de termes utilisant ET, OU et NON ?
  • Comment les opérations ensemblistes sur les listes d'occurrences sont-elles utilisées pour calculer l'ensemble des documents correspondants ?
  • Pourquoi la correspondance booléenne stricte produit-elle un ensemble de résultats non classés, et pourquoi cela peut-il être un problème ?
  • Comment les modèles booléens étendus attribuent-ils des scores de correspondance partielle pour permettre le classement ?
  • Dans quels contextes la recherche booléenne par correspondance exacte reste-t-elle préférable à la recherche classée ?

Key concepts

  • Opérateurs booléens (ET, OU, NON)
  • recherche par correspondance exacte
  • opérations ensemblistes sur les listes d'occurrences
  • ensemble de résultats non classés
  • modèle de norme p
  • correspondance partielle et opérateurs booléens souples
  • expressivité des requêtes

Key theories

Correspondance exacte ensembliste
Le modèle booléen interprète une requête comme un prédicat logique sur la présence de termes et renvoie l'ensemble exact des documents satisfaisants, offrant un contrôle précis et prévisible mais aucune notion de degré de pertinence.
Modèle booléen étendu (norme p)
En intégrant les documents et les requêtes dans un espace de termes pondéré et en calculant des degrés de satisfaction basés sur la distance pour ET et OU via une norme p ajustable, le modèle booléen étendu permet de retrouver un classement tout en préservant la structure logique des requêtes booléennes.

Clinical relevance

La recherche booléenne reste essentielle là où une sélection précise et vérifiable est importante : la recherche juridique et de brevets, le criblage de la littérature pour les revues systématiques, et les filtres de recherche avancée des systèmes de bibliothèques et de bases de données. Les concepts booléens étendus éclairent les langages de requête structurés qui combinent des opérateurs logiques avec un système de score.

History

La recherche booléenne a été le paradigme dominant des premiers systèmes de recherche commerciaux et bibliographiques dans les années 1960 et 1970, car elle se traduisait clairement par des opérations ensemblistes efficaces sur des listes inversées. Son incapacité à classer les résultats a stimulé le développement du modèle booléen étendu de Salton, Fox et Wu en 1983, qui a fusionné la structure logique des requêtes booléennes avec la pondération du modèle d'espace vectoriel.

Key figures

  • Gerard Salton
  • Edward A. Fox

Related topics

Seminal works

  • manning2008
  • salton1983ext

Frequently asked questions

Pourquoi les systèmes booléens purs ne classent-ils pas leurs résultats ?
Une requête booléenne est un prédicat vrai/faux, donc un document la satisfait ou non ; il n'y a pas de notion intrinsèque de la force de correspondance d'un document. Sans pondération, tous les documents de l'ensemble de résultats sont formellement équivalents, c'est pourquoi des modèles étendus et classés ont été développés.
La recherche booléenne est-elle obsolète ?
Non. Elle est toujours largement utilisée là où la précision et l'explicabilité sont essentielles, comme la découverte juridique, la recherche de brevets et les recherches documentaires spécialisées, et la plupart des moteurs de recherche modernes proposent toujours des opérateurs de style booléen en parallèle de la recherche classée.

Methods for this concept

Related concepts