ScholarGate
Assistant

Bases de données lexicales et ontologies

Inventaires lisibles par machine des significations des mots et de leurs relations — WordNet, FrameNet et les ontologies associées — qui offrent aux systèmes informatiques un accès structuré à la sémantique lexicale.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

Une base de données lexicale ou une ontologie est une ressource structurée qui enregistre les sens des mots et les relations sémantiques entre eux sous une forme utilisable par des programmes informatiques.

Scope

Couvre la conception et l'utilisation des ressources sémantiques lexicales : les synsets et les relations hiérarchiques de WordNet, les cadres sémantiques et les rôles de FrameNet, ainsi que les ontologies computationnelles plus larges. Il aborde la manière dont ces ressources encodent la synonymie, l'hyperonymie et la structure prédicat-argument, et comment elles soutiennent la désambiguïsation et l'inférence. La sémantique lexicale distributionnelle et neuronale est traitée dans le cadre de la sémantique computationnelle.

Core questions

  • Comment WordNet organise-t-il les sens en synsets liés par des relations lexicales ?
  • Comment FrameNet représente-t-il le sens en termes de cadres et de rôles ?
  • Comment ces ressources sont-elles utilisées pour la désambiguïsation et la similarité des sens des mots ?
  • Quelles sont les limites des ontologies lexicales construites manuellement ?

Key concepts

  • synset
  • hyperonymie et hyponymie
  • méronymie
  • cadre sémantique
  • élément de cadre
  • désambiguïsation du sens des mots
  • ontologie lexicale
  • structure prédicat-argument

Key theories

Organisation lexicale basée sur les synsets
Modélisation du lexique comme des ensembles de synonymes (synsets) connectés par des relations telles que l'hyperonymie et la méronymie, comme dans WordNet, conférant une structure de graphe au sens des mots.
Sémantique des cadres
Représentation du sens des mots via les situations (cadres) qu'il évoque et les rôles des participants au sein de celles-ci, opérationnalisée comme une ressource lexicale dans FrameNet.

History

WordNet, initié par le groupe de George Miller dans les années 1980 et documenté en 1995 et 1998, est devenu la ressource lexicale la plus largement utilisée en linguistique computationnelle. La sémantique des cadres de Fillmore a été opérationnalisée sous le nom de FrameNet à la fin des années 1990, complétant WordNet avec une structure prédicat-argument explicite.

Debates

Ressources construites manuellement versus représentations apprises
La question de savoir si les bases de données lexicales organisées manuellement conservent leur valeur à l'ère des plongements lexicaux appris ; beaucoup soutiennent qu'elles fournissent toujours une structure interprétable et une vérité terrain que les modèles distributionnels n'ont pas.

Key figures

  • George Miller
  • Christiane Fellbaum
  • Charles Fillmore
  • Collin Baker

Related topics

Seminal works

  • miller1995
  • fellbaum1998
  • baker1998

Frequently asked questions

Qu'est-ce qu'un synset dans WordNet ?
Un synset est un ensemble de mots interchangeables dans un certain contexte — des synonymes — regroupés comme un concept unique et liés à d'autres synsets par des relations comme 'est-un' et 'partie-de'.

Methods for this concept

Related concepts