ScholarGate
Asistente

Bases de Datos Léxicas y Ontologías

Inventarios legibles por máquina de los significados de las palabras y sus relaciones —WordNet, FrameNet y ontologías relacionadas— que proporcionan a los sistemas computacionales acceso estructurado a la semántica léxica.

Encontrar tema con PaperMindPróximamenteFind papers & topics
Tools & resources
Descargar diapositivas
Learn & explore
VídeoPróximamente

Definition

Una base de datos léxica u ontología es un recurso estructurado que registra los sentidos de las palabras y las relaciones semánticas entre ellas en un formato utilizable por programas informáticos.

Scope

Cubre el diseño y uso de recursos léxico-semánticos: los synsets y las relaciones jerárquicas de WordNet, los marcos semánticos y los roles de FrameNet, y las ontologías computacionales más amplias. Aborda cómo dichos recursos codifican la sinonimia, la hiperonimia y la estructura predicado-argumento, y cómo apoyan la desambiguación y la inferencia. La semántica léxica distribucional y neuronal se cubre bajo la semántica computacional.

Core questions

  • ¿Cómo organiza WordNet los sentidos en synsets vinculados por relaciones léxicas?
  • ¿Cómo representa FrameNet el significado en términos de marcos y roles?
  • ¿Cómo se utilizan estos recursos para la desambiguación y similitud de sentidos de palabras?
  • ¿Cuáles son los límites de las ontologías léxicas construidas manualmente?

Key concepts

  • synset
  • hiperonimia e hiponimia
  • meronimia
  • marco semántico
  • elemento de marco
  • desambiguación del sentido de la palabra
  • ontología léxica
  • estructura predicado-argumento

Key theories

Organización léxica basada en synsets
Modelar el léxico como conjuntos de sinónimos (synsets) conectados por relaciones como la hiperonimia y la meronimia, como en WordNet, dando una estructura de grafo al significado de las palabras.
Semántica de marcos
Representar el significado de las palabras a través de las situaciones (marcos) que evoca y los roles de los participantes dentro de ellas, operacionalizado como un recurso léxico en FrameNet.

History

WordNet, iniciado por el grupo de George Miller en la década de 1980 y documentado en 1995 y 1998, se convirtió en el recurso léxico más utilizado en la lingüística computacional. La semántica de marcos de Fillmore se operacionalizó como FrameNet a finales de la década de 1990, complementando WordNet con una estructura predicado-argumento explícita.

Debates

Recursos construidos manualmente versus representaciones aprendidas
Si las bases de datos léxicas curadas siguen siendo valiosas en la era de los embeddings aprendidos; muchos argumentan que todavía proporcionan una estructura interpretable y una verdad fundamental de la que carecen los modelos distribucionales.

Key figures

  • George Miller
  • Christiane Fellbaum
  • Charles Fillmore
  • Collin Baker

Related topics

Seminal works

  • miller1995
  • fellbaum1998
  • baker1998

Frequently asked questions

¿Qué es un synset en WordNet?
Un synset es un conjunto de palabras que son intercambiables en algún contexto —sinónimos— agrupadas como un solo concepto y vinculadas a otros synsets por relaciones como 'es-un' y 'parte-de'.

Methods for this concept

Related concepts