Bases de Datos Léxicas y Ontologías
Inventarios legibles por máquina de los significados de las palabras y sus relaciones —WordNet, FrameNet y ontologías relacionadas— que proporcionan a los sistemas computacionales acceso estructurado a la semántica léxica.
Definition
Una base de datos léxica u ontología es un recurso estructurado que registra los sentidos de las palabras y las relaciones semánticas entre ellas en un formato utilizable por programas informáticos.
Scope
Cubre el diseño y uso de recursos léxico-semánticos: los synsets y las relaciones jerárquicas de WordNet, los marcos semánticos y los roles de FrameNet, y las ontologías computacionales más amplias. Aborda cómo dichos recursos codifican la sinonimia, la hiperonimia y la estructura predicado-argumento, y cómo apoyan la desambiguación y la inferencia. La semántica léxica distribucional y neuronal se cubre bajo la semántica computacional.
Core questions
- ¿Cómo organiza WordNet los sentidos en synsets vinculados por relaciones léxicas?
- ¿Cómo representa FrameNet el significado en términos de marcos y roles?
- ¿Cómo se utilizan estos recursos para la desambiguación y similitud de sentidos de palabras?
- ¿Cuáles son los límites de las ontologías léxicas construidas manualmente?
Key concepts
- synset
- hiperonimia e hiponimia
- meronimia
- marco semántico
- elemento de marco
- desambiguación del sentido de la palabra
- ontología léxica
- estructura predicado-argumento
Key theories
- Organización léxica basada en synsets
- Modelar el léxico como conjuntos de sinónimos (synsets) conectados por relaciones como la hiperonimia y la meronimia, como en WordNet, dando una estructura de grafo al significado de las palabras.
- Semántica de marcos
- Representar el significado de las palabras a través de las situaciones (marcos) que evoca y los roles de los participantes dentro de ellas, operacionalizado como un recurso léxico en FrameNet.
History
WordNet, iniciado por el grupo de George Miller en la década de 1980 y documentado en 1995 y 1998, se convirtió en el recurso léxico más utilizado en la lingüística computacional. La semántica de marcos de Fillmore se operacionalizó como FrameNet a finales de la década de 1990, complementando WordNet con una estructura predicado-argumento explícita.
Debates
- Recursos construidos manualmente versus representaciones aprendidas
- Si las bases de datos léxicas curadas siguen siendo valiosas en la era de los embeddings aprendidos; muchos argumentan que todavía proporcionan una estructura interpretable y una verdad fundamental de la que carecen los modelos distribucionales.
Key figures
- George Miller
- Christiane Fellbaum
- Charles Fillmore
- Collin Baker
Related topics
Seminal works
- miller1995
- fellbaum1998
- baker1998
Frequently asked questions
- ¿Qué es un synset en WordNet?
- Un synset es un conjunto de palabras que son intercambiables en algún contexto —sinónimos— agrupadas como un solo concepto y vinculadas a otros synsets por relaciones como 'es-un' y 'parte-de'.