ScholarGate
Ассистент

Лексические базы данных и онтологии

Машиночитаемые инвентари значений слов и их отношений — WordNet, FrameNet и связанные онтологии — которые предоставляют вычислительным системам структурированный доступ к лексической семантике.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Лексическая база данных или онтология — это структурированный ресурс, который записывает значения слов и семантические отношения между ними в форме, пригодной для использования компьютерными программами.

Scope

Охватывает разработку и использование лексико-семантических ресурсов: синсеты и иерархические отношения WordNet, семантические фреймы и роли FrameNet, а также более широкие вычислительные онтологии. Рассматривается, как такие ресурсы кодируют синонимию, гиперонимию и предикатно-аргументную структуру, а также как они поддерживают разрешение неоднозначности и вывод. Дистрибутивная и нейросетевая лексическая семантика рассматриваются в рамках вычислительной семантики.

Core questions

  • Как WordNet организует значения в синсеты, связанные лексическими отношениями?
  • Как FrameNet представляет значение в терминах фреймов и ролей?
  • Как эти ресурсы используются для разрешения неоднозначности слов и определения их сходства?
  • Каковы ограничения созданных вручную лексических онтологий?

Key concepts

  • синсет
  • гиперонимия и гипонимия
  • меронимия
  • семантический фрейм
  • элемент фрейма
  • разрешение лексической многозначности
  • лексическая онтология
  • предикатно-аргументная структура

Key theories

Синсет-ориентированная лексическая организация
Моделирование лексикона как наборов синонимов (синсетов), связанных такими отношениями, как гиперонимия и меронимия, как в WordNet, что придает значению слова графовую структуру.
Фреймовая семантика
Представление значения слова через ситуации (фреймы), которые оно вызывает, и роли участников в них, реализованное как лексический ресурс в FrameNet.

History

WordNet, начатый группой Джорджа Миллера в 1980-х годах и задокументированный в 1995 и 1998 годах, стал наиболее широко используемым лексическим ресурсом в вычислительной лингвистике. Фреймовая семантика Филлмора была реализована как FrameNet в конце 1990-х годов, дополняя WordNet явной предикатно-аргументной структурой.

Debates

Ресурсы, созданные вручную, против обучаемых представлений
Сохраняют ли ценность курируемые лексические базы данных в эпоху обучаемых вложений; многие утверждают, что они по-прежнему обеспечивают интерпретируемую структуру и эталонные данные, которых не хватает дистрибутивным моделям.

Key figures

  • George Miller
  • Christiane Fellbaum
  • Charles Fillmore
  • Collin Baker

Related topics

Seminal works

  • miller1995
  • fellbaum1998
  • baker1998

Frequently asked questions

Что такое синсет в WordNet?
Синсет — это набор слов, которые взаимозаменяемы в некотором контексте (синонимы), сгруппированные как единое понятие и связанные с другими синсетами отношениями типа «является-чем-то» и «часть-чего-то».

Methods for this concept

Related concepts