Лексические базы данных и онтологии
Машиночитаемые инвентари значений слов и их отношений — WordNet, FrameNet и связанные онтологии — которые предоставляют вычислительным системам структурированный доступ к лексической семантике.
Definition
Лексическая база данных или онтология — это структурированный ресурс, который записывает значения слов и семантические отношения между ними в форме, пригодной для использования компьютерными программами.
Scope
Охватывает разработку и использование лексико-семантических ресурсов: синсеты и иерархические отношения WordNet, семантические фреймы и роли FrameNet, а также более широкие вычислительные онтологии. Рассматривается, как такие ресурсы кодируют синонимию, гиперонимию и предикатно-аргументную структуру, а также как они поддерживают разрешение неоднозначности и вывод. Дистрибутивная и нейросетевая лексическая семантика рассматриваются в рамках вычислительной семантики.
Core questions
- Как WordNet организует значения в синсеты, связанные лексическими отношениями?
- Как FrameNet представляет значение в терминах фреймов и ролей?
- Как эти ресурсы используются для разрешения неоднозначности слов и определения их сходства?
- Каковы ограничения созданных вручную лексических онтологий?
Key concepts
- синсет
- гиперонимия и гипонимия
- меронимия
- семантический фрейм
- элемент фрейма
- разрешение лексической многозначности
- лексическая онтология
- предикатно-аргументная структура
Key theories
- Синсет-ориентированная лексическая организация
- Моделирование лексикона как наборов синонимов (синсетов), связанных такими отношениями, как гиперонимия и меронимия, как в WordNet, что придает значению слова графовую структуру.
- Фреймовая семантика
- Представление значения слова через ситуации (фреймы), которые оно вызывает, и роли участников в них, реализованное как лексический ресурс в FrameNet.
History
WordNet, начатый группой Джорджа Миллера в 1980-х годах и задокументированный в 1995 и 1998 годах, стал наиболее широко используемым лексическим ресурсом в вычислительной лингвистике. Фреймовая семантика Филлмора была реализована как FrameNet в конце 1990-х годов, дополняя WordNet явной предикатно-аргументной структурой.
Debates
- Ресурсы, созданные вручную, против обучаемых представлений
- Сохраняют ли ценность курируемые лексические базы данных в эпоху обучаемых вложений; многие утверждают, что они по-прежнему обеспечивают интерпретируемую структуру и эталонные данные, которых не хватает дистрибутивным моделям.
Key figures
- George Miller
- Christiane Fellbaum
- Charles Fillmore
- Collin Baker
Related topics
Seminal works
- miller1995
- fellbaum1998
- baker1998
Frequently asked questions
- Что такое синсет в WordNet?
- Синсет — это набор слов, которые взаимозаменяемы в некотором контексте (синонимы), сгруппированные как единое понятие и связанные с другими синсетами отношениями типа «является-чем-то» и «часть-чего-то».