Лексическая семантика и разрешение лексической многозначности
Компьютерное исследование значения слов: определение того, какое значение несет слово в контексте, измерение семантического сходства и моделирование отношений между значениями слов.
Definition
Лексическая семантика в вычислительной лингвистике — это представление, сравнение и разрешение многозначности значений слов машиной.
Scope
Охватывает значение отдельных слов и их отношения — инвентаризацию значений, разрешение лексической многозначности, семантическое сходство и связанность, а также дистрибутивные модели лексического значения. Рассматриваются как методы, основанные на знаниях и использующие такие ресурсы, как WordNet, так и корпусные и нейронные методы. Композиционное значение предложения рассматривается в родственной теме.
Core questions
- Как определяется значение слова из его контекста?
- Как количественно оценивается семантическое сходство между словами?
- В чем различие между методами лексического значения, основанными на знаниях, и корпусными методами?
- Как полисемия и метафора обрабатываются вычислительными методами?
Key concepts
- значение слова
- полисемия
- инвентаризация значений
- разрешение лексической многозначности
- семантическое сходство
- дистрибутивная семантика
- векторно-пространственная модель
- лексическое отношение
Key theories
- Разрешение лексической многозначности
- Выбор контекстуально подходящего значения многозначного слова из инвентаризации значений с использованием окружающего контекста, ресурсов знаний или обученных классификаторов.
- Дистрибутивное лексическое значение
- Представление значения слова с помощью статистики совместной встречаемости и мер ассоциации, так что семантически связанные слова имеют схожие контекстуальные профили.
History
Разрешение лексической многозначности было давней проблемой, всесторонне рассмотренной Навильи в 2009 году. Дистрибутивные подходы, основанные на гипотезе Харриса и развитые мерами ассоциации Чёрча и Хэнкса, постепенно предоставили модели сходства, управляемые данными, которые теперь доминируют в лексической семантике.
Debates
- Дискретные значения против непрерывного значения
- Вопрос о том, лучше ли моделировать значение слова как фиксированный набор дискретных значений или как непрерывное пространство, что обостряется контекстными встраиваниями, которые размывают границы значений.
Key figures
- Roberto Navigli
- Kenneth Church
- Hinrich Schütze
- Zellig Harris
Related topics
Seminal works
- navigli2009
- church1989
Frequently asked questions
- Почему разрешение лексической многозначности является сложной задачей?
- Многие слова имеют несколько значений, и выбор правильного часто требует обширных мировых знаний и тонких контекстуальных подсказок, которые трудно закодировать, поэтому это оставалось эталонной проблемой на протяжении десятилетий.