Вычислительная семантика
Вычислительная семантика — это исследование того, как представлять и вычислять значение слов, фраз и предложений, сопоставляя язык с формальными представлениями значения или с дистрибутивными представлениями смысла.
Definition
Вычислительная семантика — это построение представлений значения для выражений естественного языка, будь то формальные логические формы, построенные композиционно из частей, или дистрибутивные представления значения слов и фраз, а также методы для их разрешения и рассуждения о них.
Scope
Эта тема охватывает представление значения в обработке естественного языка (NLP): логическую/композиционную семантику (сопоставление предложений с логическими формами, с принципом композиционности и областью действия кванторов), лексическую семантику и смысл слова, разметку семантических ролей, а также дистрибутивные и векторные представления значения. Она затрагивает семантический парсинг в исполняемые или логические представления значения и разрешение неоднозначности на уровне значения. Синтаксические структуры, которые питают композицию значения, рассматриваются в рамках синтаксического парсинга.
Core questions
- Как значение предложения строится из значений его частей и их синтаксической комбинации?
- Как представляются и вычисляются логические формы и область действия кванторов?
- Как определяется правильный смысл неоднозначного слова в контексте?
- Как дистрибутивные и векторные представления улавливают значение слова из его использования?
Key concepts
- композиционность
- логическая форма и область действия кванторов
- лямбда-исчисление для значения
- лексическая семантика и смысл слова
- разрешение лексической многозначности
- разметка семантических ролей
- дистрибутивная семантика и векторы
- семантический парсинг
Key theories
- Композиционная (формальная) семантика
- Согласно программе Монтегю, значение сложного выражения вычисляется как функция значений его частей и их синтаксической комбинации, что позволяет сопоставлять предложения с логическими формами, подходящими для вывода.
- Лексическая семантика и смысл слова
- Слова имеют несколько связанных значений, организованных в лексических ресурсах, а разрешение лексической многозначности использует контекст для выбора предполагаемого значения, что является необходимым условием для точного представления значения.
- Дистрибутивная семантика
- Значение слова может быть представлено контекстами, в которых оно встречается, что приводит к векторным представлениям, в которых семантическая схожесть соответствует близости, — парадигма, отраженная в дистрибутивной гипотезе о том, что слова в схожих контекстах имеют схожие значения.
Clinical relevance
Представления значения поддерживают ответы на вопросы по базам знаний, естественно-языковые интерфейсы к базам данных, понимание диалогов и текстовое следование, превращая предложения в формы, над которыми системы могут рассуждать или сопоставлять; дистрибутивные представления лежат в основе большей части современной семантической схожести и поиска.
History
Формальная семантика в NLP опиралась на композиционную трактовку квантификации Монтегю (1973) и логическое представление значения. Лексические ресурсы и работа со смыслом слов развивались в 1990-х годах, в то время как дистрибутивная традиция, уходящая корнями в дистрибутивную гипотезу Харриса, переросла в методы векторных пространств и встраиваний, которые теперь доминируют в семантическом представлении.
Key figures
- Richard Montague
- Christopher D. Manning
- Daniel Jurafsky
- Zellig Harris
Related topics
Seminal works
- montague1973
- jurafsky2023
Frequently asked questions
- Что такое композиционность в семантике?
- Композиционность — это принцип, согласно которому значение сложного выражения определяется значениями его частей и правилами, используемыми для их объединения. Он позволяет системам систематически вычислять значение новых предложений из их слов и структуры, а не запоминать целые предложения.
- Как дистрибутивные представления улавливают значение?
- Они основаны на наблюдении, что слова, появляющиеся в схожих контекстах, как правило, имеют схожие значения. Представляя каждое слово как вектор, суммирующий контексты, в которых оно встречается, семантически связанные слова в конечном итоге имеют схожие векторы, поэтому схожесть значений становится геометрической близостью.