Обработка дискурса и кореференция
Моделирование значения выше уровня предложения: разрешение того, к чему относятся местоимения и именные группы, и анализ того, как предложения объединяются в структурированный, связный дискурс.
Definition
Обработка дискурса — это вычислительный анализ смысловых отношений, охватывающих несколько предложений, включая разрешение референции и структуру, которая делает текст связным.
Scope
Охватывает вычислительную семантику на уровне дискурса — разрешение кореференции и анафоры, модели локальной когерентности, такие как теория центрирования, теории структуры дискурса, такие как теория риторической структуры, и синтаксический анализ дискурсивных отношений. Рассматривается, как отслеживаются референция и когерентность в тексте. Внутрипредложенческое значение рассматривается в смежных темах.
Core questions
- Как местоимения и именные группы связаны со своими референтами?
- Что делает последовательность предложений связным дискурсом?
- Как можно представить и проанализировать структуру дискурса?
- Как модели дискурса поддерживают суммаризацию и ответы на вопросы?
Key concepts
- разрешение кореференции
- анафора
- теория центрирования
- когерентность дискурса
- теория риторической структуры
- дискурсивное отношение
- салиентность
- синтаксический анализ дискурса
Key theories
- Теория центрирования
- Модель того, как внимание к дискурсивным сущностям смещается между высказываниями, предсказывающая, какие референты являются наиболее салиентными и, следовательно, вероятными целями местоимений.
- Теория риторической структуры
- Анализ текста как дерева отношений ядро-сателлит, таких как уточнение и контраст, обеспечивающий структурное объяснение когерентности.
History
Обработка дискурса развивалась благодаря теориям когерентности и внимания в 1980-х и 1990-х годах, при этом теория центрирования и теория риторической структуры предлагали структурированные объяснения того, как тексты связаны между собой. Разрешение кореференции стало стандартной общей задачей, а синтаксический анализ дискурса позднее был усовершенствован аннотированными корпусами и нейронными моделями.
Debates
- Универсальность дискурсивных отношений
- Вопрос о том, существует ли фиксированный, теоретически нейтральный инвентарь дискурсивных отношений или же отношения зависят от конкретной концепции, что усложняет аннотирование и сравнение корпусов.
Key figures
- Barbara Grosz
- Aravind Joshi
- William Mann
- Sandra Thompson
Related topics
Seminal works
- grosz1995
- mann1988
Frequently asked questions
- Что такое разрешение кореференции?
- Разрешение кореференции — это задача группировки выражений в тексте, которые относятся к одной и той же сущности, например, связывание «Мари Кюри», «она» и «физик» с одним человеком, что крайне важно для понимания связного текста.