ScholarGate
어시스턴트

구문 분석 및 문법 형식론

기계를 통해 문장의 문법 구조를 복구하는 과정: 합법적인 구조를 설명하는 문법 형식론과 이를 계산하는 알고리즘(구성 트리부터 의존성 그래프까지).

PaperMind(으)로 주제 찾기곧 제공Find papers & topics
Tools & resources
슬라이드 다운로드
Learn & explore
동영상곧 제공

Definition

구문 분석은 문법에 따라 입력 문자열에 문법 구조를 계산적으로 할당하는 것이며, 문법 형식론은 어떤 구조가 합법적인지 명시하는 데 사용되는 시스템입니다.

Scope

전산 언어학에서의 통사론적 분석을 다룹니다. 여기에는 문맥 자유 구성 구문 분석(context-free constituency parsing)과 그 확률적 및 차트 기반 알고리즘, 의존성 구문 분석(dependency parsing), 단순 문맥 자유 문법을 넘어서는 주요 문법 형식론, 그리고 구문 분석에 필요한 순서 레이블링 작업(예: 품사 태깅)이 포함됩니다. 의미론적 해석(전산 의미론에서 다룸)과 기초 이론에서 다루는 근본적인 오토마타 이론은 제외됩니다.

Sub-topics

Core questions

  • 문장에 통사 트리나 의존성 그래프를 효율적으로 할당하는 방법은 무엇인가요?
  • 어떤 문법 형식론이 자연어 구문을 적절하게 포착하나요?
  • 확률은 가능한 많은 구문 분석 중 모호성을 해소하는 데 어떻게 도움이 되나요?
  • 태깅과 청킹은 전체 구문 분석을 어떻게 지원하나요?

Key concepts

  • 구성 구문 분석
  • 의존성 구문 분석
  • 문맥 자유 문법
  • 차트 구문 분석
  • 확률 문법
  • 품사 태깅
  • 트리뱅크
  • 구조적 모호성

Key theories

차트 구문 분석
CKY 및 Earley와 같은 동적 프로그래밍 알고리즘으로, 공유되는 하위 구문 분석을 재사용하여 다항 시간 내에 문장의 가능한 모든 분석을 계산합니다.
확률적 문맥 자유 문법
문법 규칙에 확률을 부여하여 가장 가능성 있는 구문 분석을 선택함으로써 자연어의 만연한 구조적 모호성을 해결합니다.

History

초기 구문 분석은 수작업으로 구축된 문법과 철저한 탐색에 의존했습니다. CKY 및 Earley 알고리즘은 문맥 자유 구문 분석을 효율적으로 만들었습니다. 1990년대 트리뱅크의 출현은 데이터 기반 확률적 구문 분석을 가능하게 했고, 2000년대에는 의존성 구문 분석이 언어 간 견고성으로 인해 중요성이 부각되었으며, 이후 신경망 파서에 의해 대체되었습니다.

Debates

구성 표현 대 의존성 표현
구문이 중첩된 구로 가장 잘 표현되는지 또는 레이블이 지정된 주어-종속 관계(head-dependent relations)로 가장 잘 표현되는지에 대한 논의입니다. 둘 다 널리 사용되며, 의존성은 자유 어순 언어와 후속 작업에 선호되는 경향이 있습니다.

Key figures

  • Jay Earley
  • Joakim Nivre
  • Christopher Manning
  • Mitchell Marcus

Related topics

Seminal works

  • manning1999
  • kubler2009
  • jurafsky2025

Frequently asked questions

문법 규칙을 알고 있다면 구문 분석이 왜 어려운가요?
자연어 문장은 매우 모호합니다. 단일 문자열이 여러 합법적인 구조를 가질 수 있습니다. 따라서 구문 분석은 구조를 찾는 것뿐만 아니라 순위를 매겨야 하므로 확률적 모델과 학습된 모델이 필수적입니다.

Methods for this concept

Related concepts