전산 언어학
전산 언어학은 컴퓨터를 활용하여 자연 언어를 모형화·처리·생성하는 계산적 관점에서 언어를 연구하는 학문이다.
PaperMind(으)로 주제 찾기곧 제공Find papers & topics
Tools & resources
Learn & explore
동영상곧 제공
Scope
전산 언어학은 자연어 처리(natural language processing), 구문 분석(parsing), 기계 번역, 음성 처리, 그리고 언어의 통계적·신경망 모형을 포괄한다.
Core questions
- 컴퓨터는 어떻게 인간의 언어를 처리하고 생성할 수 있는가?
- 언어 구조는 어떻게 계산적으로 모형화될 수 있는가?
- 언어 데이터를 통해 언어 모형을 어떻게 학습시킬 수 있는가?
- 음성과 텍스트는 어떻게 자동으로 이해될 수 있는가?
Key concepts
- 자연어 처리
- 구문 분석
- 기계 번역
- 통계적 언어 모형
- 음성 인식
- 코퍼스
Key theories
- 통계적 자연어 처리(Statistical NLP)
- Manning과 Schütze는 언어 처리에 대한 통계적·데이터 기반 접근 방식을 집대성하였다.
- 음성 및 언어 처리
- Jurafsky와 Martin은 음성과 텍스트 전반에 걸쳐 언어학적 접근과 계산적 접근을 통합하였다.
History
전산 언어학은 규칙 기반 시스템에서 통계적 방법론(Manning & Schütze; Jurafsky & Martin)으로 전환되었으며, 최근에는 신경망 및 대규모 언어 모형(large language models)이 현대 언어 기술의 핵심으로 자리 잡고 있다.
Debates
- 규칙 기반 접근 대 데이터 기반 접근
- 언어 기술이 언어학적 규칙으로 구축되어야 하는가, 아니면 데이터로부터 학습되어야 하는가에 관한 논쟁.
Key figures
- Christopher Manning
- Hinrich Schütze
- Daniel Jurafsky
- James Martin
Related topics
Seminal works
- manning-schutze-1999
- jurafsky-martin-2000
Frequently asked questions
- 자연어 처리란 무엇인가?
- 인간 언어를 분석·이해·생성하기 위한 계산적 기법으로, 전산 언어학의 핵심 영역이다.