Hvad er naturlig sprogbehandling (NLP)?

De computationelle teknikker til at analysere, forstå og generere menneskeligt sprog — kernen i datalingvistik.

Datalingvistik

Datalingvistik studerer sprog fra et computationelt perspektiv — modellering, behandling og generering af naturligt sprog ved hjælp af computere.

Find emne med PaperMindSnartFind papers & topics

Tools & resources

Hent slides

Learn & explore

VideoSnart

Scope

Feltet dækker naturlig sprogbehandling (NLP), parsing, maskinoversættelse, talebehandling samt statistiske og neurale sprogmodeller.

Core questions

Hvordan kan computere behandle og generere menneskeligt sprog?
Hvordan kan sproglig struktur modelleres computationelt?
Hvordan kan sprogdata bruges til at lære sprogmodeller?
Hvordan forstås tale og tekst automatisk?

Key concepts

Naturlig sprogbehandling (NLP)
Parsing
Maskinoversættelse
Statistiske sprogmodeller
Talegenkendelse
Korpora

Key theories

Statistisk naturlig sprogbehandling: Manning og Schütze syntetiserede den statistiske, datadrevne tilgang til sprogbehandling.
Tale- og sprogbehandling: Jurafsky og Martin forenede lingvistiske og computationelle tilgange på tværs af tale og tekst.

History

Datalingvistik bevægede sig fra regelbaserede systemer til statistiske metoder (Manning og Schütze; Jurafsky og Martin) og senest til neurale og store sprogmodeller (large language models), der er centrale i moderne sprogteknologi.

Debates

Regelbaserede versus datadrevne tilgange: Hvorvidt sprogteknologi bedst bygges på lingvistiske regler eller læres fra data.

Key figures

Christopher Manning
Hinrich Schütze
Daniel Jurafsky
James Martin

Seminal works

manning-schutze-1999
jurafsky-martin-2000

Frequently asked questions

Hvad er naturlig sprogbehandling (NLP)?: De computationelle teknikker til at analysere, forstå og generere menneskeligt sprog — kernen i datalingvistik.