ScholarGate
Assistent

Datalingvistik

Datalingvistik studerer sprog fra et computationelt perspektiv — modellering, behandling og generering af naturligt sprog ved hjælp af computere.

Find emne med PaperMindSnartFind papers & topics
Tools & resources
Hent slides
Learn & explore
VideoSnart

Scope

Feltet dækker naturlig sprogbehandling (NLP), parsing, maskinoversættelse, talebehandling samt statistiske og neurale sprogmodeller.

Core questions

  • Hvordan kan computere behandle og generere menneskeligt sprog?
  • Hvordan kan sproglig struktur modelleres computationelt?
  • Hvordan kan sprogdata bruges til at lære sprogmodeller?
  • Hvordan forstås tale og tekst automatisk?

Key concepts

  • Naturlig sprogbehandling (NLP)
  • Parsing
  • Maskinoversættelse
  • Statistiske sprogmodeller
  • Talegenkendelse
  • Korpora

Key theories

Statistisk naturlig sprogbehandling
Manning og Schütze syntetiserede den statistiske, datadrevne tilgang til sprogbehandling.
Tale- og sprogbehandling
Jurafsky og Martin forenede lingvistiske og computationelle tilgange på tværs af tale og tekst.

History

Datalingvistik bevægede sig fra regelbaserede systemer til statistiske metoder (Manning og Schütze; Jurafsky og Martin) og senest til neurale og store sprogmodeller (large language models), der er centrale i moderne sprogteknologi.

Debates

Regelbaserede versus datadrevne tilgange
Hvorvidt sprogteknologi bedst bygges på lingvistiske regler eller læres fra data.

Key figures

  • Christopher Manning
  • Hinrich Schütze
  • Daniel Jurafsky
  • James Martin

Related topics

Seminal works

  • manning-schutze-1999
  • jurafsky-martin-2000

Frequently asked questions

Hvad er naturlig sprogbehandling (NLP)?
De computationelle teknikker til at analysere, forstå og generere menneskeligt sprog — kernen i datalingvistik.

Methods for this concept

Related concepts