Datalingvistik
Datalingvistik studerer sprog fra et computationelt perspektiv — modellering, behandling og generering af naturligt sprog ved hjælp af computere.
Find emne med PaperMindSnartFind papers & topics
Tools & resources
Learn & explore
VideoSnart
Scope
Feltet dækker naturlig sprogbehandling (NLP), parsing, maskinoversættelse, talebehandling samt statistiske og neurale sprogmodeller.
Core questions
- Hvordan kan computere behandle og generere menneskeligt sprog?
- Hvordan kan sproglig struktur modelleres computationelt?
- Hvordan kan sprogdata bruges til at lære sprogmodeller?
- Hvordan forstås tale og tekst automatisk?
Key concepts
- Naturlig sprogbehandling (NLP)
- Parsing
- Maskinoversættelse
- Statistiske sprogmodeller
- Talegenkendelse
- Korpora
Key theories
- Statistisk naturlig sprogbehandling
- Manning og Schütze syntetiserede den statistiske, datadrevne tilgang til sprogbehandling.
- Tale- og sprogbehandling
- Jurafsky og Martin forenede lingvistiske og computationelle tilgange på tværs af tale og tekst.
History
Datalingvistik bevægede sig fra regelbaserede systemer til statistiske metoder (Manning og Schütze; Jurafsky og Martin) og senest til neurale og store sprogmodeller (large language models), der er centrale i moderne sprogteknologi.
Debates
- Regelbaserede versus datadrevne tilgange
- Hvorvidt sprogteknologi bedst bygges på lingvistiske regler eller læres fra data.
Key figures
- Christopher Manning
- Hinrich Schütze
- Daniel Jurafsky
- James Martin
Related topics
Seminal works
- manning-schutze-1999
- jurafsky-martin-2000
Frequently asked questions
- Hvad er naturlig sprogbehandling (NLP)?
- De computationelle teknikker til at analysere, forstå og generere menneskeligt sprog — kernen i datalingvistik.