Datalingvistikk
Datalingvistikk studerer språk fra et databehandlingsperspektiv – modellering, prosessering og generering av naturlig språk ved hjelp av datamaskiner.
Finn tema med PaperMindSnartFind papers & topics
Tools & resources
Learn & explore
VideoSnart
Scope
Feltet dekker naturlig språkprosessering (NLP), parsing, maskinoversettelse, taleprosessering samt statistiske og nevrale språkmodeller.
Core questions
- Hvordan kan datamaskiner prosessere og generere menneskelig språk?
- Hvordan kan språklig struktur modelleres beregningsteknisk?
- Hvordan kan språkdata brukes til å lære opp språkmodeller?
- Hvordan gjenkjennes tale og tekst automatisk?
Key concepts
- Naturlig språkprosessering (NLP)
- Parsing
- Maskinoversettelse
- Statistiske språkmodeller
- Talegjenkjenning
- Korpora
Key theories
- Statistisk naturlig språkprosessering (NLP)
- Manning og Schütze syntetiserte den statistiske, datadrevne tilnærmingen til språkprosessering.
- Tale- og språkprosessering
- Jurafsky og Martin samlet lingvistiske og beregningstekniske tilnærminger på tvers av tale og tekst.
History
Datalingvistikk beveget seg fra regelbaserte systemer til statistiske metoder (Manning og Schütze; Jurafsky og Martin) og, nyere, nevrale modeller og store språkmodeller som er sentrale i moderne språkteknologi.
Debates
- Regelbaserte versus datadrevne tilnærminger
- Spørsmålet om språkteknologi best bygges på lingvistiske regler eller læres fra data.
Key figures
- Christopher Manning
- Hinrich Schütze
- Daniel Jurafsky
- James Martin
Related topics
Seminal works
- manning-schutze-1999
- jurafsky-martin-2000
Frequently asked questions
- Hva er naturlig språkprosessering (NLP)?
- De beregningstekniske metodene for å analysere, forstå og generere menneskelig språk – kjernen i datalingvistikk.