Skaitļošanas lingvistika
Skaitļošanas lingvistika pēta valodu no skaitļošanas perspektīvas — modelējot, apstrādājot un ģenerējot dabisko valodu ar datoriem.
Atrast tematu ar PaperMindDrīzumāFind papers & topics
Tools & resources
Learn & explore
VideoDrīzumā
Scope
Tā aptver dabiskās valodas apstrādi, parsēšanu, mašīntulkošanu, runas apstrādi, kā arī valodas statistiskos un neironu modeļus.
Core questions
- Kā datori var apstrādāt un ģenerēt cilvēka valodu?
- Kā valodu struktūru var modelēt skaitļošanas veidā?
- Kā valodu datus var izmantot, lai apgūtu valodu modeļus?
- Kā runa un teksts tiek automātiski saprasti?
Key concepts
- Dabiskās valodas apstrāde
- Parsēšana
- Mašīntulkošana
- Statistiskie valodu modeļi
- Runas atpazīšana
- Korpusu lingvistika
Key theories
- Statistiskā dabiskās valodas apstrāde (SDVA)
- Manning un Schütze sintezēja statistisko, uz datiem balstīto pieeju valodu apstrādei.
- Runas un valodas apstrāde
- Jurafsky un Martin apvienoja lingvistiskās un skaitļošanas pieejas runas un teksta jomā.
History
Skaitļošanas lingvistika pārgāja no uz noteikumiem balstītām sistēmām uz statistiskām metodēm (Manning & Schütze; Jurafsky & Martin) un, pavisam nesen, uz neironu un lielajiem valodu modeļiem, kas ir mūsdienu valodu tehnoloģiju pamatā.
Debates
- Uz noteikumiem balstītas pieejas pretstatā uz datiem balstītām pieejām
- Vai valodu tehnoloģijas labāk veidot, pamatojoties uz lingvistiskiem noteikumiem, vai tās apgūt no datiem.
Key figures
- Christopher Manning
- Hinrich Schütze
- Daniel Jurafsky
- James Martin
Related topics
Seminal works
- manning-schutze-1999
- jurafsky-martin-2000
Frequently asked questions
- Kas ir dabiskās valodas apstrāde?
- Skaitļošanas metodes cilvēka valodas analīzei, izpratnei un ģenerēšanai, kas ir skaitļošanas lingvistikas kodols.