Linguistik Komputasi
Linguistik komputasi mengkaji bahasa dari perspektif komputasi — memodelkan, memproses, dan menjana bahasa semula jadi menggunakan komputer.
Cari Topik dengan PaperMindTidak lama lagiFind papers & topics
Tools & resources
Learn & explore
VideoTidak lama lagi
Scope
Bidang ini merangkumi pemprosesan bahasa semula jadi (natural language processing), penghuraian (parsing), terjemahan mesin, pemprosesan ucapan, serta model bahasa statistik dan neural.
Core questions
- Bagaimanakah komputer boleh memproses dan menjana bahasa manusia?
- Bagaimanakah struktur linguistik dapat dimodelkan secara komputasi?
- Bagaimanakah data bahasa digunakan untuk mempelajari model bahasa?
- Bagaimanakah ucapan dan teks difahami secara automatik?
Key concepts
- Pemprosesan bahasa semula jadi (natural language processing)
- Penghuraian (parsing)
- Terjemahan mesin
- Model bahasa statistik
- Pengecaman ucapan
- Korpus
Key theories
- Pemprosesan bahasa semula jadi statistik (statistical NLP)
- Manning dan Schütze mensintesiskan pendekatan statistik berasaskan data untuk pemprosesan bahasa.
- Pemprosesan ucapan dan bahasa
- Jurafsky dan Martin menyatukan pendekatan linguistik dan komputasi merentas ujaran dan teks.
History
Linguistik komputasi beralih daripada sistem berasaskan peraturan kepada kaedah statistik (Manning & Schütze; Jurafsky & Martin) dan, lebih baru-baru ini, kepada model neural dan model bahasa besar, yang menjadi teras teknologi bahasa moden.
Debates
- Pendekatan berasaskan peraturan berbanding berasaskan data
- Sama ada teknologi bahasa paling baik dibina daripada peraturan linguistik atau dipelajari daripada data.
Key figures
- Christopher Manning
- Hinrich Schütze
- Daniel Jurafsky
- James Martin
Related topics
Seminal works
- manning-schutze-1999
- jurafsky-martin-2000
Frequently asked questions
- Apakah pemprosesan bahasa semula jadi?
- Teknik komputasi untuk menganalisis, memahami, dan menjana bahasa manusia, yang merupakan teras linguistik komputasi.