Apakah pemprosesan bahasa semula jadi?

Teknik komputasi untuk menganalisis, memahami, dan menjana bahasa manusia, yang merupakan teras linguistik komputasi.

Linguistik Komputasi

Linguistik komputasi mengkaji bahasa dari perspektif komputasi — memodelkan, memproses, dan menjana bahasa semula jadi menggunakan komputer.

Cari Topik dengan PaperMindTidak lama lagiFind papers & topics

Tools & resources

Muat turun slaid

Learn & explore

VideoTidak lama lagi

Scope

Bidang ini merangkumi pemprosesan bahasa semula jadi (natural language processing), penghuraian (parsing), terjemahan mesin, pemprosesan ucapan, serta model bahasa statistik dan neural.

Core questions

Bagaimanakah komputer boleh memproses dan menjana bahasa manusia?
Bagaimanakah struktur linguistik dapat dimodelkan secara komputasi?
Bagaimanakah data bahasa digunakan untuk mempelajari model bahasa?
Bagaimanakah ucapan dan teks difahami secara automatik?

Key concepts

Pemprosesan bahasa semula jadi (natural language processing)
Penghuraian (parsing)
Terjemahan mesin
Model bahasa statistik
Pengecaman ucapan
Korpus

Key theories

Pemprosesan bahasa semula jadi statistik (statistical NLP): Manning dan Schütze mensintesiskan pendekatan statistik berasaskan data untuk pemprosesan bahasa.
Pemprosesan ucapan dan bahasa: Jurafsky dan Martin menyatukan pendekatan linguistik dan komputasi merentas ujaran dan teks.

History

Linguistik komputasi beralih daripada sistem berasaskan peraturan kepada kaedah statistik (Manning & Schütze; Jurafsky & Martin) dan, lebih baru-baru ini, kepada model neural dan model bahasa besar, yang menjadi teras teknologi bahasa moden.

Debates

Pendekatan berasaskan peraturan berbanding berasaskan data: Sama ada teknologi bahasa paling baik dibina daripada peraturan linguistik atau dipelajari daripada data.

Key figures

Christopher Manning
Hinrich Schütze
Daniel Jurafsky
James Martin

Seminal works

manning-schutze-1999
jurafsky-martin-2000

Frequently asked questions

Apakah pemprosesan bahasa semula jadi?: Teknik komputasi untuk menganalisis, memahami, dan menjana bahasa manusia, yang merupakan teras linguistik komputasi.