Formalisme Tata Bahasa
Sistem tata bahasa yang lebih kaya digunakan untuk mendeskripsikan sintaksis bahasa alami di luar aturan bebas konteks biasa — tata bahasa adjungsi pohon, kategorial, dan berbasis unifikasi — yang menyeimbangkan ekspresivitas dengan kemampuan penguraian.
Definition
Formalisme tata bahasa adalah sistem untuk menentukan struktur legal suatu bahasa, yang dicirikan oleh daya generatifnya, perangkat representasionalnya, dan kompleksitas penguraiannya.
Scope
Mencakup formalisme yang dirancang untuk menangkap fenomena sintaksis yang sulit ditangani oleh tata bahasa bebas konteks: tata bahasa adjungsi pohon (TAG), tata bahasa kategorial kombinatorik (CCG), dan tata bahasa berbasis unifikasi atau fitur seperti HPSG dan LFG. Ini membahas gagasan sensitivitas konteks ringan dan pertukaran antara kecukupan linguistik dan ketertelusuran komputasi. Algoritma penguraian khusus untuk konstituensi dan dependensi dibahas secara terpisah.
Core questions
- Fenomena sintaksis apa yang memotivasi untuk melampaui tata bahasa bebas konteks?
- Apa itu sensitivitas konteks ringan dan mengapa dianggap sebagai kekuatan yang tepat untuk bahasa?
- Bagaimana unifikasi dan fitur memungkinkan tata bahasa berbagi informasi di seluruh struktur?
- Bagaimana formalisme ini menukar ekspresivitas dengan penguraian yang efisien?
Key concepts
- tata bahasa adjungsi pohon
- tata bahasa kategorial kombinatorik
- tata bahasa unifikasi
- struktur fitur
- sensitivitas konteks ringan
- HPSG
- LFG
- subkategorisasi
Key theories
- Sensitivitas konteks ringan
- Kelas tata bahasa, termasuk TAG dan CCG, yang melampaui kekuatan bebas konteks secukupnya untuk menangkap dependensi silang-serial sambil tetap dapat diurai dalam waktu polinomial.
- Tata bahasa kategorial kombinatorik
- Formalisme leksikalisasi di mana kata-kata membawa kategori fungsional yang digabungkan oleh sejumlah kecil kombinator, secara erat mengaitkan sintaksis dengan semantik komposisional.
- Tata bahasa berbasis unifikasi
- Formalisme seperti HPSG yang merepresentasikan objek linguistik sebagai struktur fitur bertipe yang digabungkan oleh unifikasi, menangkap kesesuaian dan subkategorisasi secara deklaratif.
History
Sepanjang tahun 1980-an dan 1990-an, para ahli bahasa mengembangkan formalisme yang lebih kaya daripada tata bahasa bebas konteks untuk menangkap kesesuaian, dependensi jarak jauh, dan antarmuka sintaksis-semantik. Tata bahasa adjungsi pohon Joshi memformalkan sensitivitas konteks ringan, sementara CCG dan HPSG menawarkan alternatif leksikalisasi dan berbasis unifikasi yang tetap berpengaruh dalam karya teoretis maupun komputasi.
Debates
- Ekspresivitas versus ketertelusuran
- Formalisme yang lebih kuat dapat mendeskripsikan lebih banyak fenomena tetapi berisiko penguraian yang tidak dapat ditelusuri; bidang ini umumnya menyukai kekuatan paling sedikit yang cukup untuk mencakup data, oleh karena itu minat pada tata bahasa yang sensitif konteks ringan.
Key figures
- Aravind Joshi
- Mark Steedman
- Carl Pollard
- Ivan Sag
Related topics
Seminal works
- joshi1997
- steedman2000
- pollard1994
Frequently asked questions
- Mengapa tidak hanya menggunakan tata bahasa bebas konteks untuk semuanya?
- Beberapa konstruksi, seperti dependensi silang-serial dalam bahasa Belanda dan Jerman Swiss, terbukti tidak dapat dihasilkan oleh tata bahasa bebas konteks. Formalisme yang sensitif konteks ringan menambahkan kekuatan yang cukup untuk menanganinya sambil tetap dapat diurai secara efisien.