รูปแบบไวยากรณ์
ระบบไวยากรณ์ที่ซับซ้อนยิ่งขึ้นซึ่งใช้ในการอธิบายวากยสัมพันธ์ของภาษาธรรมชาติ นอกเหนือจากกฎปลอดบริบททั่วไป ได้แก่ ไวยากรณ์แบบ Tree-Adjoining, ไวยากรณ์แบบ Categorial และไวยากรณ์แบบ Unification ซึ่งสร้างสมดุลระหว่างการแสดงออกกับความสามารถในการแยกวิเคราะห์
Definition
รูปแบบไวยากรณ์คือระบบสำหรับการระบุโครงสร้างที่ถูกต้องตามกฎของภาษา ซึ่งมีลักษณะเฉพาะด้วยพลังในการสร้าง (generative power) อุปกรณ์ในการนำเสนอ และความซับซ้อนของการแยกวิเคราะห์
Scope
ครอบคลุมรูปแบบที่ออกแบบมาเพื่อจับปรากฏการณ์ทางวากยสัมพันธ์ที่ไวยากรณ์ปลอดบริบทจัดการได้ยาก ได้แก่ ไวยากรณ์แบบ Tree-Adjoining (TAG), ไวยากรณ์แบบ Combinatory Categorial (CCG) และไวยากรณ์แบบ Unification หรือ Feature-based เช่น HPSG และ LFG โดยกล่าวถึงแนวคิดของความอ่อนไหวต่อบริบทอย่างอ่อน (mild context-sensitivity) และการแลกเปลี่ยนระหว่างความเพียงพอทางภาษาศาสตร์กับความสามารถในการคำนวณ อัลกอริทึมการแยกวิเคราะห์เฉพาะสำหรับ constituency และ dependency จะกล่าวถึงแยกต่างหาก
Core questions
- ปรากฏการณ์ทางวากยสัมพันธ์ใดที่กระตุ้นให้ต้องก้าวข้ามไวยากรณ์ปลอดบริบท?
- ความอ่อนไหวต่อบริบทอย่างอ่อนคืออะไร และเหตุใดจึงถือว่าเป็นพลังที่เหมาะสมสำหรับภาษา?
- การรวม (unification) และคุณสมบัติ (features) ช่วยให้ไวยากรณ์แบ่งปันข้อมูลข้ามโครงสร้างได้อย่างไร?
- รูปแบบเหล่านี้แลกเปลี่ยนการแสดงออกกับประสิทธิภาพในการแยกวิเคราะห์ได้อย่างไร?
Key concepts
- ไวยากรณ์แบบ Tree-Adjoining
- ไวยากรณ์แบบ Combinatory Categorial
- ไวยากรณ์แบบ Unification
- โครงสร้างคุณสมบัติ (feature structure)
- ความอ่อนไหวต่อบริบทอย่างอ่อน (mild context-sensitivity)
- HPSG
- LFG
- การจัดหมวดหมู่ย่อย (subcategorization)
Key theories
- ความอ่อนไหวต่อบริบทอย่างอ่อน (Mild context-sensitivity)
- ไวยากรณ์ประเภทหนึ่ง ซึ่งรวมถึง TAG และ CCG ที่มีพลังเกินกว่าไวยากรณ์ปลอดบริบทเพียงพอที่จะจับการพึ่งพาแบบ cross-serial ในขณะที่ยังคงสามารถแยกวิเคราะห์ได้ในเวลาพหุนาม
- ไวยากรณ์แบบ Combinatory Categorial
- รูปแบบ lexicalized ที่คำต่างๆ มีหมวดหมู่เชิงฟังก์ชันที่รวมกันโดยชุดของ combinators ขนาดเล็ก ซึ่งเชื่อมโยงวากยสัมพันธ์กับความหมายเชิงองค์ประกอบอย่างใกล้ชิด
- ไวยากรณ์แบบ Unification-based
- รูปแบบต่างๆ เช่น HPSG ที่แสดงวัตถุทางภาษาเป็นโครงสร้างคุณสมบัติแบบมีประเภท (typed feature structures) ที่รวมกันโดยการรวม (unification) ซึ่งจับการผันคำ (agreement) และการจัดหมวดหมู่ย่อย (subcategorization) ในลักษณะเชิงประกาศ (declaratively)
History
ตลอดช่วงทศวรรษ 1980 และ 1990 นักภาษาศาสตร์ได้พัฒนารูปแบบที่ซับซ้อนกว่าไวยากรณ์ปลอดบริบทเพื่อจับการผันคำ (agreement) การพึ่งพาระยะไกล (long-distance dependencies) และส่วนต่อประสานระหว่างวากยสัมพันธ์กับความหมาย (syntax–semantics interface) ไวยากรณ์แบบ Tree-Adjoining ของ Joshi ได้กำหนดความอ่อนไหวต่อบริบทอย่างอ่อนอย่างเป็นทางการ ในขณะที่ CCG และ HPSG เสนอทางเลือกแบบ lexicalized และ unification-based ซึ่งยังคงมีอิทธิพลทั้งในงานทางทฤษฎีและทางคอมพิวเตอร์
Debates
- การแสดงออกกับการจัดการได้ (Expressiveness versus tractability)
- รูปแบบที่มีพลังมากขึ้นสามารถอธิบายปรากฏการณ์ได้มากขึ้น แต่ก็เสี่ยงต่อการแยกวิเคราะห์ที่จัดการไม่ได้ โดยทั่วไปแล้วสาขาวิชานี้มักจะเลือกใช้พลังงานน้อยที่สุดที่เพียงพอต่อการครอบคลุมข้อมูล จึงเป็นที่มาของความสนใจในไวยากรณ์ที่อ่อนไหวต่อบริบทอย่างอ่อน
Key figures
- Aravind Joshi
- Mark Steedman
- Carl Pollard
- Ivan Sag
Related topics
Seminal works
- joshi1997
- steedman2000
- pollard1994
Frequently asked questions
- เหตุใดจึงไม่ใช้ไวยากรณ์ปลอดบริบทสำหรับทุกสิ่ง?
- โครงสร้างบางอย่าง เช่น การพึ่งพาแบบ cross-serial ในภาษาดัตช์และสวิสเยอรมัน ไม่สามารถสร้างขึ้นได้ด้วยไวยากรณ์ปลอดบริบท รูปแบบที่อ่อนไหวต่อบริบทอย่างอ่อนจะเพิ่มพลังงานเพียงพอที่จะจัดการกับโครงสร้างเหล่านี้ ในขณะที่ยังคงสามารถแยกวิเคราะห์ได้อย่างมีประสิทธิภาพ