ScholarGate
ผู้ช่วย

รูปแบบไวยากรณ์

ระบบไวยากรณ์ที่ซับซ้อนยิ่งขึ้นซึ่งใช้ในการอธิบายวากยสัมพันธ์ของภาษาธรรมชาติ นอกเหนือจากกฎปลอดบริบททั่วไป ได้แก่ ไวยากรณ์แบบ Tree-Adjoining, ไวยากรณ์แบบ Categorial และไวยากรณ์แบบ Unification ซึ่งสร้างสมดุลระหว่างการแสดงออกกับความสามารถในการแยกวิเคราะห์

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics
Tools & resources
ดาวน์โหลดสไลด์
Learn & explore
วิดีโอเร็ว ๆ นี้

Definition

รูปแบบไวยากรณ์คือระบบสำหรับการระบุโครงสร้างที่ถูกต้องตามกฎของภาษา ซึ่งมีลักษณะเฉพาะด้วยพลังในการสร้าง (generative power) อุปกรณ์ในการนำเสนอ และความซับซ้อนของการแยกวิเคราะห์

Scope

ครอบคลุมรูปแบบที่ออกแบบมาเพื่อจับปรากฏการณ์ทางวากยสัมพันธ์ที่ไวยากรณ์ปลอดบริบทจัดการได้ยาก ได้แก่ ไวยากรณ์แบบ Tree-Adjoining (TAG), ไวยากรณ์แบบ Combinatory Categorial (CCG) และไวยากรณ์แบบ Unification หรือ Feature-based เช่น HPSG และ LFG โดยกล่าวถึงแนวคิดของความอ่อนไหวต่อบริบทอย่างอ่อน (mild context-sensitivity) และการแลกเปลี่ยนระหว่างความเพียงพอทางภาษาศาสตร์กับความสามารถในการคำนวณ อัลกอริทึมการแยกวิเคราะห์เฉพาะสำหรับ constituency และ dependency จะกล่าวถึงแยกต่างหาก

Core questions

  • ปรากฏการณ์ทางวากยสัมพันธ์ใดที่กระตุ้นให้ต้องก้าวข้ามไวยากรณ์ปลอดบริบท?
  • ความอ่อนไหวต่อบริบทอย่างอ่อนคืออะไร และเหตุใดจึงถือว่าเป็นพลังที่เหมาะสมสำหรับภาษา?
  • การรวม (unification) และคุณสมบัติ (features) ช่วยให้ไวยากรณ์แบ่งปันข้อมูลข้ามโครงสร้างได้อย่างไร?
  • รูปแบบเหล่านี้แลกเปลี่ยนการแสดงออกกับประสิทธิภาพในการแยกวิเคราะห์ได้อย่างไร?

Key concepts

  • ไวยากรณ์แบบ Tree-Adjoining
  • ไวยากรณ์แบบ Combinatory Categorial
  • ไวยากรณ์แบบ Unification
  • โครงสร้างคุณสมบัติ (feature structure)
  • ความอ่อนไหวต่อบริบทอย่างอ่อน (mild context-sensitivity)
  • HPSG
  • LFG
  • การจัดหมวดหมู่ย่อย (subcategorization)

Key theories

ความอ่อนไหวต่อบริบทอย่างอ่อน (Mild context-sensitivity)
ไวยากรณ์ประเภทหนึ่ง ซึ่งรวมถึง TAG และ CCG ที่มีพลังเกินกว่าไวยากรณ์ปลอดบริบทเพียงพอที่จะจับการพึ่งพาแบบ cross-serial ในขณะที่ยังคงสามารถแยกวิเคราะห์ได้ในเวลาพหุนาม
ไวยากรณ์แบบ Combinatory Categorial
รูปแบบ lexicalized ที่คำต่างๆ มีหมวดหมู่เชิงฟังก์ชันที่รวมกันโดยชุดของ combinators ขนาดเล็ก ซึ่งเชื่อมโยงวากยสัมพันธ์กับความหมายเชิงองค์ประกอบอย่างใกล้ชิด
ไวยากรณ์แบบ Unification-based
รูปแบบต่างๆ เช่น HPSG ที่แสดงวัตถุทางภาษาเป็นโครงสร้างคุณสมบัติแบบมีประเภท (typed feature structures) ที่รวมกันโดยการรวม (unification) ซึ่งจับการผันคำ (agreement) และการจัดหมวดหมู่ย่อย (subcategorization) ในลักษณะเชิงประกาศ (declaratively)

History

ตลอดช่วงทศวรรษ 1980 และ 1990 นักภาษาศาสตร์ได้พัฒนารูปแบบที่ซับซ้อนกว่าไวยากรณ์ปลอดบริบทเพื่อจับการผันคำ (agreement) การพึ่งพาระยะไกล (long-distance dependencies) และส่วนต่อประสานระหว่างวากยสัมพันธ์กับความหมาย (syntax–semantics interface) ไวยากรณ์แบบ Tree-Adjoining ของ Joshi ได้กำหนดความอ่อนไหวต่อบริบทอย่างอ่อนอย่างเป็นทางการ ในขณะที่ CCG และ HPSG เสนอทางเลือกแบบ lexicalized และ unification-based ซึ่งยังคงมีอิทธิพลทั้งในงานทางทฤษฎีและทางคอมพิวเตอร์

Debates

การแสดงออกกับการจัดการได้ (Expressiveness versus tractability)
รูปแบบที่มีพลังมากขึ้นสามารถอธิบายปรากฏการณ์ได้มากขึ้น แต่ก็เสี่ยงต่อการแยกวิเคราะห์ที่จัดการไม่ได้ โดยทั่วไปแล้วสาขาวิชานี้มักจะเลือกใช้พลังงานน้อยที่สุดที่เพียงพอต่อการครอบคลุมข้อมูล จึงเป็นที่มาของความสนใจในไวยากรณ์ที่อ่อนไหวต่อบริบทอย่างอ่อน

Key figures

  • Aravind Joshi
  • Mark Steedman
  • Carl Pollard
  • Ivan Sag

Related topics

Seminal works

  • joshi1997
  • steedman2000
  • pollard1994

Frequently asked questions

เหตุใดจึงไม่ใช้ไวยากรณ์ปลอดบริบทสำหรับทุกสิ่ง?
โครงสร้างบางอย่าง เช่น การพึ่งพาแบบ cross-serial ในภาษาดัตช์และสวิสเยอรมัน ไม่สามารถสร้างขึ้นได้ด้วยไวยากรณ์ปลอดบริบท รูปแบบที่อ่อนไหวต่อบริบทอย่างอ่อนจะเพิ่มพลังงานเพียงพอที่จะจัดการกับโครงสร้างเหล่านี้ ในขณะที่ยังคงสามารถแยกวิเคราะห์ได้อย่างมีประสิทธิภาพ

Methods for this concept

Related concepts