การประยุกต์ใช้ภาษาและคำพูด
การประยุกต์ใช้ภาษาศาสตร์เชิงคำนวณ: การแปลงระหว่างคำพูดและข้อความ, การดึงข้อมูลที่มีโครงสร้างจากเอกสาร, และการสร้างระบบที่ตอบคำถามและสนทนาได้
Definition
การประยุกต์ใช้ภาษาและคำพูดคือระบบสำหรับผู้ใช้ปลายทางที่รับรู้, เข้าใจ, หรือสร้างภาษามนุษย์ โดยสร้างขึ้นจากการประกอบวิธีการทางภาษาศาสตร์เชิงคำนวณ
Scope
ครอบคลุมพื้นที่การประยุกต์ใช้หลักของเทคโนโลยีคำพูดและภาษา — การรู้จำเสียงพูดอัตโนมัติ, การสังเคราะห์ข้อความเป็นคำพูด, การดึงข้อมูล, และระบบตอบคำถามและสนทนา โดยจัดให้สิ่งเหล่านี้เป็นงานบูรณาการที่รวมเอาพื้นฐานของสาขา, การแยกวิเคราะห์, อรรถศาสตร์, และวิธีการเรียนรู้เข้าไว้ด้วยกัน เทคนิคส่วนประกอบจะครอบคลุมในพื้นที่ที่เกี่ยวข้อง
Sub-topics
Core questions
- ภาษาพูดถูกแปลงเป็นและจากข้อความได้อย่างไร?
- ข้อมูลที่มีโครงสร้างถูกดึงออกมาจากเอกสารที่ไม่มีโครงสร้างได้อย่างไร?
- ระบบตอบคำถามภาษาธรรมชาติและรักษาสนทนาได้อย่างไร?
- ระบบประยุกต์ถูกประเมินเพื่อการใช้งานจริงได้อย่างไร?
Key concepts
- การรู้จำเสียงพูดอัตโนมัติ
- การสังเคราะห์ข้อความเป็นคำพูด
- การดึงข้อมูล
- การรู้จำเอนทิตีที่มีชื่อ
- การตอบคำถาม
- ระบบสนทนา
- แบบจำลองอะคูสติก
- การประเมินผล
Key theories
- การรู้จำเสียงพูดแบบช่องสัญญาณรบกวน
- การกำหนดกรอบการรู้จำเป็นการกู้คืนลำดับคำที่มีความน่าจะเป็นมากที่สุดเมื่อได้รับสัญญาณอะคูสติก โดยการรวมแบบจำลองอะคูสติกและแบบจำลองภาษาเข้าด้วยกัน
- กระบวนการทำความเข้าใจภาษา
- แอปพลิเคชันประกอบด้วยการแยกโทเค็น, การแยกวิเคราะห์, อรรถศาสตร์, และการดึงข้อมูลเข้าเป็นกระบวนการ (pipelines) หรือแบบจำลองแบบครบวงจร (end-to-end models) ที่แปลงอินพุตของผู้ใช้เป็นการตอบสนองที่เป็นประโยชน์
History
การรู้จำเสียงพูดเป็นแรงขับเคลื่อนสำคัญของ NLP เชิงสถิติในยุคแรกเริ่ม โดยมีคลังข้อมูลร่วมกัน เช่น ชุดข้อมูล Wall Street Journal ที่ช่วยให้สามารถเปรียบเทียบได้อย่างเข้มงวด การดึงข้อมูลและการตอบคำถามเติบโตขึ้นจากการรณรงค์ประเมินผลในช่วงทศวรรษ 1990 และ 2000 และระบบสนทนาได้กลายเป็นผลิตภัณฑ์สำหรับผู้บริโภคเมื่อวิธีการทางโครงข่ายประสาทเทียมและแบบจำลองภาษาขนาดใหญ่พัฒนาเต็มที่
Debates
- กระบวนการ (Pipelines) เทียบกับระบบแบบครบวงจร (end-to-end systems)
- ว่าจะสร้างแอปพลิเคชันจากส่วนประกอบทางภาษาที่เป็นโมดูลาร์ หรือจะฝึกระบบโครงข่ายประสาทเทียมแบบครบวงจร; แนวทางแบบครบวงจรมีอิทธิพลเหนือกว่าในกรณีที่มีข้อมูลจำนวนมาก แต่ให้ความสามารถในการตีความที่น้อยกว่า
Key figures
- Daniel Jurafsky
- James H. Martin
- Frederick Jelinek
- Janet Baker
Related topics
Seminal works
- paul1992
- manning1999
- jurafsky2025
Frequently asked questions
- ทำไมถึงจัดกลุ่มแอปพลิเคชันคำพูดและข้อความเข้าด้วยกัน?
- เนื่องจากมีพื้นฐานเชิงความน่าจะเป็นและโครงข่ายประสาทเทียมร่วมกัน — แบบจำลองภาษา, การสร้างแบบจำลองลำดับ, และการประเมินผล — ดังนั้นเทคนิคที่พัฒนาขึ้นสำหรับอย่างหนึ่ง เช่น การสร้างแบบจำลองภาษาในการรู้จำเสียงพูด จึงสามารถถ่ายทอดไปยังอีกอย่างหนึ่งได้อย่างง่ายดาย