ScholarGate
ผู้ช่วย

การประยุกต์ใช้ภาษาและคำพูด

การประยุกต์ใช้ภาษาศาสตร์เชิงคำนวณ: การแปลงระหว่างคำพูดและข้อความ, การดึงข้อมูลที่มีโครงสร้างจากเอกสาร, และการสร้างระบบที่ตอบคำถามและสนทนาได้

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics
Tools & resources
ดาวน์โหลดสไลด์
Learn & explore
วิดีโอเร็ว ๆ นี้

Definition

การประยุกต์ใช้ภาษาและคำพูดคือระบบสำหรับผู้ใช้ปลายทางที่รับรู้, เข้าใจ, หรือสร้างภาษามนุษย์ โดยสร้างขึ้นจากการประกอบวิธีการทางภาษาศาสตร์เชิงคำนวณ

Scope

ครอบคลุมพื้นที่การประยุกต์ใช้หลักของเทคโนโลยีคำพูดและภาษา — การรู้จำเสียงพูดอัตโนมัติ, การสังเคราะห์ข้อความเป็นคำพูด, การดึงข้อมูล, และระบบตอบคำถามและสนทนา โดยจัดให้สิ่งเหล่านี้เป็นงานบูรณาการที่รวมเอาพื้นฐานของสาขา, การแยกวิเคราะห์, อรรถศาสตร์, และวิธีการเรียนรู้เข้าไว้ด้วยกัน เทคนิคส่วนประกอบจะครอบคลุมในพื้นที่ที่เกี่ยวข้อง

Sub-topics

Core questions

  • ภาษาพูดถูกแปลงเป็นและจากข้อความได้อย่างไร?
  • ข้อมูลที่มีโครงสร้างถูกดึงออกมาจากเอกสารที่ไม่มีโครงสร้างได้อย่างไร?
  • ระบบตอบคำถามภาษาธรรมชาติและรักษาสนทนาได้อย่างไร?
  • ระบบประยุกต์ถูกประเมินเพื่อการใช้งานจริงได้อย่างไร?

Key concepts

  • การรู้จำเสียงพูดอัตโนมัติ
  • การสังเคราะห์ข้อความเป็นคำพูด
  • การดึงข้อมูล
  • การรู้จำเอนทิตีที่มีชื่อ
  • การตอบคำถาม
  • ระบบสนทนา
  • แบบจำลองอะคูสติก
  • การประเมินผล

Key theories

การรู้จำเสียงพูดแบบช่องสัญญาณรบกวน
การกำหนดกรอบการรู้จำเป็นการกู้คืนลำดับคำที่มีความน่าจะเป็นมากที่สุดเมื่อได้รับสัญญาณอะคูสติก โดยการรวมแบบจำลองอะคูสติกและแบบจำลองภาษาเข้าด้วยกัน
กระบวนการทำความเข้าใจภาษา
แอปพลิเคชันประกอบด้วยการแยกโทเค็น, การแยกวิเคราะห์, อรรถศาสตร์, และการดึงข้อมูลเข้าเป็นกระบวนการ (pipelines) หรือแบบจำลองแบบครบวงจร (end-to-end models) ที่แปลงอินพุตของผู้ใช้เป็นการตอบสนองที่เป็นประโยชน์

History

การรู้จำเสียงพูดเป็นแรงขับเคลื่อนสำคัญของ NLP เชิงสถิติในยุคแรกเริ่ม โดยมีคลังข้อมูลร่วมกัน เช่น ชุดข้อมูล Wall Street Journal ที่ช่วยให้สามารถเปรียบเทียบได้อย่างเข้มงวด การดึงข้อมูลและการตอบคำถามเติบโตขึ้นจากการรณรงค์ประเมินผลในช่วงทศวรรษ 1990 และ 2000 และระบบสนทนาได้กลายเป็นผลิตภัณฑ์สำหรับผู้บริโภคเมื่อวิธีการทางโครงข่ายประสาทเทียมและแบบจำลองภาษาขนาดใหญ่พัฒนาเต็มที่

Debates

กระบวนการ (Pipelines) เทียบกับระบบแบบครบวงจร (end-to-end systems)
ว่าจะสร้างแอปพลิเคชันจากส่วนประกอบทางภาษาที่เป็นโมดูลาร์ หรือจะฝึกระบบโครงข่ายประสาทเทียมแบบครบวงจร; แนวทางแบบครบวงจรมีอิทธิพลเหนือกว่าในกรณีที่มีข้อมูลจำนวนมาก แต่ให้ความสามารถในการตีความที่น้อยกว่า

Key figures

  • Daniel Jurafsky
  • James H. Martin
  • Frederick Jelinek
  • Janet Baker

Related topics

Seminal works

  • paul1992
  • manning1999
  • jurafsky2025

Frequently asked questions

ทำไมถึงจัดกลุ่มแอปพลิเคชันคำพูดและข้อความเข้าด้วยกัน?
เนื่องจากมีพื้นฐานเชิงความน่าจะเป็นและโครงข่ายประสาทเทียมร่วมกัน — แบบจำลองภาษา, การสร้างแบบจำลองลำดับ, และการประเมินผล — ดังนั้นเทคนิคที่พัฒนาขึ้นสำหรับอย่างหนึ่ง เช่น การสร้างแบบจำลองภาษาในการรู้จำเสียงพูด จึงสามารถถ่ายทอดไปยังอีกอย่างหนึ่งได้อย่างง่ายดาย

Methods for this concept

Related concepts