ScholarGate
ผู้ช่วย

การรับรู้ความเข้าใจคำพูด

การรับรู้คำพูดคือกระบวนการที่ผู้ฟังสามารถแยกแยะหน่วยทางภาษา คำ และความหมายจากสัญญาณเสียงพูดที่มีการเปลี่ยนแปลงอย่างรวดเร็ว ความเข้าใจคำพูดคือระดับที่คำพูดได้รับการเข้าใจอย่างถูกต้อง และขึ้นอยู่กับเนื้อหาของคำพูด ผู้ฟัง และสภาพแวดล้อมในการฟัง โดยเฉพาะอย่างยิ่งเสียงรบกวนในพื้นหลัง หัวข้อนี้ครอบคลุมถึงสัญญาณเสียงที่ใช้แยกแยะเสียงพูด วิธีที่ผู้ฟังจัดหมวดหมู่เสียงเหล่านั้น และวิธีการวัดและคาดการณ์ความเข้าใจคำพูด

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics
Tools & resources
ดาวน์โหลดสไลด์
Learn & explore
วิดีโอเร็ว ๆ นี้

Definition

การรับรู้คำพูดคือกระบวนการทางการได้ยินและการรับรู้ที่เชื่อมโยงสัญญาณเสียงพูดเข้ากับหมวดหมู่ทางภาษา เช่น พยางค์และคำ และความเข้าใจคำพูดคือการวัดความถูกต้องที่ผู้ฟังสามารถเข้าใจคำพูดที่ตั้งใจไว้

Scope

หัวข้อนี้ครอบคลุมถึงสัญญาณเสียงของสระและพยัญชนะ การรับรู้พยางค์แบบแบ่งแยกประเภท ความทนทานของคำพูดต่อการเสื่อมสภาพและเสียงรบกวน และการวัดและการคาดการณ์ความเข้าใจคำพูด เป็นข้อมูลอ้างอิงและสื่อการเรียนรู้เกี่ยวกับการรับรู้การได้ยินและคำพูด ไม่ใช่แนวทางปฏิบัติทางคลินิก

Core questions

  • สัญญาณเสียงใดที่แยกแยะเสียงพูดหนึ่งจากอีกเสียงหนึ่ง?
  • ผู้ฟังเชื่อมโยงสัญญาณที่เปลี่ยนแปลงอย่างต่อเนื่องเข้ากับพยางค์ที่แยกจากกันได้อย่างไร?
  • สัญญาณเสียงพูดสามารถเสื่อมสภาพได้มากเพียงใดก่อนที่ความเข้าใจจะล้มเหลว?
  • ความเข้าใจคำพูดถูกวัดและคาดการณ์อย่างไรในสภาพแวดล้อมการฟังต่างๆ?

Key concepts

  • ฟอร์แมนต์และเอกลักษณ์ของสระ
  • เวลาเริ่มต้นของเสียงพูดและสัญญาณพยัญชนะ
  • การรับรู้แบบแบ่งแยกประเภท
  • เกณฑ์การรับรู้คำพูด
  • ดัชนีความเข้าใจคำพูด
  • สัญญาณซองจดหมายเทียบกับโครงสร้างละเอียด
  • คำพูดในเสียงรบกวนและการบดบังข้อมูล

Key theories

การรับรู้คำพูดแบบแบ่งแยกประเภท
ผู้ฟังมักจะแบ่งความต่อเนื่องของเสียงพูด เช่น ชุดที่แตกต่างกันในเวลาเริ่มต้นของเสียงพูด ออกเป็นหมวดหมู่พยางค์ที่แยกจากกัน โดยแยกแยะคู่ที่ข้ามขอบเขตหมวดหมู่ได้ดีกว่าคู่ที่มีระยะห่างเท่ากันภายในหมวดหมู่เดียวกัน
การกระจายข้อมูลคำพูดในแถบความถี่
ความเข้าใจสามารถคาดการณ์ได้โดยการถ่วงน้ำหนักการได้ยินของคำพูดในแถบความถี่ ซึ่งเป็นพื้นฐานของดัชนีการออกเสียงและดัชนีความเข้าใจคำพูด ซึ่งวัดปริมาณข้อมูลคำพูดที่ใช้งานได้ที่ผู้ฟังได้รับ

Mechanisms

สระส่วนใหญ่ถูกระบุด้วยความถี่ของฟอร์แมนต์ ซึ่งเป็นเสียงสะท้อนของช่องเสียง ในขณะที่พยัญชนะถูกส่งสัญญาณด้วยการเปลี่ยนแปลงสเปกตรัมอย่างรวดเร็ว การระเบิดของเสียง และสัญญาณเวลา เช่น เวลาเริ่มต้นของเสียงพูด ระบบการได้ยินจะดึงรูปแบบสเปกตรัมและเวลาเหล่านี้ออกมา และการประมวลผลในระดับที่สูงขึ้นจะเชื่อมโยงรูปแบบเหล่านี้เข้ากับหมวดหมู่พยางค์และคำ โดยอาศัยบริบทและความรู้ทางภาษา คำพูดมีความซ้ำซ้อนสูง ดังนั้นจึงยังคงเข้าใจได้แม้ว่าจะเสื่อมสภาพไปมาก การทดลองที่แทนที่รายละเอียดสเปกตรัมละเอียดด้วยแถบเสียงรบกวนที่ปรับความกว้างไม่กี่แถบแสดงให้เห็นว่าซองจดหมายเวลาที่ช้าเพียงอย่างเดียวสามารถรองรับการจดจำที่ดีในสภาพแวดล้อมที่เงียบ ซึ่งเป็นหลักการที่เกี่ยวข้องกับการเข้ารหัสประสาทหูเทียม

Clinical relevance

ความยากลำบากในการเข้าใจคำพูด โดยเฉพาะอย่างยิ่งในสภาพแวดล้อมที่มีเสียงรบกวน เป็นหนึ่งในผลกระทบที่พบบ่อยที่สุดและทำให้เกิดความพิการจากการสูญเสียการได้ยิน และอาจเกินกว่าที่เกณฑ์การได้ยินเสียงบริสุทธิ์จะคาดการณ์ได้ เนื่องจากความสามารถในการเลือกความถี่ที่ลดลงและการเข้ารหัสเวลาทำให้สัญญาณที่ผู้ฟังอาศัยอยู่เสื่อมสภาพลง ดังนั้น การวัดการรับรู้คำพูดจึงเสริมการตรวจการได้ยินในการอธิบายการได้ยินเชิงหน้าที่ เนื้อหานี้อธิบายว่าทำไมจึงมีการทดสอบความเข้าใจคำพูด และไม่ใช่พื้นฐานสำหรับการวินิจฉัยหรือการรักษาเฉพาะบุคคล

Evidence & guidelines

พื้นฐานทางเสียงของสระและพยัญชนะได้รับการศึกษาในงานวิจัยคลาสสิกโดย Peterson และ Barney (1952) และ Miller และ Nicely (1955) และการรับรู้แบบแบ่งแยกประเภทได้รับการยืนยันโดย Liberman และคณะ (1957) การคาดการณ์ความเข้าใจคำพูดจากการได้ยินของแถบความถี่ได้รับการกำหนดมาตรฐานเป็นดัชนีความเข้าใจคำพูด (Speech Intelligibility Index) ใน ANSI S3.5-1997 และความเพียงพอของสัญญาณซองจดหมายเวลาได้รับการแสดงให้เห็นโดย Shannon และคณะ (1995)

History

งานในช่วงสงครามและหลังสงครามที่ Bell Laboratories เกี่ยวกับการออกเสียงของคำพูดทางโทรศัพท์ได้สร้างดัชนีการออกเสียงและการศึกษาโดยละเอียดเกี่ยวกับเสียงพยัญชนะและสระ Liberman และคณะที่ Haskins Laboratories ได้สร้างการรับรู้แบบแบ่งแยกประเภทในช่วงทศวรรษ 1950 และพัฒนาทฤษฎีคำพูดที่มีอิทธิพล งานวิจัยในภายหลัง รวมถึงการศึกษา band-vocoder โดย Shannon และคณะ ได้ชี้แจงบทบาทสัมพัทธ์ของรายละเอียดสเปกตรัมและซองจดหมายเวลา และเป็นข้อมูลสำหรับการประมวลผลสัญญาณประสาทหูเทียม

Debates

คำพูดถูกรับรู้โดยกลไกเฉพาะทางหรือโดยกระบวนการทางการได้ยินทั่วไป?
ทฤษฎีต่างๆ แตกต่างกันว่าคำพูดใช้โหมดการรับรู้เฉพาะที่เชื่อมโยงกับการออกเสียง หรือถูกจัดการโดยกระบวนการทางการได้ยินและการเรียนรู้ทั่วไป ทั้งสองมุมมองอธิบายส่วนหนึ่งของหลักฐาน และคำถามยังคงเป็นที่ถกเถียงกัน

Key figures

  • George A. Miller
  • Gordon Peterson
  • Alvin Liberman
  • Robert Shannon
  • Harvey Fletcher

Related topics

Seminal works

  • peterson-barney-1952
  • miller-nicely-1955
  • liberman-1957
  • shannon-1995

Frequently asked questions

เหตุใดการสูญเสียการได้ยินจึงทำให้เข้าใจคำพูดได้ยาก แม้ว่าเสียงจะยังได้ยินอยู่?
การได้ยินช่วยให้ตรวจจับเสียงได้ แต่ไม่สามารถฟื้นฟูความละเอียดของความถี่และเวลาที่คำพูดอาศัยอยู่ได้ การเลือกความถี่ของหูชั้นในที่ลดลงและการเข้ารหัสเวลาทำให้สัญญาณที่แยกแยะเสียงพูดพร่ามัว ดังนั้นความเข้าใจ โดยเฉพาะอย่างยิ่งในสภาพแวดล้อมที่มีเสียงรบกวน อาจยังคงไม่ดีแม้ว่าเสียงจะดังพอที่จะได้ยินก็ตาม
ความเข้าใจคำพูดวัดได้อย่างไร?
โดยทั่วไปจะวัดเชิงพฤติกรรมเป็นเปอร์เซ็นต์ของคำหรือประโยคที่ระบุได้อย่างถูกต้องที่ระดับหรืออัตราส่วนสัญญาณต่อเสียงรบกวนที่กำหนด บางครั้งสรุปเป็นเกณฑ์การรับรู้คำพูด นอกจากนี้ยังสามารถคาดการณ์ได้จากการได้ยินของคำพูดในแถบความถี่โดยใช้ดัชนีต่างๆ เช่น ดัชนีความเข้าใจคำพูด

Methods for this concept

Related concepts