เหตุใดการสูญเสียการได้ยินจึงทำให้เข้าใจคำพูดได้ยาก แม้ว่าเสียงจะยังได้ยินอยู่?

การได้ยินช่วยให้ตรวจจับเสียงได้ แต่ไม่สามารถฟื้นฟูความละเอียดของความถี่และเวลาที่คำพูดอาศัยอยู่ได้ การเลือกความถี่ของหูชั้นในที่ลดลงและการเข้ารหัสเวลาทำให้สัญญาณที่แยกแยะเสียงพูดพร่ามัว ดังนั้นความเข้าใจ โดยเฉพาะอย่างยิ่งในสภาพแวดล้อมที่มีเสียงรบกวน อาจยังคงไม่ดีแม้ว่าเสียงจะดังพอที่จะได้ยินก็ตาม

ความเข้าใจคำพูดวัดได้อย่างไร?

โดยทั่วไปจะวัดเชิงพฤติกรรมเป็นเปอร์เซ็นต์ของคำหรือประโยคที่ระบุได้อย่างถูกต้องที่ระดับหรืออัตราส่วนสัญญาณต่อเสียงรบกวนที่กำหนด บางครั้งสรุปเป็นเกณฑ์การรับรู้คำพูด นอกจากนี้ยังสามารถคาดการณ์ได้จากการได้ยินของคำพูดในแถบความถี่โดยใช้ดัชนีต่างๆ เช่น ดัชนีความเข้าใจคำพูด

การรับรู้ความเข้าใจคำพูด

การรับรู้คำพูดคือกระบวนการที่ผู้ฟังสามารถแยกแยะหน่วยทางภาษา คำ และความหมายจากสัญญาณเสียงพูดที่มีการเปลี่ยนแปลงอย่างรวดเร็ว ความเข้าใจคำพูดคือระดับที่คำพูดได้รับการเข้าใจอย่างถูกต้อง และขึ้นอยู่กับเนื้อหาของคำพูด ผู้ฟัง และสภาพแวดล้อมในการฟัง โดยเฉพาะอย่างยิ่งเสียงรบกวนในพื้นหลัง หัวข้อนี้ครอบคลุมถึงสัญญาณเสียงที่ใช้แยกแยะเสียงพูด วิธีที่ผู้ฟังจัดหมวดหมู่เสียงเหล่านั้น และวิธีการวัดและคาดการณ์ความเข้าใจคำพูด

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

การรับรู้คำพูดคือกระบวนการทางการได้ยินและการรับรู้ที่เชื่อมโยงสัญญาณเสียงพูดเข้ากับหมวดหมู่ทางภาษา เช่น พยางค์และคำ และความเข้าใจคำพูดคือการวัดความถูกต้องที่ผู้ฟังสามารถเข้าใจคำพูดที่ตั้งใจไว้

Scope

หัวข้อนี้ครอบคลุมถึงสัญญาณเสียงของสระและพยัญชนะ การรับรู้พยางค์แบบแบ่งแยกประเภท ความทนทานของคำพูดต่อการเสื่อมสภาพและเสียงรบกวน และการวัดและการคาดการณ์ความเข้าใจคำพูด เป็นข้อมูลอ้างอิงและสื่อการเรียนรู้เกี่ยวกับการรับรู้การได้ยินและคำพูด ไม่ใช่แนวทางปฏิบัติทางคลินิก

Core questions

สัญญาณเสียงใดที่แยกแยะเสียงพูดหนึ่งจากอีกเสียงหนึ่ง?
ผู้ฟังเชื่อมโยงสัญญาณที่เปลี่ยนแปลงอย่างต่อเนื่องเข้ากับพยางค์ที่แยกจากกันได้อย่างไร?
สัญญาณเสียงพูดสามารถเสื่อมสภาพได้มากเพียงใดก่อนที่ความเข้าใจจะล้มเหลว?
ความเข้าใจคำพูดถูกวัดและคาดการณ์อย่างไรในสภาพแวดล้อมการฟังต่างๆ?

Key concepts

ฟอร์แมนต์และเอกลักษณ์ของสระ
เวลาเริ่มต้นของเสียงพูดและสัญญาณพยัญชนะ
การรับรู้แบบแบ่งแยกประเภท
เกณฑ์การรับรู้คำพูด
ดัชนีความเข้าใจคำพูด
สัญญาณซองจดหมายเทียบกับโครงสร้างละเอียด
คำพูดในเสียงรบกวนและการบดบังข้อมูล

Key theories

การรับรู้คำพูดแบบแบ่งแยกประเภท: ผู้ฟังมักจะแบ่งความต่อเนื่องของเสียงพูด เช่น ชุดที่แตกต่างกันในเวลาเริ่มต้นของเสียงพูด ออกเป็นหมวดหมู่พยางค์ที่แยกจากกัน โดยแยกแยะคู่ที่ข้ามขอบเขตหมวดหมู่ได้ดีกว่าคู่ที่มีระยะห่างเท่ากันภายในหมวดหมู่เดียวกัน
การกระจายข้อมูลคำพูดในแถบความถี่: ความเข้าใจสามารถคาดการณ์ได้โดยการถ่วงน้ำหนักการได้ยินของคำพูดในแถบความถี่ ซึ่งเป็นพื้นฐานของดัชนีการออกเสียงและดัชนีความเข้าใจคำพูด ซึ่งวัดปริมาณข้อมูลคำพูดที่ใช้งานได้ที่ผู้ฟังได้รับ

Mechanisms

สระส่วนใหญ่ถูกระบุด้วยความถี่ของฟอร์แมนต์ ซึ่งเป็นเสียงสะท้อนของช่องเสียง ในขณะที่พยัญชนะถูกส่งสัญญาณด้วยการเปลี่ยนแปลงสเปกตรัมอย่างรวดเร็ว การระเบิดของเสียง และสัญญาณเวลา เช่น เวลาเริ่มต้นของเสียงพูด ระบบการได้ยินจะดึงรูปแบบสเปกตรัมและเวลาเหล่านี้ออกมา และการประมวลผลในระดับที่สูงขึ้นจะเชื่อมโยงรูปแบบเหล่านี้เข้ากับหมวดหมู่พยางค์และคำ โดยอาศัยบริบทและความรู้ทางภาษา คำพูดมีความซ้ำซ้อนสูง ดังนั้นจึงยังคงเข้าใจได้แม้ว่าจะเสื่อมสภาพไปมาก การทดลองที่แทนที่รายละเอียดสเปกตรัมละเอียดด้วยแถบเสียงรบกวนที่ปรับความกว้างไม่กี่แถบแสดงให้เห็นว่าซองจดหมายเวลาที่ช้าเพียงอย่างเดียวสามารถรองรับการจดจำที่ดีในสภาพแวดล้อมที่เงียบ ซึ่งเป็นหลักการที่เกี่ยวข้องกับการเข้ารหัสประสาทหูเทียม

Clinical relevance

ความยากลำบากในการเข้าใจคำพูด โดยเฉพาะอย่างยิ่งในสภาพแวดล้อมที่มีเสียงรบกวน เป็นหนึ่งในผลกระทบที่พบบ่อยที่สุดและทำให้เกิดความพิการจากการสูญเสียการได้ยิน และอาจเกินกว่าที่เกณฑ์การได้ยินเสียงบริสุทธิ์จะคาดการณ์ได้ เนื่องจากความสามารถในการเลือกความถี่ที่ลดลงและการเข้ารหัสเวลาทำให้สัญญาณที่ผู้ฟังอาศัยอยู่เสื่อมสภาพลง ดังนั้น การวัดการรับรู้คำพูดจึงเสริมการตรวจการได้ยินในการอธิบายการได้ยินเชิงหน้าที่ เนื้อหานี้อธิบายว่าทำไมจึงมีการทดสอบความเข้าใจคำพูด และไม่ใช่พื้นฐานสำหรับการวินิจฉัยหรือการรักษาเฉพาะบุคคล

Evidence & guidelines

พื้นฐานทางเสียงของสระและพยัญชนะได้รับการศึกษาในงานวิจัยคลาสสิกโดย Peterson และ Barney (1952) และ Miller และ Nicely (1955) และการรับรู้แบบแบ่งแยกประเภทได้รับการยืนยันโดย Liberman และคณะ (1957) การคาดการณ์ความเข้าใจคำพูดจากการได้ยินของแถบความถี่ได้รับการกำหนดมาตรฐานเป็นดัชนีความเข้าใจคำพูด (Speech Intelligibility Index) ใน ANSI S3.5-1997 และความเพียงพอของสัญญาณซองจดหมายเวลาได้รับการแสดงให้เห็นโดย Shannon และคณะ (1995)

History

งานในช่วงสงครามและหลังสงครามที่ Bell Laboratories เกี่ยวกับการออกเสียงของคำพูดทางโทรศัพท์ได้สร้างดัชนีการออกเสียงและการศึกษาโดยละเอียดเกี่ยวกับเสียงพยัญชนะและสระ Liberman และคณะที่ Haskins Laboratories ได้สร้างการรับรู้แบบแบ่งแยกประเภทในช่วงทศวรรษ 1950 และพัฒนาทฤษฎีคำพูดที่มีอิทธิพล งานวิจัยในภายหลัง รวมถึงการศึกษา band-vocoder โดย Shannon และคณะ ได้ชี้แจงบทบาทสัมพัทธ์ของรายละเอียดสเปกตรัมและซองจดหมายเวลา และเป็นข้อมูลสำหรับการประมวลผลสัญญาณประสาทหูเทียม

Debates

คำพูดถูกรับรู้โดยกลไกเฉพาะทางหรือโดยกระบวนการทางการได้ยินทั่วไป?: ทฤษฎีต่างๆ แตกต่างกันว่าคำพูดใช้โหมดการรับรู้เฉพาะที่เชื่อมโยงกับการออกเสียง หรือถูกจัดการโดยกระบวนการทางการได้ยินและการเรียนรู้ทั่วไป ทั้งสองมุมมองอธิบายส่วนหนึ่งของหลักฐาน และคำถามยังคงเป็นที่ถกเถียงกัน

Key figures

George A. Miller
Gordon Peterson
Alvin Liberman
Robert Shannon
Harvey Fletcher

Seminal works

peterson-barney-1952
miller-nicely-1955
liberman-1957
shannon-1995

Frequently asked questions

เหตุใดการสูญเสียการได้ยินจึงทำให้เข้าใจคำพูดได้ยาก แม้ว่าเสียงจะยังได้ยินอยู่?: การได้ยินช่วยให้ตรวจจับเสียงได้ แต่ไม่สามารถฟื้นฟูความละเอียดของความถี่และเวลาที่คำพูดอาศัยอยู่ได้ การเลือกความถี่ของหูชั้นในที่ลดลงและการเข้ารหัสเวลาทำให้สัญญาณที่แยกแยะเสียงพูดพร่ามัว ดังนั้นความเข้าใจ โดยเฉพาะอย่างยิ่งในสภาพแวดล้อมที่มีเสียงรบกวน อาจยังคงไม่ดีแม้ว่าเสียงจะดังพอที่จะได้ยินก็ตาม
ความเข้าใจคำพูดวัดได้อย่างไร?: โดยทั่วไปจะวัดเชิงพฤติกรรมเป็นเปอร์เซ็นต์ของคำหรือประโยคที่ระบุได้อย่างถูกต้องที่ระดับหรืออัตราส่วนสัญญาณต่อเสียงรบกวนที่กำหนด บางครั้งสรุปเป็นเกณฑ์การรับรู้คำพูด นอกจากนี้ยังสามารถคาดการณ์ได้จากการได้ยินของคำพูดในแถบความถี่โดยใช้ดัชนีต่างๆ เช่น ดัชนีความเข้าใจคำพูด