การรับรู้ความเข้าใจคำพูด
การรับรู้คำพูดคือกระบวนการที่ผู้ฟังสามารถแยกแยะหน่วยทางภาษา คำ และความหมายจากสัญญาณเสียงพูดที่มีการเปลี่ยนแปลงอย่างรวดเร็ว ความเข้าใจคำพูดคือระดับที่คำพูดได้รับการเข้าใจอย่างถูกต้อง และขึ้นอยู่กับเนื้อหาของคำพูด ผู้ฟัง และสภาพแวดล้อมในการฟัง โดยเฉพาะอย่างยิ่งเสียงรบกวนในพื้นหลัง หัวข้อนี้ครอบคลุมถึงสัญญาณเสียงที่ใช้แยกแยะเสียงพูด วิธีที่ผู้ฟังจัดหมวดหมู่เสียงเหล่านั้น และวิธีการวัดและคาดการณ์ความเข้าใจคำพูด
Definition
การรับรู้คำพูดคือกระบวนการทางการได้ยินและการรับรู้ที่เชื่อมโยงสัญญาณเสียงพูดเข้ากับหมวดหมู่ทางภาษา เช่น พยางค์และคำ และความเข้าใจคำพูดคือการวัดความถูกต้องที่ผู้ฟังสามารถเข้าใจคำพูดที่ตั้งใจไว้
Scope
หัวข้อนี้ครอบคลุมถึงสัญญาณเสียงของสระและพยัญชนะ การรับรู้พยางค์แบบแบ่งแยกประเภท ความทนทานของคำพูดต่อการเสื่อมสภาพและเสียงรบกวน และการวัดและการคาดการณ์ความเข้าใจคำพูด เป็นข้อมูลอ้างอิงและสื่อการเรียนรู้เกี่ยวกับการรับรู้การได้ยินและคำพูด ไม่ใช่แนวทางปฏิบัติทางคลินิก
Core questions
- สัญญาณเสียงใดที่แยกแยะเสียงพูดหนึ่งจากอีกเสียงหนึ่ง?
- ผู้ฟังเชื่อมโยงสัญญาณที่เปลี่ยนแปลงอย่างต่อเนื่องเข้ากับพยางค์ที่แยกจากกันได้อย่างไร?
- สัญญาณเสียงพูดสามารถเสื่อมสภาพได้มากเพียงใดก่อนที่ความเข้าใจจะล้มเหลว?
- ความเข้าใจคำพูดถูกวัดและคาดการณ์อย่างไรในสภาพแวดล้อมการฟังต่างๆ?
Key concepts
- ฟอร์แมนต์และเอกลักษณ์ของสระ
- เวลาเริ่มต้นของเสียงพูดและสัญญาณพยัญชนะ
- การรับรู้แบบแบ่งแยกประเภท
- เกณฑ์การรับรู้คำพูด
- ดัชนีความเข้าใจคำพูด
- สัญญาณซองจดหมายเทียบกับโครงสร้างละเอียด
- คำพูดในเสียงรบกวนและการบดบังข้อมูล
Key theories
- การรับรู้คำพูดแบบแบ่งแยกประเภท
- ผู้ฟังมักจะแบ่งความต่อเนื่องของเสียงพูด เช่น ชุดที่แตกต่างกันในเวลาเริ่มต้นของเสียงพูด ออกเป็นหมวดหมู่พยางค์ที่แยกจากกัน โดยแยกแยะคู่ที่ข้ามขอบเขตหมวดหมู่ได้ดีกว่าคู่ที่มีระยะห่างเท่ากันภายในหมวดหมู่เดียวกัน
- การกระจายข้อมูลคำพูดในแถบความถี่
- ความเข้าใจสามารถคาดการณ์ได้โดยการถ่วงน้ำหนักการได้ยินของคำพูดในแถบความถี่ ซึ่งเป็นพื้นฐานของดัชนีการออกเสียงและดัชนีความเข้าใจคำพูด ซึ่งวัดปริมาณข้อมูลคำพูดที่ใช้งานได้ที่ผู้ฟังได้รับ
Mechanisms
สระส่วนใหญ่ถูกระบุด้วยความถี่ของฟอร์แมนต์ ซึ่งเป็นเสียงสะท้อนของช่องเสียง ในขณะที่พยัญชนะถูกส่งสัญญาณด้วยการเปลี่ยนแปลงสเปกตรัมอย่างรวดเร็ว การระเบิดของเสียง และสัญญาณเวลา เช่น เวลาเริ่มต้นของเสียงพูด ระบบการได้ยินจะดึงรูปแบบสเปกตรัมและเวลาเหล่านี้ออกมา และการประมวลผลในระดับที่สูงขึ้นจะเชื่อมโยงรูปแบบเหล่านี้เข้ากับหมวดหมู่พยางค์และคำ โดยอาศัยบริบทและความรู้ทางภาษา คำพูดมีความซ้ำซ้อนสูง ดังนั้นจึงยังคงเข้าใจได้แม้ว่าจะเสื่อมสภาพไปมาก การทดลองที่แทนที่รายละเอียดสเปกตรัมละเอียดด้วยแถบเสียงรบกวนที่ปรับความกว้างไม่กี่แถบแสดงให้เห็นว่าซองจดหมายเวลาที่ช้าเพียงอย่างเดียวสามารถรองรับการจดจำที่ดีในสภาพแวดล้อมที่เงียบ ซึ่งเป็นหลักการที่เกี่ยวข้องกับการเข้ารหัสประสาทหูเทียม
Clinical relevance
ความยากลำบากในการเข้าใจคำพูด โดยเฉพาะอย่างยิ่งในสภาพแวดล้อมที่มีเสียงรบกวน เป็นหนึ่งในผลกระทบที่พบบ่อยที่สุดและทำให้เกิดความพิการจากการสูญเสียการได้ยิน และอาจเกินกว่าที่เกณฑ์การได้ยินเสียงบริสุทธิ์จะคาดการณ์ได้ เนื่องจากความสามารถในการเลือกความถี่ที่ลดลงและการเข้ารหัสเวลาทำให้สัญญาณที่ผู้ฟังอาศัยอยู่เสื่อมสภาพลง ดังนั้น การวัดการรับรู้คำพูดจึงเสริมการตรวจการได้ยินในการอธิบายการได้ยินเชิงหน้าที่ เนื้อหานี้อธิบายว่าทำไมจึงมีการทดสอบความเข้าใจคำพูด และไม่ใช่พื้นฐานสำหรับการวินิจฉัยหรือการรักษาเฉพาะบุคคล
Evidence & guidelines
พื้นฐานทางเสียงของสระและพยัญชนะได้รับการศึกษาในงานวิจัยคลาสสิกโดย Peterson และ Barney (1952) และ Miller และ Nicely (1955) และการรับรู้แบบแบ่งแยกประเภทได้รับการยืนยันโดย Liberman และคณะ (1957) การคาดการณ์ความเข้าใจคำพูดจากการได้ยินของแถบความถี่ได้รับการกำหนดมาตรฐานเป็นดัชนีความเข้าใจคำพูด (Speech Intelligibility Index) ใน ANSI S3.5-1997 และความเพียงพอของสัญญาณซองจดหมายเวลาได้รับการแสดงให้เห็นโดย Shannon และคณะ (1995)
History
งานในช่วงสงครามและหลังสงครามที่ Bell Laboratories เกี่ยวกับการออกเสียงของคำพูดทางโทรศัพท์ได้สร้างดัชนีการออกเสียงและการศึกษาโดยละเอียดเกี่ยวกับเสียงพยัญชนะและสระ Liberman และคณะที่ Haskins Laboratories ได้สร้างการรับรู้แบบแบ่งแยกประเภทในช่วงทศวรรษ 1950 และพัฒนาทฤษฎีคำพูดที่มีอิทธิพล งานวิจัยในภายหลัง รวมถึงการศึกษา band-vocoder โดย Shannon และคณะ ได้ชี้แจงบทบาทสัมพัทธ์ของรายละเอียดสเปกตรัมและซองจดหมายเวลา และเป็นข้อมูลสำหรับการประมวลผลสัญญาณประสาทหูเทียม
Debates
- คำพูดถูกรับรู้โดยกลไกเฉพาะทางหรือโดยกระบวนการทางการได้ยินทั่วไป?
- ทฤษฎีต่างๆ แตกต่างกันว่าคำพูดใช้โหมดการรับรู้เฉพาะที่เชื่อมโยงกับการออกเสียง หรือถูกจัดการโดยกระบวนการทางการได้ยินและการเรียนรู้ทั่วไป ทั้งสองมุมมองอธิบายส่วนหนึ่งของหลักฐาน และคำถามยังคงเป็นที่ถกเถียงกัน
Key figures
- George A. Miller
- Gordon Peterson
- Alvin Liberman
- Robert Shannon
- Harvey Fletcher
Related topics
Seminal works
- peterson-barney-1952
- miller-nicely-1955
- liberman-1957
- shannon-1995
Frequently asked questions
- เหตุใดการสูญเสียการได้ยินจึงทำให้เข้าใจคำพูดได้ยาก แม้ว่าเสียงจะยังได้ยินอยู่?
- การได้ยินช่วยให้ตรวจจับเสียงได้ แต่ไม่สามารถฟื้นฟูความละเอียดของความถี่และเวลาที่คำพูดอาศัยอยู่ได้ การเลือกความถี่ของหูชั้นในที่ลดลงและการเข้ารหัสเวลาทำให้สัญญาณที่แยกแยะเสียงพูดพร่ามัว ดังนั้นความเข้าใจ โดยเฉพาะอย่างยิ่งในสภาพแวดล้อมที่มีเสียงรบกวน อาจยังคงไม่ดีแม้ว่าเสียงจะดังพอที่จะได้ยินก็ตาม
- ความเข้าใจคำพูดวัดได้อย่างไร?
- โดยทั่วไปจะวัดเชิงพฤติกรรมเป็นเปอร์เซ็นต์ของคำหรือประโยคที่ระบุได้อย่างถูกต้องที่ระดับหรืออัตราส่วนสัญญาณต่อเสียงรบกวนที่กำหนด บางครั้งสรุปเป็นเกณฑ์การรับรู้คำพูด นอกจากนี้ยังสามารถคาดการณ์ได้จากการได้ยินของคำพูดในแถบความถี่โดยใช้ดัชนีต่างๆ เช่น ดัชนีความเข้าใจคำพูด