Process / pipelineAudio Signal Processing

MFCC (Mel-Frequency Cepstral Coefficients)

Mel-Frequency Cepstral Coefficients (MFCCs) คือการแสดงคุณลักษณะเสียงที่กะทัดรัด ซึ่งเลียนแบบการรับรู้ของมนุษย์ MFCCs ถูกนำเสนอโดย Davis และ Mermelstein ในปี 1980 และกลายเป็นวิธีการสกัดคุณลักษณะมาตรฐานสำหรับการรู้จำเสียงพูดและการวิเคราะห์เสียงสิ่งแวดล้อม MFCCs บีบอัดข้อมูลความถี่ของสัญญาณเสียงให้อยู่ในชุดสัมประสิทธิ์จำนวนน้อยที่จับเนื้อหาทางสัทศาสตร์ ในขณะที่ละทิ้งรายละเอียดที่ไม่เกี่ยวข้อง

เปิดใน MethodMindเร็ว ๆ นี้วิดีโอเร็ว ๆ นี้Download slides

อ่านวิธีฉบับเต็ม

สำหรับสมาชิกเท่านั้น

เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้

เข้าสู่ระบบ

Method map

The neighbourhood of related methods — select a node to explore.

แหล่งอ้างอิง

  1. Davis, S., & Mermelstein, P. (1980). Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(4), 357-366. DOI: 10.1109/TASSP.1980.1163420
  2. Young, S. J., Evermann, G., Gales, M. J., et al. (1996). The HTK Book. Cambridge University Engineering Department. link
  3. Moustakides, G. V., & Rougui, J. A. (2004). Optimal filtering for polynomial signal models. IEEE Transactions on Signal Processing, 52(8), 2219-2230. link

วิธีอ้างอิงหน้านี้

ScholarGate. (2026, June 3). Mel-Frequency Cepstral Coefficients. ScholarGate. https://scholargate.app/th/applied-physics/mfcc

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

ถูกอ้างอิงโดย

ScholarGateMFCC (Mel-Frequency Cepstral Coefficients). สืบค้นเมื่อ 2026-06-15 จาก https://scholargate.app/th/applied-physics/mfcc · ชุดข้อมูล: https://doi.org/10.5281/zenodo.20539026