ScholarGate
Asisten
Process / pipelineAudio Signal Processing

Koefisien Cepstral Frekuensi Mel (MFCC)

Koefisien Cepstral Frekuensi Mel (MFCC) adalah representasi ringkas dari fitur audio yang meniru persepsi auditori manusia. Diperkenalkan oleh Davis dan Mermelstein pada tahun 1980, MFCC adalah metode ekstraksi fitur de facto untuk pengenalan ucapan dan analisis suara lingkungan. MFCC mengompresi informasi frekuensi sinyal audio menjadi sekumpulan kecil koefisien yang menangkap konten fonetik sambil membuang detail yang tidak relevan.

Buka di MethodMindSegeraVideoSegeraDownload slides

Baca metode selengkapnya

Khusus anggota

Masuk dengan akun gratis untuk membaca bagian ini.

Masuk

Method map

The neighbourhood of related methods — select a node to explore.

Sumber

  1. Davis, S., & Mermelstein, P. (1980). Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(4), 357-366. DOI: 10.1109/TASSP.1980.1163420
  2. Young, S. J., Evermann, G., Gales, M. J., et al. (1996). The HTK Book. Cambridge University Engineering Department. link
  3. Moustakides, G. V., & Rougui, J. A. (2004). Optimal filtering for polynomial signal models. IEEE Transactions on Signal Processing, 52(8), 2219-2230. link

Cara menyitasi halaman ini

ScholarGate. (2026, June 3). Mel-Frequency Cepstral Coefficients. ScholarGate. https://scholargate.app/id/applied-physics/mfcc

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Dirujuk oleh

ScholarGateMFCC (Mel-Frequency Cepstral Coefficients). Diakses 2026-06-15 dari https://scholargate.app/id/applied-physics/mfcc · Set data: https://doi.org/10.5281/zenodo.20539026