ScholarGate
Assistente
Process / pipelineAudio Signal Processing

MFCC (Mel-Frequency Cepstral Coefficients)

I Mel-Frequency Cepstral Coefficients (MFCCs) sono una rappresentazione compatta di caratteristiche audio che mimano la percezione uditiva umana. Introdotti da Davis e Mermelstein nel 1980, gli MFCC sono il metodo di estrazione delle caratteristiche de facto per il riconoscimento vocale e l'analisi dei suoni ambientali. Comprimono le informazioni di frequenza dei segnali audio in un piccolo insieme di coefficienti che catturano il contenuto fonetico scartando dettagli irrilevanti.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

Fonti

  1. Davis, S., & Mermelstein, P. (1980). Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(4), 357-366. DOI: 10.1109/TASSP.1980.1163420
  2. Young, S. J., Evermann, G., Gales, M. J., et al. (1996). The HTK Book. Cambridge University Engineering Department. link
  3. Moustakides, G. V., & Rougui, J. A. (2004). Optimal filtering for polynomial signal models. IEEE Transactions on Signal Processing, 52(8), 2219-2230. link

Come citare questa pagina

ScholarGate. (2026, June 3). Mel-Frequency Cepstral Coefficients. ScholarGate. https://scholargate.app/it/applied-physics/mfcc

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citato da

ScholarGateMFCC (Mel-Frequency Cepstral Coefficients). Consultato il 2026-06-15 da https://scholargate.app/it/applied-physics/mfcc · Insieme di dati: https://doi.org/10.5281/zenodo.20539026