MFCC (Mel-Frequency Cepstral Coefficients)
I Mel-Frequency Cepstral Coefficients (MFCCs) sono una rappresentazione compatta di caratteristiche audio che mimano la percezione uditiva umana. Introdotti da Davis e Mermelstein nel 1980, gli MFCC sono il metodo di estrazione delle caratteristiche de facto per il riconoscimento vocale e l'analisi dei suoni ambientali. Comprimono le informazioni di frequenza dei segnali audio in un piccolo insieme di coefficienti che catturano il contenuto fonetico scartando dettagli irrilevanti.
Leggi il metodo completo
Accedi con un account gratuito per leggere questa sezione.
Method map
The neighbourhood of related methods — select a node to explore.
Fonti
- Davis, S., & Mermelstein, P. (1980). Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(4), 357-366. DOI: 10.1109/TASSP.1980.1163420 ↗
- Young, S. J., Evermann, G., Gales, M. J., et al. (1996). The HTK Book. Cambridge University Engineering Department. link ↗
- Moustakides, G. V., & Rougui, J. A. (2004). Optimal filtering for polynomial signal models. IEEE Transactions on Signal Processing, 52(8), 2219-2230. link ↗
Come citare questa pagina
ScholarGate. (2026, June 3). Mel-Frequency Cepstral Coefficients. ScholarGate. https://scholargate.app/it/applied-physics/mfcc
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- AmbisonicsFisica applicata↔ compare
- Funzione di Trasferimento Legata alla TestaFisica applicata↔ compare
- Analisi Vettoriale IndipendenteFisica applicata↔ compare
Citato da
Hai notato un problema in questa pagina? Segnalalo o proponi una correzione →