MFCC (Mel-Frequenz-Cepstral-Koeffizienten)
Mel-Frequenz-Cepstral-Koeffizienten (MFCCs) sind eine kompakte Darstellung von Audio-Merkmalen, die die menschliche Hörwahrnehmung nachahmen. Eingeführt von Davis und Mermelstein im Jahr 1980, sind MFCCs die de-facto-Merkmalsextraktionsmethode für Spracherkennung und die Analyse von Umgebungsgeräuschen. Sie komprimieren die Frequenzinformation von Audiosignalen in eine kleine Menge von Koeffizienten, die phonetischen Inhalt erfassen und irrelevante Details verwerfen.
Die vollständige Methode lesen
Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.
Method map
The neighbourhood of related methods — select a node to explore.
Quellen
- Davis, S., & Mermelstein, P. (1980). Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(4), 357-366. DOI: 10.1109/TASSP.1980.1163420 ↗
- Young, S. J., Evermann, G., Gales, M. J., et al. (1996). The HTK Book. Cambridge University Engineering Department. link ↗
- Moustakides, G. V., & Rougui, J. A. (2004). Optimal filtering for polynomial signal models. IEEE Transactions on Signal Processing, 52(8), 2219-2230. link ↗
So zitieren Sie diese Seite
ScholarGate. (2026, June 3). Mel-Frequency Cepstral Coefficients. ScholarGate. https://scholargate.app/de/applied-physics/mfcc
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- AmbisonicsAngewandte Physik↔ compare
- Kopfbezogene ÜbertragungsfunktionAngewandte Physik↔ compare
- Independent Vector AnalysisAngewandte Physik↔ compare
Referenziert von
Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →