MFCC (Mel-frekvencijski cepstralni koeficijenti)
Mel-frekvencijski cepstralni koeficijenti (MFCC) su kompaktna reprezentacija audio karakteristika koja oponaša ljudsku auditivnu percepciju. Uvedeni od strane Dejvisa i Mermelstajna 1980. godine, MFCC su de fakto metoda ekstrakcije karakteristika za prepoznavanje govora i analizu ambijentalnih zvukova. Oni komprimuju frekvencijske informacije audio signala u mali skup koeficijenata koji obuhvataju fonetski sadržaj, a odbacuju irelevantne detalje.
Pročitajte celu metodu
Prijavite se besplatnim nalogom da biste pročitali ovaj odeljak.
Method map
The neighbourhood of related methods — select a node to explore.
Izvori
- Davis, S., & Mermelstein, P. (1980). Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(4), 357-366. DOI: 10.1109/TASSP.1980.1163420 ↗
- Young, S. J., Evermann, G., Gales, M. J., et al. (1996). The HTK Book. Cambridge University Engineering Department. link ↗
- Moustakides, G. V., & Rougui, J. A. (2004). Optimal filtering for polynomial signal models. IEEE Transactions on Signal Processing, 52(8), 2219-2230. link ↗
Kako citirati ovu stranicu
ScholarGate. (2026, June 3). Mel-Frequency Cepstral Coefficients. ScholarGate. https://scholargate.app/sr/applied-physics/mfcc
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Ambisončni zvukPrimenjena fizika↔ compare
- Funkcija prenosa glave (HRTF)Primenjena fizika↔ compare
- Nezavisna analiza vektoraPrimenjena fizika↔ compare
Citirana u
Uočili ste grešku na ovoj stranici? Prijavite je ili predložite ispravku →