Współczynniki cepstralne częstotliwości Mel (MFCC)
Współczynniki cepstralne częstotliwości Mel (MFCC) to zwarta reprezentacja cech dźwiękowych, która naśladuje ludzką percepcję słuchową. Wprowadzone przez Davisa i Mermelsteina w 1980 roku, MFCC są de facto metodą ekstrakcji cech w rozpoznawaniu mowy i analizie dźwięków otoczenia. Kompresują one informację częstotliwościową sygnałów audio do małego zbioru współczynników, które wychwytują treść fonetyczną, jednocześnie odrzucając nieistotne szczegóły.
Przeczytaj pełny opis metody
Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.
Method map
The neighbourhood of related methods — select a node to explore.
Źródła
- Davis, S., & Mermelstein, P. (1980). Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(4), 357-366. DOI: 10.1109/TASSP.1980.1163420 ↗
- Young, S. J., Evermann, G., Gales, M. J., et al. (1996). The HTK Book. Cambridge University Engineering Department. link ↗
- Moustakides, G. V., & Rougui, J. A. (2004). Optimal filtering for polynomial signal models. IEEE Transactions on Signal Processing, 52(8), 2219-2230. link ↗
Jak cytować tę stronę
ScholarGate. (2026, June 3). Mel-Frequency Cepstral Coefficients. ScholarGate. https://scholargate.app/pl/applied-physics/mfcc
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- AmbisonicsFizyka stosowana↔ compare
- Funkcja przenoszenia związana z głowąFizyka stosowana↔ compare
- Niezależna Analiza WektorowaFizyka stosowana↔ compare
Cytowana przez
Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →