MFCC (Mel-frekvens Cepstrale Koeffisienter)
Mel-frekvens cepstrale koeffisienter (MFCC-er) er en kompakt representasjon av lydtrekk som etterligner menneskelig hørselsoppfatning. Introdusert av Davis og Mermelstein i 1980, er MFCC-er de facto-metoden for trekkutvinning for talegjenkjenning og analyse av miljølyder. De komprimerer frekvensinformasjonen i lydsignaler til et lite sett med koeffisienter som fanger fonetisk innhold, samtidig som de forkaster irrelevant detaljer.
Les hele metoden
Logg inn med en gratis konto for å lese denne delen.
Metodekart
Nabolaget av beslektede metoder — velg en node for å utforske.
Kilder
- Davis, S., & Mermelstein, P. (1980). Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(4), 357-366. DOI: 10.1109/TASSP.1980.1163420 ↗
- Young, S. J., Evermann, G., Gales, M. J., et al. (1996). The HTK Book. Cambridge University Engineering Department. link ↗
- Moustakides, G. V., & Rougui, J. A. (2004). Optimal filtering for polynomial signal models. IEEE Transactions on Signal Processing, 52(8), 2219-2230. link ↗
Slik siterer du denne siden
ScholarGate. (2026, June 3). Mel-Frequency Cepstral Coefficients. ScholarGate. https://scholargate.app/no/applied-physics/mfcc
Hvilken metode?
Sett denne metoden ved siden av sin nærmeste slektning og les dem side om side — biblioteket legger bøkene på bordet; valget er ditt.
- AmbisonicsAnvendt fysikk↔ sammenlign
- Head-Related Transfer FunctionAnvendt fysikk↔ sammenlign
- Uavhengig VektanalyseAnvendt fysikk↔ sammenlign
Referert av
Funnet en feil på denne siden? Rapporter eller foreslå en rettelse →