Process / pipelineAudio Signal Processing
メル周波数ケプストラム係数(MFCC)
メル周波数ケプストラム係数(MFCC)は、人間の聴覚知覚を模倣した音声特徴量のコンパクトな表現です。1980年にDavisとMermelsteinによって導入されたMFCCは、音声認識および環境音分析における事実上の特徴抽出方法となっています。これらは、音声信号の周波数情報を少数の係数に圧縮し、無関係な詳細を破棄しながら音韻内容を捉えます。
手法の全文を読む
会員限定
ログイン無料アカウントでログインすると、このセクションを読めます。
Method map
The neighbourhood of related methods — select a node to explore.
出典
- Davis, S., & Mermelstein, P. (1980). Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(4), 357-366. DOI: 10.1109/TASSP.1980.1163420 ↗
- Young, S. J., Evermann, G., Gales, M. J., et al. (1996). The HTK Book. Cambridge University Engineering Department. link ↗
- Moustakides, G. V., & Rougui, J. A. (2004). Optimal filtering for polynomial signal models. IEEE Transactions on Signal Processing, 52(8), 2219-2230. link ↗
このページの引用方法
ScholarGate. (2026, June 3). Mel-Frequency Cepstral Coefficients. ScholarGate. https://scholargate.app/ja/applied-physics/mfcc
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
Compare side by side →