ScholarGate
Trợ lý
Process / pipelineAudio Signal Processing

Mel-Frequency Cepstral Coefficients

Thính giác con người không tuyến tính theo tần số; chúng ta cảm nhận cao độ theo thang logarit và nhạy cảm hơn với các tần số thấp. MFCCs khai thác điều này: thay vì sử dụng thang tần số tuyến tính (Hz), chúng sử dụng thang mel, thang này làm biến dạng tần số để phù hợp với nhận thức của con người. Âm thanh được phân tách theo tần số, chuyển đổi sang thang mel, nén thông qua phép biến đổi logarit và cosine, cho ra khoảng 13 con số nắm bắt 'hình dạng' của phổ. Những con số này tương đối ổn định giữa các người nói và mạnh mẽ trước nhiễu, làm cho chúng lý tưởng cho xử lý giọng nói.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Nguồn tài liệu

  1. Davis, S., & Mermelstein, P. (1980). Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(4), 357-366. DOI: 10.1109/TASSP.1980.1163420
  2. Young, S. J., Evermann, G., Gales, M. J., et al. (1996). The HTK Book. Cambridge University Engineering Department. link
  3. Moustakides, G. V., & Rougui, J. A. (2004). Optimal filtering for polynomial signal models. IEEE Transactions on Signal Processing, 52(8), 2219-2230. link

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Mel-Frequency Cepstral Coefficients. ScholarGate. https://scholargate.app/vi/applied-physics/mfcc

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Được tham chiếu bởi

ScholarGateMFCC (Mel-Frequency Cepstral Coefficients). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/applied-physics/mfcc · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026