Mel-Frequency Cepstral Coefficients
Thính giác con người không tuyến tính theo tần số; chúng ta cảm nhận cao độ theo thang logarit và nhạy cảm hơn với các tần số thấp. MFCCs khai thác điều này: thay vì sử dụng thang tần số tuyến tính (Hz), chúng sử dụng thang mel, thang này làm biến dạng tần số để phù hợp với nhận thức của con người. Âm thanh được phân tách theo tần số, chuyển đổi sang thang mel, nén thông qua phép biến đổi logarit và cosine, cho ra khoảng 13 con số nắm bắt 'hình dạng' của phổ. Những con số này tương đối ổn định giữa các người nói và mạnh mẽ trước nhiễu, làm cho chúng lý tưởng cho xử lý giọng nói.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
Nguồn tài liệu
- Davis, S., & Mermelstein, P. (1980). Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(4), 357-366. DOI: 10.1109/TASSP.1980.1163420 ↗
- Young, S. J., Evermann, G., Gales, M. J., et al. (1996). The HTK Book. Cambridge University Engineering Department. link ↗
- Moustakides, G. V., & Rougui, J. A. (2004). Optimal filtering for polynomial signal models. IEEE Transactions on Signal Processing, 52(8), 2219-2230. link ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 3). Mel-Frequency Cepstral Coefficients. ScholarGate. https://scholargate.app/vi/applied-physics/mfcc
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- AmbisonicsVật lý ứng dụng↔ compare
- Hàm truyền liên quan đến đầuVật lý ứng dụng↔ compare
- Phân tích Vector Độc lậpVật lý ứng dụng↔ compare
Được tham chiếu bởi
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →