เปรียบเทียบวิธี
ดูวิธีที่เลือกเทียบกันแบบเคียงข้าง แถวที่ต่างกันจะถูกเน้นไว้
| การเข้ารหัสเชิงเส้นพยากรณ์× | มาตราส่วนบาร์กและมาตราส่วนเมล× | |
|---|---|---|
| สาขาวิชา | สวนศาสตร์ | สวนศาสตร์ |
| ตระกูล | Process / pipeline | Process / pipeline |
| ปีกำเนิด≠ | 1975 | 1937 |
| ผู้ริเริ่ม≠ | Freddy Burg, John Makhoul | Eberhard Zwicker, Stanley Smith Stevens |
| ประเภท≠ | Predictive speech coding and analysis | Perceptual frequency mapping |
| แหล่งต้นตำรับ≠ | Makhoul, J. (1975). Linear prediction: A tutorial review. Proceedings of the IEEE, 63(4), 561–580. DOI ↗ | Zwicker, E. (1961). Subdivision of the audible frequency range into critical bands. Journal of the Acoustical Society of America, 33(2), 248–248. link ↗ |
| ชื่อเรียกอื่น | LPC, autoregressive model, speech prediction, vocal tract modeling | bark scale, mel scale, critical bandwidth, perceptual frequency |
| ที่เกี่ยวข้อง | 5 | 5 |
| สรุป≠ | Linear Predictive Coding (LPC) is a powerful signal processing technique for modeling and compressing speech by assuming each speech sample can be predicted from a linear combination of previous samples. Pioneered by Burg and Makhoul in the 1970s, LPC is the foundation of speech codecs, speech synthesis, speaker recognition, and speech enhancement. LPC exploits the time-correlated structure of speech to achieve high compression ratios and enable efficient parameter extraction. | Bark and Mel scales are perceptual frequency scales that map physical frequency (Hz) to perceived pitch and auditory perception. Formalized by Zwicker (Bark, 1961) and Stevens (Mel, 1937), these non-linear scales reflect how the human ear processes sound. Bark scale divides hearing into 24 critical bands; Mel scale models pitch perception. Both are essential for audio feature extraction, speech processing, and designing audio systems that align with human hearing. |
| ScholarGateชุดข้อมูล ↗ |
|
|