ScholarGate
助手
Machine learningSource separation and demixing

人声分离

人声分离是指从混合音乐录音中分离出歌唱人声,保留器乐伴奏的任务。该任务由 Han 等人 (2012) 正式提出,对于音乐编辑、混音、卡拉OK生成和音乐分析至关重要。现代深度学习方法 (Défossez et al., 2021) 已实现令人印象深刻的质量,并在音乐制作和流媒体服务中实现了实际应用。人声分离是声源分离的一个特例,其目标是分离出感知上最显著的声源。

在 MethodMind 中打开即将推出Apply, compare, get guidance
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

阅读完整方法

仅限会员

使用免费账户登录即可阅读本节。

登录

方法图谱

相关方法的邻域——选择一个节点以展开探索。

来源

  1. Han, Y., Qin, Z., & Kang, Z. (2012). Singing voice separation using spectral floor filtered spectrograms. In Proceedings of the International Society for Music Information Retrieval Conference. link
  2. Huang, P. S., Kim, M., Hasegawa-Johnson, M., & Smaragdis, P. (2015). Joint optimization of masks and deep recurrent neural networks for monaural source separation. IEEE Transactions on Audio, Speech, and Language Processing, 23(12), 2136-2147. DOI: 10.1109/taslp.2015.2468583
  3. Défossez, A., Usunier, N., Bottou, L., & Bach, F. (2021). Music source separation in the waveform domain. In International Conference on Learning Representations. link

如何引用本页

ScholarGate. (2026, June 3). Vocal Separation and Source Separation Algorithm. ScholarGate. https://scholargate.app/zh/music-information-retrieval/vocal-separation

选用哪种方法?

将本方法与其最相近的同类并置,并排研读——本馆将书籍铺陈于案上,取舍则由您定夺。

并排比较

被引用于

ScholarGateVocal Separation (Vocal Separation and Source Separation Algorithm). 于 2026-06-17 检索自 https://scholargate.app/zh/music-information-retrieval/vocal-separation · 数据集: https://doi.org/10.5281/zenodo.20539026