ScholarGate
助手
Machine learning

专家混合模型

专家混合模型(Mixture of Experts, MoE)是一种稀疏神经网络架构,由Shazeer及其同事于2017年通过稀疏门控MoE层首次提出。在该架构中,每个输入仅激活一部分专家子网络。如Switch Transformer和Mixtral等模型所示,MoE可以在总参数量增长的情况下保持计算成本固定。

在 MethodMind 中打开即将推出Apply, compare, get guidance
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

阅读完整方法

仅限会员

使用免费账户登录即可阅读本节。

登录

方法图谱

相关方法的邻域——选择一个节点以展开探索。

来源

  1. Shazeer, N. et al. (2017). Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer. ICLR. arXiv:1701.06538 link
  2. Jiang, A.Q. et al. (2024). Mixtral of Experts. arXiv. link

如何引用本页

ScholarGate. (2026, June 1). Sparsely-Gated Mixture of Experts (MoE). ScholarGate. https://scholargate.app/zh/deep-learning/mixture-of-experts

选用哪种方法?

将本方法与其最相近的同类并置,并排研读——本馆将书籍铺陈于案上,取舍则由您定夺。

并排比较

被引用于

ScholarGateMixture of Experts (Sparsely-Gated Mixture of Experts (MoE)). 于 2026-06-15 检索自 https://scholargate.app/zh/deep-learning/mixture-of-experts · 数据集: https://doi.org/10.5281/zenodo.20539026