ScholarGate
Asisten
Machine learning

Campuran Pakar

Campuran Pakar (MoE) adalah arsitektur jaringan saraf yang jarang (sparse), diperkenalkan oleh Shazeer dan kolega pada tahun 2017 dengan lapisan MoE yang di-gate secara jarang (sparsely-gated), di mana hanya sebagian dari sub-jaringan pakar yang diaktifkan untuk setiap masukan. Seperti yang terlihat pada model seperti Switch Transformer dan Mixtral, MoE menjaga biaya komputasi tetap konstan meskipun jumlah total parameter bertambah.

Buka di MethodMindSegeraVideoSegeraUnduh salindia

Baca metode selengkapnya

Khusus anggota

Masuk dengan akun gratis untuk membaca bagian ini.

Masuk

Peta metode

Lingkup metode terkait — pilih sebuah simpul untuk menjelajah.

Sumber

  1. Shazeer, N. et al. (2017). Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer. ICLR. arXiv:1701.06538 link
  2. Jiang, A.Q. et al. (2024). Mixtral of Experts. arXiv. link

Cara menyitasi halaman ini

ScholarGate. (2026, June 1). Sparsely-Gated Mixture of Experts (MoE). ScholarGate. https://scholargate.app/id/deep-learning/mixture-of-experts

Metode yang mana?

Letakkan metode ini berdampingan dengan kerabat terdekatnya dan baca secara bersisian — pustaka menata bukunya di atas meja; pilihan ada di tangan Anda.

Bandingkan berdampingan

Dirujuk oleh

ScholarGateMixture of Experts (Sparsely-Gated Mixture of Experts (MoE)). Diakses 2026-06-15 dari https://scholargate.app/id/deep-learning/mixture-of-experts · Set data: https://doi.org/10.5281/zenodo.20539026