Campuran Pakar
Campuran Pakar (MoE) adalah arsitektur jaringan saraf yang jarang (sparse), diperkenalkan oleh Shazeer dan kolega pada tahun 2017 dengan lapisan MoE yang di-gate secara jarang (sparsely-gated), di mana hanya sebagian dari sub-jaringan pakar yang diaktifkan untuk setiap masukan. Seperti yang terlihat pada model seperti Switch Transformer dan Mixtral, MoE menjaga biaya komputasi tetap konstan meskipun jumlah total parameter bertambah.
Baca metode selengkapnya
Masuk dengan akun gratis untuk membaca bagian ini.
Peta metode
Lingkup metode terkait — pilih sebuah simpul untuk menjelajah.
Sumber
Cara menyitasi halaman ini
ScholarGate. (2026, June 1). Sparsely-Gated Mixture of Experts (MoE). ScholarGate. https://scholargate.app/id/deep-learning/mixture-of-experts
Metode yang mana?
Letakkan metode ini berdampingan dengan kerabat terdekatnya dan baca secara bersisian — pustaka menata bukunya di atas meja; pilihan ada di tangan Anda.
- Jaringan Perhatian GrafPembelajaran Mendalam↔ bandingkan
- Random ForestPembelajaran Mesin↔ bandingkan
- XGBoostPembelajaran Mesin↔ bandingkan
Dirujuk oleh
Menemukan masalah di halaman ini? Laporkan atau usulkan perbaikan →