Machine learning

Campuran Pakar

Campuran Pakar (MoE) adalah arsitektur jaringan saraf yang jarang (sparse), diperkenalkan oleh Shazeer dan kolega pada tahun 2017 dengan lapisan MoE yang di-gate secara jarang (sparsely-gated), di mana hanya sebagian dari sub-jaringan pakar yang diaktifkan untuk setiap masukan. Seperti yang terlihat pada model seperti Switch Transformer dan Mixtral, MoE menjaga biaya komputasi tetap konstan meskipun jumlah total parameter bertambah.

Buka di MethodMindSegeraVideoSegeraUnduh salindia

Baca metode selengkapnya

Khusus anggota

Masuk dengan akun gratis untuk membaca bagian ini.

Masuk

Peta metode

Lingkup metode terkait — pilih sebuah simpul untuk menjelajah.

Campuran Pakar

Jaringan Perhatian Graf Random Forest XGBoost Distilasi Pengetahuan Longformer / BigBird Variational Autoencoder…Pencarian Arsitektur Neu…Time-MoE: Model Dasar Fo…Pembelajaran Kontrastif…

Sumber

Shazeer, N. et al. (2017). Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer. ICLR. arXiv:1701.06538 link ↗
Jiang, A.Q. et al. (2024). Mixtral of Experts. arXiv. link ↗

Cara menyitasi halaman ini

ScholarGate. (2026, June 1). Sparsely-Gated Mixture of Experts (MoE). ScholarGate. https://scholargate.app/id/deep-learning/mixture-of-experts

Metode yang mana?

Letakkan metode ini berdampingan dengan kerabat terdekatnya dan baca secara bersisian — pustaka menata bukunya di atas meja; pilihan ada di tangan Anda.

Jaringan Perhatian GrafPembelajaran Mendalam↔ bandingkan
Random ForestPembelajaran Mesin↔ bandingkan
XGBoostPembelajaran Mesin↔ bandingkan

Bandingkan berdampingan →

Dirujuk oleh

Distilasi Pengetahuan Longformer / BigBird Variational Autoencoder Multimodal Pencarian Arsitektur Neural Time-MoE: Model Dasar Fondasi Deret Waktu Campuran Pakar Pembelajaran Kontrastif Visual

Menemukan masalah di halaman ini? Laporkan atau usulkan perbaikan →

Baca metode selengkapnya

Peta metode

Sumber

Cara menyitasi halaman ini

Metode terkait

Metode yang mana?

Dirujuk oleh