Campuran Pakar
Campuran Pakar (MoE) ialah seni bina rangkaian saraf jarang, diperkenalkan oleh Shazeer dan rakan-rakannya pada tahun 2017 dengan lapisan MoE yang digerbang secara jarang, di mana hanya subset sub-rangkaian pakar yang diaktifkan untuk setiap input. Seperti yang dilihat dalam model seperti Switch Transformer dan Mixtral, ia mengekalkan kos pengiraan tetap walaupun jumlah parameter meningkat.
Baca kaedah sepenuhnya
Log masuk dengan akaun percuma untuk membaca bahagian ini.
Peta kaedah
Kejiranan kaedah berkaitan — pilih satu nod untuk meneroka.
Sumber
Cara memetik halaman ini
ScholarGate. (2026, June 1). Sparsely-Gated Mixture of Experts (MoE). ScholarGate. https://scholargate.app/ms/deep-learning/mixture-of-experts
Kaedah yang mana?
Letakkan kaedah ini di sebelah kaedah yang paling rapat dengannya dan baca secara bersebelahan — perpustakaan menyusun buku di atas meja; pilihan terletak pada anda.
- Graph Attention NetworkPembelajaran Mendalam↔ banding
- Random ForestPembelajaran Mesin↔ banding
- XGBoostPembelajaran Mesin↔ banding
Dirujuk oleh
Terjumpa masalah pada halaman ini? Laporkan atau cadangkan pembetulan →