Machine learning

Campuran Pakar

Campuran Pakar (MoE) ialah seni bina rangkaian saraf jarang, diperkenalkan oleh Shazeer dan rakan-rakannya pada tahun 2017 dengan lapisan MoE yang digerbang secara jarang, di mana hanya subset sub-rangkaian pakar yang diaktifkan untuk setiap input. Seperti yang dilihat dalam model seperti Switch Transformer dan Mixtral, ia mengekalkan kos pengiraan tetap walaupun jumlah parameter meningkat.

Buka dalam MethodMindTidak lama lagiVideoTidak lama lagiMuat turun slaid

Baca kaedah sepenuhnya

Ahli sahaja

Log masuk dengan akaun percuma untuk membaca bahagian ini.

Log masuk

Peta kaedah

Kejiranan kaedah berkaitan — pilih satu nod untuk meneroka.

Campuran Pakar

Graph Attention Network Random Forest XGBoost Penyulingan Pengetahuan Longformer / BigBird Autoenkoder Variasi Mult…Pencarian Seni Bina Neur…Time-MoE Pembelajaran Kontrastif…

Sumber

Shazeer, N. et al. (2017). Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer. ICLR. arXiv:1701.06538 link ↗
Jiang, A.Q. et al. (2024). Mixtral of Experts. arXiv. link ↗

Cara memetik halaman ini

ScholarGate. (2026, June 1). Sparsely-Gated Mixture of Experts (MoE). ScholarGate. https://scholargate.app/ms/deep-learning/mixture-of-experts

Kaedah yang mana?

Letakkan kaedah ini di sebelah kaedah yang paling rapat dengannya dan baca secara bersebelahan — perpustakaan menyusun buku di atas meja; pilihan terletak pada anda.

Graph Attention NetworkPembelajaran Mendalam↔ banding
Random ForestPembelajaran Mesin↔ banding
XGBoostPembelajaran Mesin↔ banding

Bandingkan secara bersebelahan →

Dirujuk oleh

Penyulingan Pengetahuan Longformer / BigBird Autoenkoder Variasi Multimodus Pencarian Seni Bina Neural Time-MoE Pembelajaran Kontrastif Visual

Terjumpa masalah pada halaman ini? Laporkan atau cadangkan pembetulan →

Baca kaedah sepenuhnya

Peta kaedah

Sumber

Cara memetik halaman ini

Kaedah berkaitan

Kaedah yang mana?

Dirujuk oleh