Смесь экспертов
Смесь экспертов (Mixture of Experts, MoE) — это разреженная архитектура нейронных сетей, представленная Шейзером и его коллегами в 2017 году с использованием слоя MoE с разреженным гейтингом, в котором для каждого входного сигнала активируется только подмножество экспертных подсетей. Как видно на примерах таких моделей, как Switch Transformer и Mixtral, стоимость вычислений остается постоянной, даже когда растет общее количество параметров.
Читать метод полностью
Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.
Карта метода
Окружение родственных методов — выберите узел, чтобы перейти к нему.
Источники
Как цитировать эту страницу
ScholarGate. (2026, June 1). Sparsely-Gated Mixture of Experts (MoE). ScholarGate. https://scholargate.app/ru/deep-learning/mixture-of-experts
Какой метод?
Поставьте этот метод рядом с ближайшими родственными и прочитайте их бок о бок — библиотека выкладывает книги на стол, а выбор за вами.
- Графовая сеть внимания (Graph Attention Network, GAT)Глубокое обучение↔ сравнить
- Случайный лесМашинное обучение↔ сравнить
- XGBoostМашинное обучение↔ сравнить
Упоминается в
Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →