Machine learning

Смесь экспертов

Смесь экспертов (Mixture of Experts, MoE) — это разреженная архитектура нейронных сетей, представленная Шейзером и его коллегами в 2017 году с использованием слоя MoE с разреженным гейтингом, в котором для каждого входного сигнала активируется только подмножество экспертных подсетей. Как видно на примерах таких моделей, как Switch Transformer и Mixtral, стоимость вычислений остается постоянной, даже когда растет общее количество параметров.

Открыть в MethodMindСкороВидеоСкороСкачать слайды

Читать метод полностью

Только для участников

Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.

Войти

Карта метода

Окружение родственных методов — выберите узел, чтобы перейти к нему.

Смесь экспертов

Графовая сеть внимания (…Случайный лес XGBoost Дистилляция знаний Longformer / BigBird Мультимодальный вариацио…Нейросетевой поиск архит…Time-MoE: базовая модель…Визуальное контрастивное…

Источники

Shazeer, N. et al. (2017). Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer. ICLR. arXiv:1701.06538 link ↗
Jiang, A.Q. et al. (2024). Mixtral of Experts. arXiv. link ↗

Как цитировать эту страницу

ScholarGate. (2026, June 1). Sparsely-Gated Mixture of Experts (MoE). ScholarGate. https://scholargate.app/ru/deep-learning/mixture-of-experts

Какой метод?

Поставьте этот метод рядом с ближайшими родственными и прочитайте их бок о бок — библиотека выкладывает книги на стол, а выбор за вами.

Графовая сеть внимания (Graph Attention Network, GAT)Глубокое обучение↔ сравнить
Случайный лесМашинное обучение↔ сравнить
XGBoostМашинное обучение↔ сравнить

Сравнить рядом →

Упоминается в

Дистилляция знаний Longformer / BigBird Мультимодальный вариационный автокодировщик Нейросетевой поиск архитектур Time-MoE: базовая модель для временных рядов на основе Mixture-of-Experts Визуальное контрастивное обучение

Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →

Читать метод полностью

Карта метода

Источники

Как цитировать эту страницу

Связанные методы

Какой метод?

Упоминается в