Time-MoE: Fundacyjny model szeregów czasowych z architekturą Mixture-of-Experts
Time-MoE to autoregresywny model fundacyjny o skali miliardów parametrów, przeznaczony do uniwersalnego prognozowania szeregów czasowych, wprowadzony przez Shi et al. w 2024 roku i przyjęty na ICLR 2025. Łączy on architekturę transformera typu „tylko dekoder” (decoder-only) z rzadkimi warstwami typu Mixture-of-Experts (MoE) w sieciach feed-forward, co pozwala modelowi skalować się do miliardów parametrów, aktywując jednocześnie tylko niewielki podzbiór sieci eksperckich dla każdego tokenu — drastycznie zwiększając pojemność bez proporcjonalnego wzrostu kosztów obliczeniowych.
Przeczytaj pełny opis metody
Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.
Method map
The neighbourhood of related methods — select a node to explore.
Źródła
- Shi, X., Wang, S., Nie, Y., Li, D., Ye, Z., Wen, Q., & Jin, M. (2024). Time-MoE: Billion-scale time series foundation models with mixture of experts. ICLR 2025. link ↗
Jak cytować tę stronę
ScholarGate. (2026, June 2). Time-MoE (Mixture-of-Experts Time-Series Foundation Model). ScholarGate. https://scholargate.app/pl/deep-learning/time-moe
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Chronos: Tokenizowany model podstawowy do prognozowania szeregów czasowychUczenie głębokie↔ compare
- Mixture of ExpertsUczenie głębokie↔ compare
- TimesFM: Model Fundacyjny Tylko z Dekoderem do Prognozowania Szeregów CzasowychUczenie głębokie↔ compare
Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →