Machine learningDeep Learning, Sequence Models, State Space Models

Mamba (model przestrzeni stanów)

Mamba to architektura modelu sekwencyjnego wprowadzona przez Gu i Dao w 2023 roku, która osiąga złożoność liniową przy jednoczesnym zachowaniu silnej wydajności w zadaniach modelowania języka. Łącząc modele przestrzeni stanów z selektywnością zależną od wejścia, Mamba rozwiązuje problem kwadratowej złożoności transformatorów, zachowując jednocześnie moc modelowania.

Otwórz w MethodMindWkrótceWideoWkrótceDownload slides

Przeczytaj pełny opis metody

Tylko dla członków

Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.

Zaloguj się

Method map

The neighbourhood of related methods — select a node to explore.

Mamba (model przestrzeni stanów)

Modele dyfuzyjne w przes…Zamaskowane autoenkodery Mamba Wizyjny Vision Transformer Optymalizacja Bezpośredn…Sieci Kołmogorowa-Arnolda N-BEATSx QLoRA Przestrzenno-czasowe sie…TimeGPT

Źródła

Gu, A., & Dao, C. (2023). Mamba: Linear-time sequence modeling with selective state spaces. arXiv preprint arXiv:2312.08956. link ↗

Jak cytować tę stronę

ScholarGate. (2026, June 3). Mamba: Linear-Time Sequence Modeling with Selective State Spaces. ScholarGate. https://scholargate.app/pl/deep-learning/mamba