Mamba (model przestrzeni stanów)
Mamba to architektura modelu sekwencyjnego wprowadzona przez Gu i Dao w 2023 roku, która osiąga złożoność liniową przy jednoczesnym zachowaniu silnej wydajności w zadaniach modelowania języka. Łącząc modele przestrzeni stanów z selektywnością zależną od wejścia, Mamba rozwiązuje problem kwadratowej złożoności transformatorów, zachowując jednocześnie moc modelowania.
Przeczytaj pełny opis metody
Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.
Method map
The neighbourhood of related methods — select a node to explore.
Źródła
- Gu, A., & Dao, C. (2023). Mamba: Linear-time sequence modeling with selective state spaces. arXiv preprint arXiv:2312.08956. link ↗
Jak cytować tę stronę
ScholarGate. (2026, June 3). Mamba: Linear-Time Sequence Modeling with Selective State Spaces. ScholarGate. https://scholargate.app/pl/deep-learning/mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Modele dyfuzyjne w przestrzeni utajonejUczenie głębokie↔ compare
- Zamaskowane autoenkoderyUczenie głębokie↔ compare
- Mamba WizyjnyUczenie głębokie↔ compare
- Vision TransformerUczenie głębokie↔ compare
Cytowana przez
Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →