Mamba (model stavového prostoru)
Mamba je architektura sekvenčního modelu představená Gu a Dao v roce 2023, která dosahuje lineární časové složitosti při zachování vysokého výkonu v úlohách modelování jazyka. Kombinací modelů stavového prostoru se selektivitou závislou na vstupu Mamba řeší kvadratickou složitost transformerů při zachování modelovací síly.
Přečíst celou metodu
Pro přečtení této sekce se přihlaste s bezplatným účtem.
Method map
The neighbourhood of related methods — select a node to explore.
Zdroje
- Gu, A., & Dao, C. (2023). Mamba: Linear-time sequence modeling with selective state spaces. arXiv preprint arXiv:2312.08956. link ↗
Jak citovat tuto stránku
ScholarGate. (2026, June 3). Mamba: Linear-Time Sequence Modeling with Selective State Spaces. ScholarGate. https://scholargate.app/cs/deep-learning/mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Latent Diffusion ModelsHluboké učení↔ compare
- Maskované autoenkodéryHluboké učení↔ compare
- Vision MambaHluboké učení↔ compare
- Vision TransformerHluboké učení↔ compare
Odkazuje sem
Našli jste na této stránce chybu? Nahlaste ji nebo navrhněte opravu →