Mamba (model prostora stanja)
Mamba je arhitektura sekvencijskog modela koju su Gu i Dao predstavili 2023. godine, a koja postiže linearnu vremensku složenost uz zadržavanje snažnih performansi na zadacima jezičnog modeliranja. Kombinirajući modele prostora stanja s selektivnošću ovisnom o ulazu, Mamba rješava kvadratnu složenost transformera, istovremeno čuvajući moć modeliranja.
Pročitajte cijelu metodu
Prijavite se besplatnim računom kako biste pročitali ovaj odjeljak.
Method map
The neighbourhood of related methods — select a node to explore.
Izvori
- Gu, A., & Dao, C. (2023). Mamba: Linear-time sequence modeling with selective state spaces. arXiv preprint arXiv:2312.08956. link ↗
Kako citirati ovu stranicu
ScholarGate. (2026, June 3). Mamba: Linear-Time Sequence Modeling with Selective State Spaces. ScholarGate. https://scholargate.app/hr/deep-learning/mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Latent Diffusion ModelsDuboko učenje↔ compare
- Masked AutoencodersDuboko učenje↔ compare
- Vision MambaDuboko učenje↔ compare
- Vision TransformerDuboko učenje↔ compare
Citirana u
Uočili ste pogrešku na ovoj stranici? Prijavite je ili predložite ispravak →