Mamba (Modello a Spazio degli Stati)
Mamba è un'architettura di modello sequenziale introdotta da Gu e Dao nel 2023 che raggiunge una complessità lineare mantenendo prestazioni elevate sui compiti di modellazione del linguaggio. Combinando modelli a spazio degli stati con selettività dipendente dall'input, Mamba affronta la complessità quadratica dei transformer preservando la potenza di modellazione.
Leggi il metodo completo
Accedi con un account gratuito per leggere questa sezione.
Method map
The neighbourhood of related methods — select a node to explore.
Fonti
- Gu, A., & Dao, C. (2023). Mamba: Linear-time sequence modeling with selective state spaces. arXiv preprint arXiv:2312.08956. link ↗
Come citare questa pagina
ScholarGate. (2026, June 3). Mamba: Linear-Time Sequence Modeling with Selective State Spaces. ScholarGate. https://scholargate.app/it/deep-learning/mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Modelli di Diffusione LatenteApprendimento profondo↔ compare
- Autoencoder MascheratiApprendimento profondo↔ compare
- Vision MambaApprendimento profondo↔ compare
- Vision TransformerApprendimento profondo↔ compare
Citato da
Hai notato un problema in questa pagina? Segnalalo o proponi una correzione →