Machine learningDeep Learning, Sequence Models, State Space Models

Mamba (Modello a Spazio degli Stati)

Mamba è un'architettura di modello sequenziale introdotta da Gu e Dao nel 2023 che raggiunge una complessità lineare mantenendo prestazioni elevate sui compiti di modellazione del linguaggio. Combinando modelli a spazio degli stati con selettività dipendente dall'input, Mamba affronta la complessità quadratica dei transformer preservando la potenza di modellazione.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

Mamba (Modello a Spazio degli Stati)

Modelli di Diffusione La…Autoencoder Mascherati Vision Mamba Vision Transformer Ottimizzazione Diretta d…Kolmogorov-Arnold Networ…N-BEATSx QLoRA Reti Convoluzionali Graf…TimeGPT

Fonti

Gu, A., & Dao, C. (2023). Mamba: Linear-time sequence modeling with selective state spaces. arXiv preprint arXiv:2312.08956. link ↗

Come citare questa pagina

ScholarGate. (2026, June 3). Mamba: Linear-Time Sequence Modeling with Selective State Spaces. ScholarGate. https://scholargate.app/it/deep-learning/mamba