Mamba (model prostora stanja)
Mamba je arhitektura sekvencijskog modela koju su Gu i Dao predstavili 2023. godine, a koja postiže linearnu vremensku složenost uz zadržavanje snažnih performansi na zadacima jezičnog modeliranja. Kombinirajući modele prostora stanja s selektivnošću ovisnom o ulazu, Mamba rješava kvadratnu složenost transformera, istovremeno čuvajući moć modeliranja.
Pročitajte cijelu metodu
Prijavite se besplatnim računom kako biste pročitali ovaj odjeljak.
Karta metoda
Okruženje srodnih metoda — odaberite čvor za istraživanje.
Izvori
- Gu, A., & Dao, C. (2023). Mamba: Linear-time sequence modeling with selective state spaces. arXiv preprint arXiv:2312.08956. link ↗
Kako citirati ovu stranicu
ScholarGate. (2026, June 3). Mamba: Linear-Time Sequence Modeling with Selective State Spaces. ScholarGate. https://scholargate.app/hr/deep-learning/mamba
Koja metoda?
Postavite ovu metodu uz njoj najsrodnije i pročitajte ih jednu uz drugu — knjižnica vam knjige stavlja na stol; izbor je na vama.
- Latent Diffusion ModelsDuboko učenje↔ usporedi
- Masked AutoencodersDuboko učenje↔ usporedi
- Vision MambaDuboko učenje↔ usporedi
- Vision TransformerDuboko učenje↔ usporedi
Citirana u
Uočili ste pogrešku na ovoj stranici? Prijavite je ili predložite ispravak →