مامبا (مدل فضای حالت)
مامبا یک معماری مدل توالی است که توسط گو و دائو در سال ۲۰۲۳ معرفی شد و به پیچیدگی خطی دست مییابد و در عین حال عملکرد قوی در وظایف مدلسازی زبان را حفظ میکند. مامبا با ترکیب مدلهای فضای حالت با گزینشپذیری وابسته به ورودی، پیچیدگی درجه دوم ترانسفورمرها را برطرف میکند و در عین حال قدرت مدلسازی را حفظ مینماید.
مطالعهٔ کامل روش
برای خواندن این بخش با حساب رایگان وارد شوید.
Method map
The neighbourhood of related methods — select a node to explore.
منابع
- Gu, A., & Dao, C. (2023). Mamba: Linear-time sequence modeling with selective state spaces. arXiv preprint arXiv:2312.08956. link ↗
نحوهٔ استناد به این صفحه
ScholarGate. (2026, June 3). Mamba: Linear-Time Sequence Modeling with Selective State Spaces. ScholarGate. https://scholargate.app/fa/deep-learning/mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- مدلهای انتشاری نهفتهیادگیری عمیق↔ compare
- خودرمزگذارِ پوشیده (Masked Autoencoders)یادگیری عمیق↔ compare
- ویژن مامبایادگیری عمیق↔ compare
- ترنسفورمر بینایییادگیری عمیق↔ compare
ارجاعشده در
در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →