Machine learningDeep Learning, Sequence Models, State Space Models

مامبا (مدل فضای حالت)

مامبا یک معماری مدل توالی است که توسط گو و دائو در سال ۲۰۲۳ معرفی شد و به پیچیدگی خطی دست می‌یابد و در عین حال عملکرد قوی در وظایف مدل‌سازی زبان را حفظ می‌کند. مامبا با ترکیب مدل‌های فضای حالت با گزینش‌پذیری وابسته به ورودی، پیچیدگی درجه دوم ترانسفورمرها را برطرف می‌کند و در عین حال قدرت مدل‌سازی را حفظ می‌نماید.

باز کردن در MethodMindبه‌زودیویدیوبه‌زودیDownload slides

مطالعهٔ کامل روش

ویژهٔ اعضا

برای خواندن این بخش با حساب رایگان وارد شوید.

ورود

Method map

The neighbourhood of related methods — select a node to explore.

مامبا (مدل فضای حالت)

مدل‌های انتشاری نهفته خودرمزگذارِ پوشیده (Mask…ویژن مامبا ترنسفورمر بینایی بهینه‌سازی مستقیم ترجیحات شبکه‌های کولموگروف-آرنولد N-BEATSx QLoRA شبکه‌های کانولوشن گرافی…TimeGPT

منابع

Gu, A., & Dao, C. (2023). Mamba: Linear-time sequence modeling with selective state spaces. arXiv preprint arXiv:2312.08956. link ↗

نحوهٔ استناد به این صفحه

ScholarGate. (2026, June 3). Mamba: Linear-Time Sequence Modeling with Selective State Spaces. ScholarGate. https://scholargate.app/fa/deep-learning/mamba