Machine learningDeep learning / NLP / CV

Multimodal Generative Adversarial Network

یک GAN استاندارد، مولد را در برابر تمایزدهنده قرار می‌دهد تا نمونه‌های واقع‌گرایانه تولید کند. در تنظیمات چندوجهی، مولد سیگنال‌هایی را از دو یا چند وجه به‌طور همزمان دریافت می‌کند — برای مثال، یک توصیف متنی و یک بردار نویز — و باید تصویری تولید کند که هم با توصیف و هم با توزیع تصویر واقعی مطابقت داشته باشد. تمایزدهنده نیز نه تنها بررسی می‌کند که آیا خروجی واقعی به نظر می‌رسد، بلکه آیا از نظر معنایی با وجه شرطی هم‌تراز است یا خیر. این فشار بین‌وجهی، شبکه را مجبور می‌کند تا یک فضای نمایش مشترک را یاد بگیرد که در آن انواع مختلف داده با هم منسجم می‌شوند.

باز کردن در MethodMindبه‌زودیویدیوبه‌زودیDownload slides

مطالعهٔ کامل روش

ویژهٔ اعضا

برای خواندن این بخش با حساب رایگان وارد شوید.

ورود

Method map

The neighbourhood of related methods — select a node to explore.

منابع

  1. Reed, S., Akata, Z., Yan, X., Logeswaran, L., Schiele, B., & Lee, H. (2016). Generative adversarial text to image synthesis. Proceedings of the 33rd International Conference on Machine Learning (ICML), PMLR 48, 1060–1069. link
  2. Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative adversarial nets. Advances in Neural Information Processing Systems (NeurIPS), 27. link

نحوهٔ استناد به این صفحه

ScholarGate. (2026, June 3). Multimodal Generative Adversarial Network. ScholarGate. https://scholargate.app/fa/deep-learning/multimodal-gan

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

ارجاع‌شده در

ScholarGateMultimodal GAN (Multimodal Generative Adversarial Network). بازیابی‌شده در 2026-06-15 از https://scholargate.app/fa/deep-learning/multimodal-gan · مجموعه‌داده: https://doi.org/10.5281/zenodo.20539026