Multimodal Generative Adversarial Network
یک GAN استاندارد، مولد را در برابر تمایزدهنده قرار میدهد تا نمونههای واقعگرایانه تولید کند. در تنظیمات چندوجهی، مولد سیگنالهایی را از دو یا چند وجه بهطور همزمان دریافت میکند — برای مثال، یک توصیف متنی و یک بردار نویز — و باید تصویری تولید کند که هم با توصیف و هم با توزیع تصویر واقعی مطابقت داشته باشد. تمایزدهنده نیز نه تنها بررسی میکند که آیا خروجی واقعی به نظر میرسد، بلکه آیا از نظر معنایی با وجه شرطی همتراز است یا خیر. این فشار بینوجهی، شبکه را مجبور میکند تا یک فضای نمایش مشترک را یاد بگیرد که در آن انواع مختلف داده با هم منسجم میشوند.
مطالعهٔ کامل روش
برای خواندن این بخش با حساب رایگان وارد شوید.
Method map
The neighbourhood of related methods — select a node to explore.
منابع
- Reed, S., Akata, Z., Yan, X., Logeswaran, L., Schiele, B., & Lee, H. (2016). Generative adversarial text to image synthesis. Proceedings of the 33rd International Conference on Machine Learning (ICML), PMLR 48, 1060–1069. link ↗
- Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative adversarial nets. Advances in Neural Information Processing Systems (NeurIPS), 27. link ↗
نحوهٔ استناد به این صفحه
ScholarGate. (2026, June 3). Multimodal Generative Adversarial Network. ScholarGate. https://scholargate.app/fa/deep-learning/multimodal-gan
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- شبکه مولد تخاصمییادگیری عمیق↔ compare
- مدل انتشار چندوجهی (Multimodal Diffusion Model)یادگیری عمیق↔ compare
- ترانسفورمر چندوجهییادگیری عمیق↔ compare
- خودرمزگذار متغیر چندوجهییادگیری عمیق↔ compare
ارجاعشده در
در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →