ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Multimodale GAN

Een multimodale GAN is een generatief adversarieel netwerk dat geconditioneerd is op — of gezamenlijk leert over — meer dan één datamodaliteit (bijv. tekstbeschrijvingen, afbeeldingen, audio of gestructureerde gegevens). Door informatie uit meerdere bronnen te fuseren, kan de generator realistische uitvoer synthetiseren die rekening houdt met cross-modale beperkingen, wat taken mogelijk maakt zoals tekst-naar-beeld-synthese, beeld-naar-audio-generatie en joint modality imputation.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Log in met een gratis account om dit onderdeel te lezen.

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Bronnen

  1. Reed, S., Akata, Z., Yan, X., Logeswaran, L., Schiele, B., & Lee, H. (2016). Generative adversarial text to image synthesis. Proceedings of the 33rd International Conference on Machine Learning (ICML), PMLR 48, 1060–1069. link
  2. Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative adversarial nets. Advances in Neural Information Processing Systems (NeurIPS), 27. link

Deze pagina citeren

ScholarGate. (2026, June 3). Multimodal Generative Adversarial Network. ScholarGate. https://scholargate.app/nl/deep-learning/multimodal-gan

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Geciteerd door

ScholarGateMultimodal GAN (Multimodal Generative Adversarial Network). Geraadpleegd op 2026-06-15 via https://scholargate.app/nl/deep-learning/multimodal-gan · Gegevensset: https://doi.org/10.5281/zenodo.20539026