ScholarGate
Assistente
Machine learningDeep learning / NLP / CV

Multimodal GAN

Una Multimodal GAN è una rete generativa avversaria condizionata su — o che apprende congiuntamente attraverso — più di una modalità di dati (ad es., descrizioni testuali, immagini, audio o dati strutturati). Fondendo informazioni da più sorgenti, il generatore può sintetizzare output realistici che rispettano vincoli cross-modali, abilitando compiti quali la sintesi text-to-image, la generazione image-to-audio e l'imputazione multimodale congiunta.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

Fonti

  1. Reed, S., Akata, Z., Yan, X., Logeswaran, L., Schiele, B., & Lee, H. (2016). Generative adversarial text to image synthesis. Proceedings of the 33rd International Conference on Machine Learning (ICML), PMLR 48, 1060–1069. link
  2. Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative adversarial nets. Advances in Neural Information Processing Systems (NeurIPS), 27. link

Come citare questa pagina

ScholarGate. (2026, June 3). Multimodal Generative Adversarial Network. ScholarGate. https://scholargate.app/it/deep-learning/multimodal-gan

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citato da

ScholarGateMultimodal GAN (Multimodal Generative Adversarial Network). Consultato il 2026-06-15 da https://scholargate.app/it/deep-learning/multimodal-gan · Insieme di dati: https://doi.org/10.5281/zenodo.20539026