ScholarGate
Asistente
Machine learningDeep learning / NLP / CV

GAN multimodal

Una GAN multimodal es una red generativa antagónica condicionada —o que aprende conjuntamente a través de— más de una modalidad de datos (p. ej., descripciones textuales, imágenes, audio o datos estructurados). Al fusionar información de múltiples fuentes, el generador puede sintetizar resultados realistas que respetan las restricciones intermodales, permitiendo tareas como la síntesis de texto a imagen, la generación de imagen a audio y la imputación de modalidades conjuntas.

Abrir en MethodMindPróximamenteVídeoPróximamenteDownload slides

Leer el método completo

Solo para miembros

Inicia sesión con una cuenta gratuita para leer esta sección.

Iniciar sesión

Method map

The neighbourhood of related methods — select a node to explore.

Fuentes

  1. Reed, S., Akata, Z., Yan, X., Logeswaran, L., Schiele, B., & Lee, H. (2016). Generative adversarial text to image synthesis. Proceedings of the 33rd International Conference on Machine Learning (ICML), PMLR 48, 1060–1069. link
  2. Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative adversarial nets. Advances in Neural Information Processing Systems (NeurIPS), 27. link

Cómo citar esta página

ScholarGate. (2026, June 3). Multimodal Generative Adversarial Network. ScholarGate. https://scholargate.app/es/deep-learning/multimodal-gan

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citado por

ScholarGateMultimodal GAN (Multimodal Generative Adversarial Network). Recuperado el 2026-06-15 de https://scholargate.app/es/deep-learning/multimodal-gan · Conjunto de datos: https://doi.org/10.5281/zenodo.20539026